新方法帮助机器人导航使用语言基输入而不是昂贵的视觉数据
2024-06-18 11:09来源:盖世汽车作者: 杜玉梅 阅读量:5711
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
盖世汽车讯 有一天,人们可能希望自己的家用机器人把一大堆脏衣服搬到楼下,并把它们放进地下室最左边角落的洗衣机。机器人需要将指令与它的视觉观察结合起来,以确定它应该采取什么步骤来完成这项任务。
对于人工智能本体来说,这说起来容易做起来难。当前方法通常使用多个人工创建的机器学习模型来处理各部分任务,基于大量的人力和专业知识而构建。这些方法通过视觉表征(visual representation)来直接做出导航决策,需要大量的视觉数据来进行训练,而这些数据通常很难获得。
据外媒报道,为了克服这些挑战,麻省理工学院和MIT-IBM Watson AI实验室的研究人员设计了一种导航方法,将视觉表征转换为语言片段,然后将其输入大语言模型中,该模型可以实现多步导航任务中的所有部分。

最近内容
发挥地名文化价值和名片作用广西推动美丽乡村有名有实
2024-06-18 11:09
205km续航版12.99万起东风风神L7上市即交付
2024-06-18 11:09
响应旧换新政策,朗逸新锐出众版直降2万元
2024-06-18 11:09
星途揽月VS传祺GS8:安全之巅,谁领风骚?
2024-06-18 11:09
GfK中国联合上海市眼镜行业协会举办高层论坛:探索眼
2024-06-18 11:09
超舒适智能6座SUV—零跑C16将走向全球
2024-06-18 11:09
能“坦克掉头”?方程豹豹3官方谍照,或搭310kW电
2024-06-18 11:09
上海市小学生爱心暑托班来了,690个点位今天公布,下
2024-06-18 11:09
价格屠夫出击,零跑C16,豪华品质颠覆汽车市场
2024-06-18 11:09