简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 给机器人配AI大脑!谷歌发布视觉语言行动模型

给机器人配AI大脑!谷歌发布视觉语言行动模型

文章来源: 全天候科技 于 2023-07-28 19:41:25 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数

谷歌正在把先进的人工智能(AI)模型植入机器人,给机器人配一个 AI 大脑。

美东时间 7 月 28 日周五,谷歌公司宣布推出应用于机器人领域的新产品——名为 Robotics Transformer 2(RT-2)的 AI 模型。它是一种全新的 " 视觉 - 语言 - 行动 "(VLA)模型,可以帮助训练机器人理解扔垃圾等任务。

谷歌介绍,RT-2 基于 Transformer 模型,根据互联网上的文本和图像进行训练,直接指示机器人执行动作。就像用语言模型通过网络文本训练 AI 学习人类社会的思想和概念一样,RT-2 也可以通过网络数据,将相关知识告知机器人,指导机器人的行为。

谷歌举例称,如果我们要让以前的机器人系统做出扔垃圾的动作,就必须明确训练机器人懂得区分何为垃圾,以及捡起垃圾、扔掉它这些动作。而 RT-2 能将网上的相关知识传给机器人,让机器人无需明确的训练,就懂得垃圾是什么,甚至即便从未受过如何扔垃圾的训练,也知道怎么扔垃圾。

谷歌表示,RT-2 具有将信息转化动作的能力,借助它,机器人有望更快适应全新的情形和环境。

因为在 6000 多次测试 RT-2 模型的机器人试验后,谷歌的团队发现,面对训练数据中已有的任务、或者说 " 见过 " 的任务,RT-2 和它的前代 RT-1 一样发挥功能,没有差别。而在新颖的、之前从未见过的任务情形中,RT-2 的性能几乎提高一倍,成功率达到 62%,远超 RT-1 的 32%。

换句话说,通过 RT-2,机器人能像人类一样学习更多内容,将学到的概念应用于全新的情境中。

谷歌称,RT-2 显示出超越其所接触机器人数据的推广应用能力和语义、视觉理解能力,包括解释新的命令,并通过基本的推理响应用户的指令,比如关于物体的类别和高层次描述的推理。

谷歌的研究还表明,通过结合思维链的推理,RT-2 能执行多阶段的语义推理,比如判断哪种物体可以临时用作锤子,哪一类饮料最适合疲劳的人。

有媒体周五称,谷歌目前没有立即计划大规模发布或者出售应用 RT-2 的机器人,但最终,这些机器人可能用在仓库或者用作家庭助理。

  • 功效卓著,回头客众多!美国专利【骨精华】消除关节痛//骨质疏松;【心血通+益脑灵】强心护脑。
查看评论(0)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

84岁知名鞋企创始人与儿子儿断绝关系:不能让美国人接班
美国对马杜罗动手后,这个美国高官“火”了
多地机场赴美航班取消 华人被赶下机 职员:看新闻吧
住在云端,困在深谷:买超高楼层的业主进退两难
瑞士爆炸40人亡!死者身分全数厘清,半数以上是青少年




24小时讨论排行

BBC:特朗普抓捕马杜罗可能为全球威权国家树立先例
美曝中共犯台美军将“斩习” 胡振东:恐真是五角大楼放话
网红柬埔寨断脚流浪 被救食粥 父哭诉:怎接她回来
川普公布120国移民领福利数据 这几国位居榜首
当美国越过这条线,特朗普为习近平开辟了先例?
网友关注习特使:立大功后消失了 或仍困在委国?
美媒:鲁比奥将出任委内瑞拉总督
北京重押委内瑞拉600亿美元 恐沦最大输家
郑永年:川普洗牌拉美,世界秩序加速解体
台湾有1神器 可让解放军无法“斩首”台湾总统
马杜罗疑被内鬼出卖 哥伦比亚总统:亲美军官将撤职
一次世界新秩序宣言,普京和习近平都看懂了
"国师"李毅为何崩溃自搧巴掌?被群嘲的还有她…
赢马杜洛3百万票!委内瑞拉流亡领袖宣布"我才是总统"
问“为什么, 凭什么抓捕马杜罗?”的人,看这里
川普放话拿下格陵兰,丹麦总理反击:停止威胁盟友
文学城新闻
切换到网页版

给机器人配AI大脑!谷歌发布视觉语言行动模型

全天候科技 2023-07-28 19:41:25

谷歌正在把先进的人工智能(AI)模型植入机器人,给机器人配一个 AI 大脑。

美东时间 7 月 28 日周五,谷歌公司宣布推出应用于机器人领域的新产品——名为 Robotics Transformer 2(RT-2)的 AI 模型。它是一种全新的 " 视觉 - 语言 - 行动 "(VLA)模型,可以帮助训练机器人理解扔垃圾等任务。

谷歌介绍,RT-2 基于 Transformer 模型,根据互联网上的文本和图像进行训练,直接指示机器人执行动作。就像用语言模型通过网络文本训练 AI 学习人类社会的思想和概念一样,RT-2 也可以通过网络数据,将相关知识告知机器人,指导机器人的行为。

谷歌举例称,如果我们要让以前的机器人系统做出扔垃圾的动作,就必须明确训练机器人懂得区分何为垃圾,以及捡起垃圾、扔掉它这些动作。而 RT-2 能将网上的相关知识传给机器人,让机器人无需明确的训练,就懂得垃圾是什么,甚至即便从未受过如何扔垃圾的训练,也知道怎么扔垃圾。

谷歌表示,RT-2 具有将信息转化动作的能力,借助它,机器人有望更快适应全新的情形和环境。

因为在 6000 多次测试 RT-2 模型的机器人试验后,谷歌的团队发现,面对训练数据中已有的任务、或者说 " 见过 " 的任务,RT-2 和它的前代 RT-1 一样发挥功能,没有差别。而在新颖的、之前从未见过的任务情形中,RT-2 的性能几乎提高一倍,成功率达到 62%,远超 RT-1 的 32%。

换句话说,通过 RT-2,机器人能像人类一样学习更多内容,将学到的概念应用于全新的情境中。

谷歌称,RT-2 显示出超越其所接触机器人数据的推广应用能力和语义、视觉理解能力,包括解释新的命令,并通过基本的推理响应用户的指令,比如关于物体的类别和高层次描述的推理。

谷歌的研究还表明,通过结合思维链的推理,RT-2 能执行多阶段的语义推理,比如判断哪种物体可以临时用作锤子,哪一类饮料最适合疲劳的人。

有媒体周五称,谷歌目前没有立即计划大规模发布或者出售应用 RT-2 的机器人,但最终,这些机器人可能用在仓库或者用作家庭助理。