Boston Dynamics推出ChatGpt與Spot結合品, “AI+機器人”趨勢獲得新突破!

Boston Dynamics推出ChatGpt与Spot结合品, “AI+机器人”趋势获得新突破!

發布日期:

科技 Tech


要点:
波士顿动力/Boston Dynamics在官网展示了一项新的研究,通过将ChatGPT、Spot 以及其他AI 模型相结合,开发了一种会说话的“导游机器狗”。在多个测试过程中,导游机器狗甚至被发现具备简单的“自我决策”能力。 AI与机器人的结合,提供了一种在现实世界中落地大型基础模型的绝佳方式,无法预测未来会怎样。但很明显,人工智能的快速发展有可能彻底改变我们生活的许多方面。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

2023年10月27日,全球顶级机器人开发商波士顿动力/Boston Dynamics在官网展示了一项新的研究,通过将ChatGPT、Spot以及其他AI模型相结合,开发了一种会说话的“导游机器狗” 。据相关视频显示,该导游机器狗能够根据文字、语音提示与人类进行交谈,同时提供了视觉问答功能,甚至可以分析摄像头拍摄的画面,自动生成图像说明。

波士顿动力表示,ChatGPT等大语言模型/LLM展现出了强大的控制和输出能力,可以用于控制物理机器人的行为和决策功能。例如,输入一些特定景点数据、图片等,可让机器人提供逻辑清晰、条理分明的导游功能。此外,还增强了物理机器人的拟人化能力,比如为你讲一个冷笑话、做一个逗你开心的滑稽动作等等。如果釆用传统的方法,这或许是一件非常困难的事情,而现在都却成为“轻而易举”的现实。

导游机器狗工作原理<br>波士顿动力使用了自研的四足机器人Spot作为物理机器人框架,实现了行走、监控、导航、扫描等基础功能。

为了能让导游机器狗说话与人类互动,研发人员为其配备了3D打印的Respeaker V2扬声器,这是一个带有LED的环形阵列麦克风,可通过USB将其连接到Spot的EAP 2实现数据传输。

1) Spot EAP 2) 扬声器3) 蓝牙音箱4) 点臂和夹具相机

使用一台电脑作为导游机器狗的控制大脑,并通过Spot SDK与其实现数据交互。为了让机器狗具备拟人化动作,例如点头,伸脖子等,均使用了Spot的点臂和夹具相机。此外,物理硬件环境搭建完成后,为了使导游机器狗具备对话功能,研发人员使用了GPT-3.5和GPT-4与Spot SDK相结合,并进行了简单的指令微调,让导游机器狗具备了初级导游判断和对话功能。

随后,为了让Spot与人类和环境进行交互,集成了VQA和语音转文本软件。同时将机器人的抓手摄像头和前置机身摄像头输入BLIP-2,并以视觉问答模式或图像字幕模式运行它。该过程大约每秒运行一次,结果将直接输入到提示中。同时,为了让导游机器狗可以实现“听”的功能,研发人员将麦克风数据分块输入到OpenAI的语音模型Whisper中转换为英文文本。此外,为了让导游机器狗能与人类实现对话,需要将人类的语音指令转换成文本用于提示ChatGPT,因此还需要一个转换工具。开发人员在尝试了多种工具后,决定使用了云服务ElevenLabs。

在多个测试过程中发现令人惊奇的现象,导游机器狗好像具备简单的“自我决策”能力<br>向导游机器狗询问Marc Raibert(波士顿动力执行董事)是谁时?它回答“我不知道他是谁,让我们去服务台问一问吧。”到了服务台,导游机器狗继续向服务人员询问Marc Raibert是谁?当研发人员提问:你的父母是谁?导游机器狗走向了Spot V1和Big Dog的展示区,并认为这些机器人是它的父辈们。实际上,它们之间确实有关联。另外,导游机器狗还展现出了有趣的一面,可以主动向路人询问,周围是否有神秘的生物。

波士顿动力表示,未来还会持续优化该产品的功能。该团队为Spot提供了一个“非常简短的脚本”。机器人将该脚本与从其抓手和身体上的摄影机获取的图像结合起来,使其能够在生成响应之前获得有关所看到内容的更多资讯。据该公司称,Spot使用视觉问答模型来为图像添加字幕并回答有关图像的问题。

虽然,波士顿动力公司没有详细说明导游机器狗的未来计划是什么。但它确实指出,它的机器人和人工智能AI非常匹配,所以也许我们将来会看到更多这样的事情。该公司似乎不会很快推出这个附加组件,目前Spot的价格仍然昂贵,约为75,000美元。尽管波士顿动力公司没有透露它将用更先进的Spot做什么,但ChatGPT与实体机器人的相结合,为大语言模型实现物理化落地打开了大门,可以在导游、娱乐、物流、陪伴等领域得到广泛应用。

“AI+机器人”的快速发展
在过去的一两年里,人工智能,特别是“生成式人工智能”领域的进步迅速。自2022年底问世以来,这款由OpenAI推出的聊天机器人程序“ChatGPT”迅速引起全球范围的高度关注,它的爆火掀起了新一轮生成式人工智能/AIGC热潮。和以往类似的聊天机器人相比,ChatGPT的智能化程度大幅提升,帮助人们更轻松地与计算机进行交互和沟通。机器翻译,摘要截取,以及情感分析等功能加成,使ChatGPT具备像真人一般的语言理解能力,甚至在效率上强于人类。 ChatGPT的诞生无疑是AI时代的重要里程碑,也预示着新一轮人工智能技术革命正在加速来袭。

而AI与机器人的结合,更是提供了一种在现实世界中落地大型基础模型的绝佳方式<br data-mce-fragment="1">从今年年初火爆起来的ChatGPT、到ChatGPT与人形机器人的突破,再到如今能实现AI与机器人“对话”,可见发展速度之快,甚至快于大众对其想象。值得注意的是,这些模型可以帮助提供文化背景、一般常识知识和灵活性,这对于许多机器人任务来说都是有用的。例如,仅仅通过与机器人交谈就可以将任务分配给机器人,这将有助于减少学习量使用这些系统的曲线。

随着日益复杂的技术的兴起,自动化和机械化的普及已成为现代社会的标志。而在此过程,也曾有不少人担心,工作岗位是否在未来会被AI 取替?狂呼媒体曾发布一文“ AI人工智能对就业市场和未来经济的影响? ”,已经“预示”了体力劳动者在AI出现后,他们的可替代性甚至不比智力劳动者少。如今,导游机器狗的出现,更是说明了这一点。

目前,机器人的主要用途在于能够提高仓库和工厂等环境的效率,成为了人们对自动化程度提高所导致的就业机会稀缺的合理担忧。虽然自动化确实正在取代许多低技能工作,但它导致劳动力向其他部门重新分配,这种现象称为“劳动力流失”。但与此同时,自动化在重复性、体力密集工作方面的优势使工人有机会重新调整自己的技能并寻求更具刺激性的工作。

事实证明,机器人总体上有助于完成以前需要大量投入的任务和工作。它们具有以多种方式改善我们生活品质的巨大潜力。但同时,由于潜在的恶意以及与安全和隐私相关的其他担忧,关于允许机器人技术扩展的道德仍然存在争议。这种担忧通常与人工智慧的使用有关,但当机器人拥有没有情感的认知时,就没有理由担心了。人工智能是一个快速发展的领域,无法预测未来会怎样。但很明显,人工智能的快速发展有可能彻底改变我们生活的许多方面,而每个方面的趋势都值得持续我们持续关注。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • Plaud Note AI | 播客Podcast

    Plaud Note AI | 播客Podcast

    Plaud Note AI 技术:Plaud APP 整合先进的转录功能,支援112 种语言的快速准确转录。 AI 摘要功能基于GPT-5、Claude 4.0、o3-mini 和Gemini 2.5 Pro(Beta 版)开发,使用者可以建立摘要、会议记录和待办事项列表,从而提高日常工作效率。

    Plaud Note AI | 播客Podcast

    Plaud Note AI 技术:Plaud APP 整合先进的转录功能,支援112 种语言的快速准确转录。 AI 摘要功能基于GPT-5、Claude 4.0、o3-mini 和Gemini 2.5 Pro(Beta 版)开发,使用者可以建立摘要、会议记录和待办事项列表,从而提高日常工作效率。

  • Costco財報反映了美國中產的狀況

    Costco財報反映了美國中產的狀況

    雖然近幾個季度 Costco 的客單價(剔除匯率和油氣)並沒有明顯向上的趨勢,但似乎仍是體現出了消費者因價格走高,轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長,以及偏弱的續費了也都有體現。

    Costco財報反映了美國中產的狀況

    雖然近幾個季度 Costco 的客單價(剔除匯率和油氣)並沒有明顯向上的趨勢,但似乎仍是體現出了消費者因價格走高,轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長,以及偏弱的續費了也都有體現。

  • AI桌面寵物ROPET | 播客Podcast

    AI桌面宠物ROPET | 播客Podcast

    ROPET作为“桌面宠物”诞生,目标用户是25-40岁的女性。今年1月,ROPET在海外众筹网站上正式发行,在欧美国家售卖了1400台,目前正陆续交付;在日本、韩国和港台地区也已售出8000台左右。

    AI桌面宠物ROPET | 播客Podcast

    ROPET作为“桌面宠物”诞生,目标用户是25-40岁的女性。今年1月,ROPET在海外众筹网站上正式发行,在欧美国家售卖了1400台,目前正陆续交付;在日本、韩国和港台地区也已售出8000台左右。

  • NIO自4月低位股價翻倍,蔚來真能「重生」 嗎?

    NIO自4月低位股价翻倍,蔚来真能「重生」 吗?

    蔚来之后的爆品周期还能持续吗?这个问题是蔚来最为重要的问题。因为对大多数车企来看,真正大级别的机会都是产品、技术和组织等等问题梳理清楚之后,用一个新平台来推动一个较长时间的新车周期,新周期不是靠单一一款车的爆量,而是新平台下矩阵式的车型爆量。

    NIO自4月低位股价翻倍,蔚来真能「重生」 吗?

    蔚来之后的爆品周期还能持续吗?这个问题是蔚来最为重要的问题。因为对大多数车企来看,真正大级别的机会都是产品、技术和组织等等问题梳理清楚之后,用一个新平台来推动一个较长时间的新车周期,新周期不是靠单一一款车的爆量,而是新平台下矩阵式的车型爆量。

  • 美股、 港股及A股處於調整,調整後將再創高峰 | 視頻Video

    美股、 港股及A股处于调整,调整后将再创高峰 | 视频Video

    就业市场转弱,金融系统里面的流动性过剩几乎接近用尽,美联署9月份FOMC 应该减息,但市场可能很大程度上已反映减息一码(0.25%),FedWatch 显示机会率90% ,只减一码,未必有力再升,甚至到跌。

    美股、 港股及A股处于调整,调整后将再创高峰 | 视频Video

    就业市场转弱,金融系统里面的流动性过剩几乎接近用尽,美联署9月份FOMC 应该减息,但市场可能很大程度上已反映减息一码(0.25%),FedWatch 显示机会率90% ,只减一码,未必有力再升,甚至到跌。

  • 以色列科技創新,中國能學到什麼?硬科技VC的十年復盤 | 播客Podcast

    以色列科技创新,中国能学到什么?硬科技VC的十年复盘| 播客Podcast

    对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业,经过大浪淘沙,在整个中国VC行业经历巨大转变之际,仍然活在牌桌上。其中,既有硬科技领域的扎实累积、方​​法论,也能看出,他们充分利用了中国市场和人才。

    以色列科技创新,中国能学到什么?硬科技VC的十年复盘| 播客Podcast

    对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业,经过大浪淘沙,在整个中国VC行业经历巨大转变之际,仍然活在牌桌上。其中,既有硬科技领域的扎实累积、方​​法论,也能看出,他们充分利用了中国市场和人才。

  • LULU財報營收不及市場預期,表現讓人失望!

    LULU财报营收不及市场预期,表现让人失望!

    整体上,不达预期的二季度业绩加上再次下修的全年指引,使得公司盘后估计再次暴跌15% 以上,核心还是在于无论是本季度的业绩,还是公司对未来的指引,非但没有成长性的边际好转反而还在恶化,没季财报噩耗连珠,因此只能继续杀估值。

    LULU财报营收不及市场预期,表现让人失望!

    整体上,不达预期的二季度业绩加上再次下修的全年指引,使得公司盘后估计再次暴跌15% 以上,核心还是在于无论是本季度的业绩,还是公司对未来的指引,非但没有成长性的边际好转反而还在恶化,没季财报噩耗连珠,因此只能继续杀估值。

  • 對話前OpenAI科學家:GPT-5能獲得奧賽金牌,但那可能具有欺騙性? | 播客Podcast

    对话前OpenAI科学家:GPT-5能获得奥赛金牌,但那可能具有欺骗性? | 播客Podcast

    对话OpenAI 的两位前科学家:Kenneth Stanley和Joel Lehman;他们曾亲历前ChatGPT 时代的OpenAI,也是《为什么伟大不能被计划》一书的作者。 2023 年,这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

    对话前OpenAI科学家:GPT-5能获得奥赛金牌,但那可能具有欺骗性? | 播客Podcast

    对话OpenAI 的两位前科学家:Kenneth Stanley和Joel Lehman;他们曾亲历前ChatGPT 时代的OpenAI,也是《为什么伟大不能被计划》一书的作者。 2023 年,这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4