Boston Dynamics推出ChatGpt與Spot結合品, “AI+機器人”趨勢獲得新突破!

Boston Dynamics推出ChatGpt與Spot結合品, “AI+機器人”趨勢獲得新突破!

發布日期:

科技 Tech


要點:
波士頓動力/Boston Dynamics在官網展示了一項新的研究,通過將ChatGPT、Spot 以及其他AI 模型相結合,開發了一種會說話的“導游機器狗”。在多個測試過程中,導遊機器狗甚至被發現具備簡單的“自我決策”能力。AI與機器人的結合,提供了一種在現實世界中落地大型基礎模型的絕佳方式,無法預測未來會怎樣。但很明顯,人工智能的快速發展有可能徹底改變我們生活的許多方面。

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 // 相關文章

2023年10月27日,全球頂級機器人開發商波士頓動力/Boston Dynamics在官網展示了一項新的研究,通過將ChatGPT、Spot以及其他AI模型相結合,開發了一種會說話的“導游機器狗”。據相關視頻顯示,該導游機器狗能夠根據文字、語音提示與人類進行交談,同時提供了視覺問答功能,甚至可以分析攝像頭拍攝的畫面,自動生成圖像說明。

波士頓動力表示,ChatGPT等大語言模型/LLM展現出了強大的控制和輸出能力,可以用於控制物理機器人的行為和決策功能。例如,輸入一些特定景點數據、圖片等,可讓機器人提供邏輯清晰、條理分明的導游功能。此外,還增強了物理機器人的擬人化能力,比如為你講一個冷笑話、做一個逗你開心的滑稽動作等等。如果釆用傳統的方法,這或許是一件非常困難的事情,而現在都卻成為“輕而易舉”的現實。

導游機器狗工作原理
波士頓動力使用了自研的四足機器人Spot作為物理機器人框架,實現了行走、監控、導航、掃描等基礎功能。

為了能讓導游機器狗說話與人類互動,研發人員為其配備了3D打印的Respeaker V2揚聲器,這是一個帶有LED的環形陣列麥克風,可通過USB將其連接到Spot的EAP 2實現數據傳輸。

1) Spot EAP 2) 揚聲器 3) 藍牙音箱 4) 點臂和夾具相機

使用一台電腦作為導游機器狗的控制大腦,并通過Spot SDK與其實現數據交互。為了讓機器狗具備擬人化動作,例如點頭,伸脖子等,均使用了Spot的點臂和夾具相機。此外,物理硬件環境搭建完成后,為了使導游機器狗具備對話功能,研發人員使用了GPT-3.5和GPT-4與Spot SDK相結合,并進行了簡單的指令微調,讓導游機器狗具備了初級導游判斷和對話功能。

隨後,為了讓Spot與人類和環境進行交互,集成了VQA和語音轉文本軟件。同時將機器人的抓手攝像頭和前置機身攝像頭輸入BLIP-2,并以視覺問答模式或圖像字幕模式運行它。該過程大約每秒運行一次,結果將直接輸入到提示中。同時,為了讓導游機器狗可以實現“聽”的功能,研發人員將麥克風數據分塊輸入到OpenAI的語音模型Whisper中轉換為英文文本。此外,為了讓導游機器狗能與人類實現對話,需要將人類的語音指令轉換成文本用於提示ChatGPT,因此還需要一個轉換工具。開發人員在嘗試了多種工具后,決定使用了云服務ElevenLabs。

在多個測試過程中發現令人驚奇的現象,導遊機器狗好像具備簡單的“自我決策”能力
向導游機器狗詢問Marc Raibert(波士頓動力執行董事)是誰時?它回答“我不知道他是誰,讓我們去服務台問一問吧。”到了服務台,導游機器狗繼續向服務人員詢問Marc Raibert是誰?當研發人員提問:你的父母是誰?導游機器狗走向了Spot V1和Big Dog的展示區,并認為這些機器人是它的父輩們。實際上,它們之間確實有關聯。另外,導游機器狗還展現出了有趣的一面,可以主動向路人詢問,周圍是否有神秘的生物。

波士頓動力表示,未來還會持續優化該產品的功能。該團隊為Spot提供了一個“非常簡短的腳本”。機器人將該腳本與從其抓手和身體上的攝影機獲取的圖像結合起來,使其能夠在生成響應之前獲得有關所看到內容的更多資訊。據該公司稱,Spot使用視覺問答模型來為圖像添加字幕並回答有關圖像的問題。

雖然,波士頓動力公司沒有詳細說明導遊機器狗的未來計劃是什麼。但它確實指出,它的機器人和人工智能AI非常匹配,所以也許我們將來會看到更多這樣的事情。該公司似乎不會很快推出這個附加組件,目前Spot的價格仍然昂貴,約為75,000美元。儘管波士頓動力公司沒有透露它將用更先進的Spot做什麼,但ChatGPT與實體機器人的相結合,為大語言模型實現物理化落地打開了大門,可以在導游、娛樂、物流、陪伴等領域得到廣泛應用。

“AI+機器人”的快速發展
在過去的一兩年裡,人工智能,特別是“生成式人工智能”領域的進步迅速。自2022年底問世以來,這款由OpenAI推出的聊天機器人程序“ChatGPT”迅速引起全球范圍的高度關注,它的爆火掀起了新一輪生成式人工智能/AIGC熱潮。和以往類似的聊天機器人相比,ChatGPT的智能化程度大幅提升,幫助人們更輕松地與計算機進行交互和溝通。機器翻譯,摘要截取,以及情感分析等功能加成,使ChatGPT具備像真人一般的語言理解能力,甚至在效率上強於人類。ChatGPT的誕生無疑是AI時代的重要里程碑,也預示着新一輪人工智能技朮革命正在加速來襲。

而AI與機器人的結合,更是提供了一種在現實世界中落地大型基礎模型的絕佳方式
從今年年初火爆起來的ChatGPT、到ChatGPT與人形機器人的突破,再到如今能實現AI與機器人“對話”,可見發展速度之快,甚至快於大眾對其想象。值得註意的是,這些模型可以幫助提供文化背景、一般常識知識和靈活性,這對於許多機器人任務來說都是有用的。例如,僅僅通過與機器人交談就可以將任務分配給機器人,這將有助於減少學習量使用這些系統的曲線。

隨著日益複雜的技術的興起,自動化和機械化的普及已成為現代社會的標誌。而在此過程,也曾有不少人擔心,工作崗位是否在未來會被AI 取替?狂呼媒體曾發佈一文“AI人工智能對就業市場和未來經濟的影響?”,已經“預示”了體力勞動者在AI出現後,他們的可替代性甚至不比智力勞動者少。如今,導遊機器狗的出現,更是說明了這一點。

目前,機器人的主要用途在於能夠提高倉庫和工廠等環境的效率,成為了人們對自動化程度提高所導致的就業機會稀缺的合理擔憂。雖然自動化確實正在取代許多低技能工作,但它導致勞動力向其他部門重新分配,這種現象稱為“勞動力流失”。但與此同時,自動化在重複性、體力密集工作方面的優勢使工人有機會重新調整自己的技能並尋求更具刺激性的工作。

事實證明,機器人總體上有助於完成以前需要大量投入的任務和工作。它們具有以多種方式改善我們生活品質的巨大潛力。但同時,由於潛在的惡意以及與安全和隱私相關的其他擔憂,關於允許機器人技術擴展的道德仍然存在爭議。這種擔憂通常與人工智慧的使用有關,但當機器人擁有沒有情感的認知時,就沒有理由擔心了。人工智能是一個快速發展的領域,無法預測未來會怎樣。但很明顯,人工智能的快速發展有可能徹底改變我們生活的許多方面,而每個方面的趨勢都值得持續我們持續關注。

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 // 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回網誌
  • BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亞迪的業績仍然不及預期。收入雖超預期,但主要由於非核心的比亞迪電子業務高增帶來,而在核心的賣車業務上,賣車單價仍處於下行軌道,賣車成本降幅不夠,最後賣車毛利率雖有回暖,但仍低於市場預期。

    BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亞迪的業績仍然不及預期。收入雖超預期,但主要由於非核心的比亞迪電子業務高增帶來,而在核心的賣車業務上,賣車單價仍處於下行軌道,賣車成本降幅不夠,最後賣車毛利率雖有回暖,但仍低於市場預期。

  • GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    消息一出,華爾街一度陷入恐慌:如果 AI 突然間不再需要那麼多 RAM 就能運作,這是否意味著記憶體產業的「超級週期」即將結束?答案是否定的。事實上,從歷史規律與經濟學角度來看,情況正好相反。要理解這一點,我們只需要觀察你電腦上的網頁瀏覽器。

    GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    消息一出,華爾街一度陷入恐慌:如果 AI 突然間不再需要那麼多 RAM 就能運作,這是否意味著記憶體產業的「超級週期」即將結束?答案是否定的。事實上,從歷史規律與經濟學角度來看,情況正好相反。要理解這一點,我們只需要觀察你電腦上的網頁瀏覽器。

  • BABA財報AI投入比較激進

    BABA財報AI投入比較激進

    BABA發布第四季財報後股價下跌,財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%,而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資(總額超過530億美元)有效性的擔憂。

    BABA財報AI投入比較激進

    BABA發布第四季財報後股價下跌,財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%,而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資(總額超過530億美元)有效性的擔憂。

  • MU美光業績,季度毛利率達到 74.4%!

    MU美光業績,季度毛利率達到 74.4%!

    MU 整體業績:美光本季度營收 238.6 億美元,環比增長 75%,好於上調後的買方預期(199 億美元),本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動,兩大業務環增都在 70% 以上。

    MU美光業績,季度毛利率達到 74.4%!

    MU 整體業績:美光本季度營收 238.6 億美元,環比增長 75%,好於上調後的買方預期(199 億美元),本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動,兩大業務環增都在 70% 以上。

  • Tencent騰訊業績整體看無驚無喜?

    Tencent騰訊業績整體看無驚無喜?

    騰訊一口氣連發多個 “龍蝦” 產品,能夠看出公司在元寶春節大戰中失利後的焦慮,雖然倉促推出產品還不夠完善。不過這個緊迫感的轉變很關鍵也很必要。就目前來看,微信入口似乎在 AI 原生應用盛行的當下仍然有無法撼動的地位。

    Tencent騰訊業績整體看無驚無喜?

    騰訊一口氣連發多個 “龍蝦” 產品,能夠看出公司在元寶春節大戰中失利後的焦慮,雖然倉促推出產品還不夠完善。不過這個緊迫感的轉變很關鍵也很必要。就目前來看,微信入口似乎在 AI 原生應用盛行的當下仍然有無法撼動的地位。

  • LULU財報對2026年的指引仍然保守

    LULU財報對2026年的指引仍然保守

    LULU 預期增長 2%-4%。從指引上看,經歷了 2025 年的降速,公司對 2026 年的指引仍然保守,説明 2026 年對於 Lululemon 來説仍然是艱難轉型的一年。

    LULU財報對2026年的指引仍然保守

    LULU 預期增長 2%-4%。從指引上看,經歷了 2025 年的降速,公司對 2026 年的指引仍然保守,説明 2026 年對於 Lululemon 來説仍然是艱難轉型的一年。

  • ORCL業績整體表現算是中性,功過相抵。

    ORCL業績整體表現算是中性,功過相抵。

    ORCL 甲骨文剔除 OCI 業務 -- 即 IaaS 雲業務外,剩下的所有傳統業務都已完全沒有成長性,長期營收增速都只徘徊在零上下、好也不過個位數增長。且在當下,和其他軟件公司一樣,這部分傳統業務也存在被 AI 顛覆的風險。

    ORCL業績整體表現算是中性,功過相抵。

    ORCL 甲骨文剔除 OCI 業務 -- 即 IaaS 雲業務外,剩下的所有傳統業務都已完全沒有成長性,長期營收增速都只徘徊在零上下、好也不過個位數增長。且在當下,和其他軟件公司一樣,這部分傳統業務也存在被 AI 顛覆的風險。

  • Nvidia開源AI代理平台NemoClaw重新定義企業級人工智慧代理!

    Nvidia開源AI代理平台NemoClaw重新定義企業級人工智慧代理!

    NemoClaw 是 NVIDIA 即將推出的開源 AI 代理平台,旨在為企業提供安全、可控且高效的 AI 代理部署環境。它與 NVIDIA NeMo 框架和 NIM(NVIDIA 推理微服務)深度集成,使企業能夠在嚴格遵守資料治理的同時,充分利用 GPU 加速的 AI 代理功能。

    Nvidia開源AI代理平台NemoClaw重新定義企業級人工智慧代理!

    NemoClaw 是 NVIDIA 即將推出的開源 AI 代理平台,旨在為企業提供安全、可控且高效的 AI 代理部署環境。它與 NVIDIA NeMo 框架和 NIM(NVIDIA 推理微服務)深度集成,使企業能夠在嚴格遵守資料治理的同時,充分利用 GPU 加速的 AI 代理功能。

1 / 8
  • Sharpa機器人削蘋果

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

  • 腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

  • 新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

  • “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

1 / 4