要點:
谷歌表示,今天在Bard聊天機器人中推出的Gemini是其有史以來最強大的人工智能AI模型。它接受了影片、圖像等方面的訓練。迄今為止,Google一直在努力吸引與OpenAI的ChatGPT一樣多的關注和用戶。但隨著科技的迅速發展,人們對人工智能AI潛在危害的擔憂也在增加。即使人工智能模型能夠將越來越複雜的提示轉換為複雜的回應,但我們仍然需要謹慎,不能完全相信它們僅僅提供看似合理而非實際正確的答案。
科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。
狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。
狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。
聯系我們 // 相關文章
注意據12月8日最新消息:
在短短24小時內,大眾最初對Google Gemini AI平台推出的熱情已經消退,取而代之的是對其Gemini實踐影片的爭議。Google發布的Gemini,據稱是迄今為止最強大的人工智能AI模型套件,但目前已經被指控對其“性能撒謊”。
六分鐘的影片展示了Gemini的多模式功能(例如,語音對話提示與影像辨識結合)。Gemini似乎可以快速識別影像,即使是連點連線的圖片,也能在幾秒鐘內做出回應,並即時追蹤杯賽和球類比賽中的一疊紙。但點擊YouTube上的這條影片卻出現一個Google重要的免責聲明:“出於本演示的目的,延遲已減少,並且為了簡潔起見,Gemini輸出也已縮短。”
Google對外承認,視頻演示並不是通過語音提示實時進行的,而是使用原始素材中的靜態圖像幀,然後寫出Gemini做出回應的文本提示。這一做法令不少專家認為,這與Google暗示的超強大人工智能AI工具完全不同,Google對外宣稱,當Gemini觀察周圍的世界並即時做出反應時,一個人可以與Gemini進行流暢的語音對話。而事實上,並不是如此。
此外,Google類似的做法已經不是第一次。Google早前的Duplex演示(一種人工智能語音助手,可以打電話給美髮店和餐廳進行預訂),也被質疑是預先錄製的人工智能AI模型影片,明顯缺乏環境噪音和真實員工的反應。而現在對於Gemini的“性能撒謊”,又引起了大眾對其的質疑。不少專家認為,在這種情況下,Google是在“炫耀”,目的是誤導人們,讓他們忽視Gemini仍然落後於OpenAI的GPT的事實。但Gemini仍然是Google向前邁出的一大步,因為它希望與人工智慧先驅者ChatGPT保持同步,只是這可能不像最初想的如此大突破而已。
2023年12月6日原文:
在過去的十年中,Google一直是人工智能領域的領先巨頭企業。目前,Google正迅速擴展其在人工智能AI領域的地位。儘管OpenAI的ChatGPT已經成為全球矚目的現象,也是有史以來增長最快的消費產品之一,但截至今天,Bard已擁有來自170個國家/地區的英語用戶。
今天,Google推出新的人工智能AI模型“Gemini”,據稱該模型在多個方面甚至超越了OpenAI的技術水平,具有先進的“推理能力”,甚至在應對困難問題時表現得“更為深思熟慮”。
Gemini強大生成AI模式
Gemini代表了人工智能領域的一次巨大轉變。雖然基於文字的聊天至關重要,但在我們身處不斷變化的三維世界中,人類需要處理包括語言和圖像等更豐富的信息,而不僅僅是簡單的文字。因此,Gemini成為了一種備受矚目的新嘗試。
據Google表示,Gemini有三個版本,針對不同的運算能力等級
Gemini Nano運行在手機上,有兩個版本供應不同級別的可用記憶體使用。它將支持Google Pixel 8手機上的新功能,例如在Recorder應用程式中總結對話,或在使用Google Gboard輸入的WhatsApp中回覆消息。
Gemini Pro專為快速響應而設計,在Google資料中心運行,將從週三開始為新版本的Bard提供支援。
Gemini Ultra目前僅限於測試小組,預計將於2024年初在新的Bard Advanced聊天機器人中提供。雖然Google拒絕透露定價細節,但預計這項頂級功能將需要支付額外的費用。
Google Bard和Assistant的主管對外表示,Gemini是Bard至今最大、最優越的一次升級。Google執行長桑達爾·皮查伊/Sundar Pichai也分享道,“我相信Gemini可以更好地理解使用者的意圖,也能夠以更真實、更高品質的方式作出回應。”
目前,Bard雖然只是一個聊天機器人:你輸入文字,它回應文字。然而明年,Google計劃推出由Gemini Ultra提供支援的“Bard Advanced”預覽版,這將是Google新的大型語言模型中最強大且功能最豐富的版本。此外,Gemini Ultra也是該模型的多模式版本,這意味著除了文字之外,它還能夠處理和生成圖像、音訊和視訊。
Google DeepMind的主管Demis Hassabis表示,非文字互動是Gemini的一大亮點。“我們從一開始就設計它成為原生多模式,這是它的新功能之一,能夠無縫整合和進行跨模式推理。”之前,Gemini已經通過解決數學和人文等57個學科領域的問題,展示了其問題解決能力和知識水平。
Gemini具有跨足文字、圖像、音訊、視訊和程式碼的推理能力。此外,它還能夠參與使用者的互動,執行創建遊戲、解決視覺謎題、建立連結、生成圖像與文本、進行邏輯與空間推理、進行視覺翻譯、理解文化等具有創意性的任務。以下一段示範影片展示了Gemini在辨識藍色鴨子、手偶、戲法等任務時表現出來的強大理解能力、想象能力和創造力。
Sundar Pichai強調,Gemini的推出標誌著人工智能的“新時代”。Gemini具備辨識和生成文字、圖像以及音訊的能力,但值得注意的是,Gemini本身並非一個獨立的產品。相反,它是一個基礎模型,這意味著它將被融合進Google現有的工具中,包括搜尋和Bard。
人工智能競賽火熱進行
Google的新版本凸顯了生成式人工智能領域的迅速進展,這使得聊天機器人能夠根據我們以簡單語言而非複雜程式指令編寫的提示來生成自己的回應。
值得注意的是,谷歌的主要競爭對手OpenAI在一年前推出了ChatGPT,搶占了先機,但谷歌已經進行了三次重大的人工智能模型修訂,期望通過數十億用戶使用的產品(如搜索、Chrome、谷歌文檔)來推廣這一技術,甚至包括Gmail。Gartner分析師Chirag Dekate指出,Gemini似乎設立了一個“新標準”,強調其具備從文字以外的來源學習的能力。他表示,這可能引發生成式人工智能領域的創新變革。
迄今為止,Google一直在努力吸引與OpenAI的ChatGPT一樣多的關注和用戶。與此同時,OpenAI的更強大軟體新版本將於明年發布。最近OpenAI的動盪,Altman在幾天之內被解僱又重新受聘,這是否會對這一次的發布產生任何影響還有待觀察。此外,Google還面臨來自Elon Musk的xAI的新競爭,該公司近日正尋求籌集最多10億美元進行研發投資。在中國,百度公司也正在推出自己的人工智能產品。面對來自不同國家和地區的“直面競爭”,Gemini面臨著機遇的同時,也面臨著對應的挑戰。
隨著科技的迅速發展,人們對人工智能AI潛在危害的擔憂也在增加。世界各國政府正在努力製定規則甚至立法來遏制人工智慧未來可能出現的風險。早在今年11月,英國峰會上討論了該主題,簽署方同意了一項呼籲其安全開發的聲明。此外,英國還表示,需要以緊迫感、團結和集體力量來應對人工智能可能帶來的危險。
人工智能變得更聰明但並不完美
隨著多媒體的崛起,人工智能AI可能帶來顯著的變革。即使人工智能模型能夠將越來越複雜的提示轉換為複雜的回應,但我們仍然需要謹慎,不能完全相信它們僅僅提供看似合理而非實際正確的答案。正如Google的聊天機器人在使用時所警告的那樣,“Bard可能會呈現不準確的信息,包括有關個人的信息,因此請仔細檢查其回復的答案。”
Gemini代表了Google大型語言模型的下一代,是PaLM和PaLM 2的延續,這兩者迄今為止一直是Bard的基礎。然而,透過同時訓練Gemini處理文字、程式碼、圖像、音訊和視頻,它能夠更有效地應對多媒體輸入,相較於使用單獨但相互關聯的人工智能模型對每種輸入模式進行訓練。
根據Google的一項研究報告,Gemini展現了卓越的綜合能力。當面對一系列由三角形、正方形和五邊形組成的形狀時,Gemini能夠準確猜測該系列中的下一個形狀是六邊形。在呈現月球和一隻手拿著高爾夫球的照片,要求找到連結時,Gemini正確指出阿波羅太空人於1971年在月球上擊中了兩個高爾夫球。此外,該研究還呈現了Gemini處理手寫物理問題的過程,包括一個簡單的草圖,找出學生的錯誤,並解釋糾正方法。
但目前,Gemini Ultra正在等待進一步的測試才能在明年上市
Gemini Ultra目前正積極進行“紅隊合作”,製造商正在招募人員尋找安全漏洞和其他潛在問題。在涉及多媒體輸入數據的情況下,這種測試變得更加複雜。舉例來說,簡訊和照片單獨看可能是無害的,但一旦組合在一起,可能傳達出完全不同的含義。
Sundar Pichai向外宣稱:“我們正在以大膽而負責任的態度進行這項工作。” 這不僅代表著雄心勃勃的研究與巨大的潛在回報相結合,同時也顯示出Google增加保障措施、與政府和其他機構合作以應對不斷增強的人工智能風險的承諾。
至於該技術在解決問題能力方面,Google宣稱Gemini特別擅長數學和物理。這讓對人工智能樂觀派燃起了希望,認為它可能會帶來科學突破,改善人類的生活。但對人工智能發展持悲觀看法的一派,則擔心該技術最終會超越人類智能,導致數以百萬計的工作流失,甚至可能產生更具破壞性的行為,例如放大錯誤訊息,或甚至觸發核武戰爭。
隨著人工智能AI的迅猛發展,具備強大AI技能的人才將在未來擔擔更多職責,不僅限於傳統的技術性工作,還包括具有高度創意性的工作任務。AI的崛起不僅為自動化提供了更多可能性,也在業務領域中引入了更多的智慧和革新。這種變革將促使人們重新思考和定位自己在這個新時代的角色。
對於一般大眾而言,AI的蓬勃發展也將為普通人提供更多機會找到自己的定位。隨著AI自動化日益普及,人們將更多地投身於具有高度人文性和創意性的工作,這些領域往往需要人類的情感、直覺和藝術創造力。這種趨勢將推動社會實現更大程度的多元化,使每個個體都能夠發揮其獨特的才華,融入AI時代的脈動。
因此,AI的普及並非僅僅是技術革新,更是一場引領人類重新定義工作與生活的革命。人們將面對更多的選擇,從而找到更符合自身興趣和天賦的工作方向。這種變革帶來的機會和挑戰將推動著整個社會向更加智慧和包容的方向發展,促使每個人都能在這個AI時代中找到屬於自己的清晰定位。