要點:
人工智能/AI的子集正在以驚人的速度增長,并且已經完成了許多原本只有人類才能勝任的任務。Google DeepMind宣布推出Alpha家族的新成員AlphaDev,這是一種利用強化學習來改進計算機科學算法的人工智能系統,其發現了一種速度更快的排序算法,被譽為打破了十年來的算法“封印”,成為使用人工智能優化代碼的重要里程碑。
科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。
狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。
狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。
聯系我們 // 相關文章
DeepMind Technologies背景
人工智能/AI的子集正在以驚人的速度增長,并且已經完成了許多原本只有人類才能勝任的任務。例如,像機器學習這樣的技朮可以執行管理任務、人臉識別、下棋,甚至翻譯語言。毫無疑問,過去十年人工智能領域取得了巨大的發展。此外,深度學習通過從非結搆化數據中學習,能夠生成分析報告或執行無人監督任務。所有這些進展都為不同的公司發揮作用,并證明了它們的價值。
DeepMind Technologies於2010年在倫敦成立,但四年后被Google收購。2015年,它的所有權再次發生變化,被Alphabet公司收購,此后成為其子公司。自成立以來,DeepMind Technologies在美國、加拿大和法國設立了研究中心。自從2016年 AlphaGo 戰勝世界圍棋冠軍李世石后,它開始得到許多人的認可。此外,他們還開發了另一個名為AlphaZero的程序,可以下國際象棋、日本象棋,并取得了最佳成績。
除了眾所周知的AlphaGo產品,DeepMind 保持着持續的高產節奏。2017年,AlphaGo的最新版本AlphaGo Zero,在自我訓練3天后以100比0的成績戰勝了AlphaGo。2018年推出的AlphaFold成功預測了98.5%的人類蛋白質結搆,對醫學和生物學產生了深遠影響。2022年發布的基於Transformer的新模型AlphaCode實現了大規模代碼生成。2022年發布的AI智能體 “Gato” 邁進了通用人工智能的一步。
DeepMind的AI AlphaFold顯示蛋白質結構的圖片
DeepMind在通用學習算法方面非常有趣,它不僅可以改善這一領域,還將幫助人們更好地理解人類大腦。該公司已經開始通過開發能夠玩各種不同游戲的系統來實現這一目標。其中一位創始人提到,他們相信,當一個程序可以玩各種不同的游戲時,就可以達到人類水平的人工智能。他們的策略得到科學研究的支持,這些科學研究證明,像象棋這樣的游戲可以提高戰略思維能力。通過學習如何玩這些復雜的游戲,機器將獲得思考和釆取戰略行動的能力。
DeepMind的通用學習算法讓機器可以通過游戲化學習,試圖獲得類似人類的智力和行為。盡管該公司對實現人類智能的機器學習非常感興趣,但它對使用這些技朮的安全性也有客觀的看法。為了避免機器災難,DeepMind開發了一個開源測試平台,以確定算法在存在不良行為時是否具有終止開關。這個開源測試平台稱為GridWorld,它可以確保AI對自身、開發人員和其他接觸到它的人都是安全無害的。DeepMind通過實現一個完全不同的技朮系統,將深度學習提升到了一個全新的水平。該系統稱為深度強化學習,與常規的人工智能系統不同,它是完全獨立的。
DeepMind的深度強化學習不是預先編程的,而是像人類一樣通過經驗學習。從本質上講,它基於卷積神經網絡進行深度學習,并將其與Q-learning相結合。隨后,他們的系統在各種電子游戲上進行了測試,而無需編寫關於如何玩這個游戲的指令。每件事都由系統獨立完成,它學習如何玩電子游戲,經過多次嘗試,其玩法比任何人都要好。這個系統已經玩過各種游戲,并且比最擅長玩游戲的人掌握得還要好。
谷歌在嘗試使用MuZero、AlphaZero和 AlphaDev去優化計算機生態系統
人工智能AI算法每天都變得越來越複雜,每個算法都旨在以最佳方式解決問題。谷歌正在努力創建對世界具有廣泛理解的AI工具,以便可以在許多不同類型的任務之間傳遞有用的知識。
基於強化學習,谷歌AI模型AlphaZero和MuZero已經取得了超人的表現贏得比賽。現在,他們正在擴展自己的能力,以幫助優化數據中心和視頻壓縮。最近,谷歌的AlphaZero專用版本,稱為 AlphaDev發現了新算法,這些算法已經在我們數字社會的基礎上加速了軟件的發展。
雖然這些工具在整個計算生態系統中創造了效率飛躍,但早期結果顯示了更多通用人工智能工具的變革潛力。以下,我們將解釋這些進步如何塑造計算的未來,以及如何幫助數十億人和地球。
優化數據中心資源
數據中心管理從提供搜索結果到處理數據集的一切事務。Borg 管理著 Google 的數十億個任務,分配這些工作負載就像玩多維俄羅斯方塊遊戲。該系統有助於優化內部基礎設施服務、面向用戶的產品,如Google Workspace和搜索的任務,並管理批處理。
Borg使用手動編碼的規則來安排任務來管理此工作負載。在谷歌規模上,這些手動編碼的規則無法考慮不斷變化的工作負載分佈的多樣性,因此它們被設計為“最適合所有人的一種尺寸”。這就是像AlphaZero這樣的機器學習技術特別有用的地方:這些算法能夠自動創建單獨的最佳定制規則,這些規則對於各種工作負載分配更有效。
在人工智能訓練期間,AlphaZero學會了識別進入數據中心的任務模式,還學會了預測管理容量的最佳方法,並做出具有最佳長期結果的決策。
當我們將AlphaZero應用於Borg時,生產中的實驗表明,這種方法可以將未充分利用的硬件數量減少多達19%,優化谷歌數據中心的資源利用率。
圖片來自谷歌DeepMind
視頻壓縮的後續步驟
視頻流佔互聯網流量的大部分,消耗大量數據。因此,在這個過程中找到效率,無論大小,都會對每天觀看視頻的數百萬人產生巨大影響。
去年,我們與YouTube合作,將MuZero的問題解決能力應用於幫助壓縮和傳輸視頻。通過在不影響視覺質量的情況下將比特率降低4%,MuZero提升了整體YouTube體驗。
我們最初應用MuZero來優化視頻中每個單獨幀的壓縮。現在,我們已經擴展了這項工作,以決定在編碼過程中如何對幀進行分組和引用,從而節省更多的比特率。
前兩個步驟的早期結果表明MuZero有潛力成為一個更通用的工具,幫助在整個視頻壓縮過程中找到最佳解決方案。
圖片來自谷歌DeepMind
發現更快的算法
最近,AlphaDev/AlphaZero的一個版本在計算機科學領域取得了新的突破,發現了更快的排序和哈希算法,這兩個基本過程每天使用數万億次來排序、存儲和檢索數據。
排序算法會影響所有數字設備處理和顯示信息的方式,從在線搜索結果和社交帖子的排名到用戶推薦。AlphaDev發現了一種算法,與C++庫中的算法相比,該算法可以將短元素序列的排序效率提高70%,將超過250000個元素的序列的排序效率提高約1.7%。因此,當用戶提交搜索查詢時,AlphaDev的算法可以幫助更快地對結果進行排序。大規模使用時,它可以節省大量時間和精力。
圖片來自谷歌DeepMind
AlphaDev還發現了一種更快的散列信息算法,該算法通常用於數據存儲和檢索,例如在客戶數據庫中。散列算法通常使用一個鍵(例如用戶名“Jane Doe”)來生成一個唯一的散列,該散列對應於需要檢索的數據值(例如“訂單號 164335-87”)。
就像使用分類系統快速查找特定書籍的圖書管理員一樣,借助哈希系統,計算機已經知道它在尋找什麼以及在哪裡可以找到它。當應用於數據中9至16字節範圍的哈希函數時,AlphaDev的算法將效率提高了30%。
自從在LLVM標準C++庫中發布排序算法,用RL生成的子程序替換已經使用了十多年的子程序以及abseil庫中的散列算法,數百萬開發人員和公司現在正在使用這些算法雲計算、在線購物和供應鏈管理等行業。
圖片來自谷歌DeepMind
為我們的數字未來提供動力的通用工具
從玩遊戲到解決每台設備核心的複雜工程問題,谷歌的人工智能工具正在為數十億人節省時間和精力。而這僅僅是個開始。谷歌設想在未來,更多的通用人工智能工具可以幫助優化世界整個計算生態系統。但為了支持這些工具,谷歌需要更快、更高效、更可持續的數字基礎設施。 要實現完全通用的AI工具,還需要更多的理論和技術突破。通用人工智能工具的變革潛力,以及它們如何應用於技術、科學和醫學領域仍面臨諸多挑戰。