用 AI 模型優化全球計算機系統?Google DeepMind AI 優化代碼打破算法瓶頸!

用AI 模型优化全球计算机系统? Google DeepMind AI 优化代码打破算法瓶颈!

發布日期:

科技 Tech


要点:
人工智能/AI的子集正在以惊人的速度增长,并且已经完成了许多原本只有人类才能胜任的任务。 Google DeepMind宣布推出Alpha家族的新成员AlphaDev,这是一种利用强化学习来改进计算机科学算法的人工智能系统,其发现了一种速度更快的排序算法,被誉为打破了十年来的算法“封印” ,成为使用人工智能优化代码的重要里程碑。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

DeepMind Technologies背景
人工智能/AI的子集正在以惊人的速度增长,并且已经完成了许多原本只有人类才能胜任的任务。例如,像机器学习这样的技术可以执行管理任务、人脸识别、下棋,甚至翻译语言。毫无疑问,过去十年人工智能领域取得了巨大的发展。此外,深度学习通过从非结构化数据中学习,能够生成分析报告或执行无人监督任务。所有这些进展都为不同的公司发挥作用,并证明了它们的价值。

DeepMind Technologies于2010年在伦敦成立,但四年后被Google收购。 2015年,它的所有权再次发生变化,被Alphabet公司收购,此后成为其子公司。自成立以来,DeepMind Technologies在美国、加拿大和法国设立了研究中心。自从2016年AlphaGo 战胜世界围棋冠军李世石后,它开始得到许多人的认可。此外,他们还开发了另一个名为AlphaZero的程序,可以下国际象棋、日本象棋,并取得了最佳成绩。

除了众所周知的AlphaGo产品,DeepMind 保持着持续的高产节奏。 2017年,AlphaGo的最新版本AlphaGo Zero,在自我训练3天后以100比0的成绩战胜了AlphaGo。 2018年推出的AlphaFold成功预测了98.5%的人类蛋白质结构,对医学和生物学产生了深远影响。 2022年发布的基于Transformer的新模型AlphaCode实现了大规模代码生成。 2022年发布的AI智能体“Gato” 迈进了通用人工智能的一步。


DeepMind的AI AlphaFold显示蛋白质结构的图片

DeepMind在通用学习算法方面非常有趣,它不仅可以改善这一领域,还将帮助人们更好地理解人类大脑。该公司已经开始通过开发能够玩各种不同游戏的系统来实现这一目标。其中一位创始人提到,他们相信,当一个程序可以玩各种不同的游戏时,就可以达到人类水平的人工智能。他们的策略得到科学研究的支持,这些科学研究证明,像象棋这样的游戏可以提高战略思维能力。通过学习如何玩这些复杂的游戏,机器将获得思考和釆取战略行动的能力。

DeepMind的通用学习算法让机器可以通过游戏化学习,试图获得类似人类的智力和行为。尽管该公司对实现人类智能的机器学习非常感兴趣,但它对使用这些技术的安全性也有客观的看法。为了避免机器灾难,DeepMind开发了一个开源测试平台,以确定算法在存在不良行为时是否具有终止开关。这个开源测试平台称为GridWorld,它可以确保AI对自身、开发人员和其他接触到它的人都是安全无害的。 DeepMind通过实现一个完全不同的技术系统,将深度学习提升到了一个全新的水平。该系统称为深度强化学习,与常规的人工智能系统不同,它是完全独立的。

DeepMind的深度强化学习不是预先编程的,而是像人类一样通过经验学习。从本质上讲,它基于卷积神经网络进行深度学习,并将其与Q-learning相结合。随后,他们的系统在各种电子游戏上进行了测试,而无需编写关于如何玩这个游戏的指令。每件事都由系统独立完成,它学习如何玩电子游戏,经过多次尝试,其玩法比任何人都要好。这个系统已经玩过各种游戏,并且比最擅长玩游戏的人掌握得还要好

谷歌在尝试使用MuZero、AlphaZero和AlphaDev去优化计算机生态系统
人工智能AI算法每天都变得越来越复杂,每个算法都旨在以最佳方式解决问题。谷歌正在努力创建对世界具有广泛理解的AI工具,以便可以在许多不同类型的任务之间传递有用的知识。

基于强化学习,谷歌AI模型AlphaZero和MuZero已经取得了超人的表现赢得比赛。现在,他们正在扩展自己的能力,以帮助优化数据中心和视频压缩。最近,谷歌的AlphaZero专用版本,称为AlphaDev发现了新算法,这些算法已经在我们数字社会的基础上加速了软件的发展。

虽然这些工具在整个计算生态系统中创造了效率飞跃,但早期结果显示了更多通用人工智能工具的变革潜力。以下,我们将解释这些进步如何塑造计算的未来,以及如何帮助数十亿人和地球。

优化数据中心资源<br>数据中心管理从提供搜索结果到处理数据集的一切事务。 Borg 管理着Google 的数十亿个任务,分配这些工作负载就像玩多维俄罗斯方块游戏。该系统有助于优化内部基础设施服务、面向用户的产品,如Google Workspace和搜索的任务,并管理批处理。

Borg使用手动编码的规则来安排任务来管理此工作负载。在谷歌规模上,这些手动编码的规则无法考虑不断变化的工作负载分布的多样性,因此它们被设计为“最适合所有人的一种尺寸”。这就是像AlphaZero这样的机器学习技术特别有用的地方:这些算法能够自动创建单独的最佳定制规则,这些规则对于各种工作负载分配更有效。

在人工智能训练期间,AlphaZero学会了识别进入数据中心的任务模式,还学会了预测管理容量的最佳方法,并做出具有最佳长期结果的决策。

当我们将AlphaZero应用于Borg时,生产中的实验表明,这种方法可以将未充分利用的硬件数量减少多达19%,优化谷歌数据中心的资源利用率。

google AI
图片来自谷歌DeepMind

视频压缩的后续步骤

视频流占互联网流量的大部分,消耗大量数据。因此,在这个过程中找到效率,无论大小,都会对每天观看视频的数百万人产生巨大影响。

去年,我们与YouTube合作,将MuZero的问题解决能力应用于帮助压缩和传输视频。通过在不影响视觉质量的情况下将比特率降低4%,MuZero提升了整体YouTube体验。

我们最初应用MuZero来优化视频中每个单独帧的压缩。现在,我们已经扩展了这项工作,以决定在编码过程中如何对帧进行分组和引用,从而节省更多的比特率。

前两个步骤的早期结果表明MuZero有潜力成为一个更通用的工具,帮助在整个视频压缩过程中找到最佳解决方案。

google AI
图片来自谷歌DeepMind

发现更快的算法
最近,AlphaDev/AlphaZero的一个版本在计算机科学领域取得了新的突破,发现了更快的排序和哈希算法,这两个基本过程每天使用数万亿次来排序、存储和检索数据。

排序算法会影响所有数字设备处理和显示信息的方式,从在线搜索结果和社交帖子的排名到用户推荐。 AlphaDev发现了一种算法,与C++库中的算法相比,该算法可以将短元素序列的排序效率提高70%,将超过250000个元素的序列的排序效率提高约1.7%。因此,当用户提交搜索查询时,AlphaDev的算法可以帮助更快地对结果进行排序。大规模使用时,它可以节省大量时间和精力。

google AI
图片来自谷歌DeepMind

AlphaDev还发现了一种更快的散列信息算法,该算法通常用于数据存储和检索,例如在客户数据库中。散列算法通常使用一个键(例如用户名“Jane Doe”)来生成一个唯一的散列,该散列对应于需要检索的数据值(例如“订单号164335-87”)。

就像使用分类系统快速查找特定书籍的图书管理员一样,借助哈希系统,计算机已经知道它在寻找什么以及在哪里可以找到它。当应用于数据中9至16字节范围的哈希函数时,AlphaDev的算法将效率提高了30%。

自从在LLVM标准C++库中发布排序算法,用RL生成的子程序替换已经使用了十多年的子程序以及abseil库中的散列算法,数百万开发人员和公司现在正在使用这些算法云计算、在线购物和供应链管理等行业。

google AI
图片来自谷歌DeepMind

为我们的数字未来提供动力的通用工具
从玩游戏到解决每台设备核心的复杂工程问题,谷歌的人工智能工具正在为数十亿人节省时间和精力。而这仅仅是个开始。谷歌设想在未来,更多的通用人工智能工具可以帮助优化世界整个计算生态系统。但为了支持这些工具,谷歌需要更快、更高效、更可持续的数字基础设施。 要实现完全通用的AI工具,还需要更多的理论和技术突破。通用人工智能工具的变革潜力,以及它们如何应用于技术、科学和医学领域仍面临诸多挑战。

注:本文改编自DeepMind的一篇博文,感兴趣的可以点击此链接查看原帖

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章


返回博客
1 / 8
1 / 4
1 / 4
  • 出海網紅經濟,是陷阱還是機遇?

    出海网红经济,是陷阱还是机遇?

    随着中国品牌出海,网红经济席卷北美、东南亚两大市场。在网红经济的迅速发展下,也催生了网红主播、MCN机构一条成熟的“全产业链”。网红主播为了流量可能会采取什么极端的手段? MCN机构和主播间到底又存在哪些内幕?

    出海网红经济,是陷阱还是机遇?

    随着中国品牌出海,网红经济席卷北美、东南亚两大市场。在网红经济的迅速发展下,也催生了网红主播、MCN机构一条成熟的“全产业链”。网红主播为了流量可能会采取什么极端的手段? MCN机构和主播间到底又存在哪些内幕?

  • 中國年輕人“逃離”一線城市,一線城市風光不再還是迫於現實?

    中国年轻人“逃离”一线城市,一线城市风光不再还是迫于现实?

    近年来,越来越多的年轻人选择离开一线城市,去到二、三线城市或者回到自己的家乡发展。然而,也有一部分年轻人选择了重新回归,在一线城市漂泊、打工、旅行,这种现象也被称为“回笼漂”。

    中国年轻人“逃离”一线城市,一线城市风光不再还是迫于现实?

    近年来,越来越多的年轻人选择离开一线城市,去到二、三线城市或者回到自己的家乡发展。然而,也有一部分年轻人选择了重新回归,在一线城市漂泊、打工、旅行,这种现象也被称为“回笼漂”。

  • 溫哥華明星脫口秀抽獎贈票!中外喜劇,以幽默形式傳遞思考

    温哥华明星脱口秀抽奖赠票!中外喜剧,以幽默形式传递思考

    作为喜剧的“非常态”表达形式,“即兴喜剧”完完全全由现场观众给一些主题、线索或是关键信息,再由喜剧演员们把这些东西用随机、自然的形式演绎出来。今天,我们和麦浪娱乐创始人之一、大麦喜剧即兴喜剧负责人紫琪一起探讨即兴喜剧背后的思考。

    温哥华明星脱口秀抽奖赠票!中外喜剧,以幽默形式传递思考

    作为喜剧的“非常态”表达形式,“即兴喜剧”完完全全由现场观众给一些主题、线索或是关键信息,再由喜剧演员们把这些东西用随机、自然的形式演绎出来。今天,我们和麦浪娱乐创始人之一、大麦喜剧即兴喜剧负责人紫琪一起探讨即兴喜剧背后的思考。

  • Netflix 韓劇D.P: 逃兵追缉令,霸凌黑暗面背後的思考

    Netflix 韩剧DP: 逃兵追缉令,霸凌黑暗面背后的思考

    大多数人将霸凌与童年联系在一起,但任何年龄段的任何人都可能发生欺凌行为。它也可以采取多种形式,从言语骚扰到身体虐待等等。欺凌行为也不只发生在操场上。个人可能会在网上、办公室、家里和其他地方遭受霸凌。

    Netflix 韩剧DP: 逃兵追缉令,霸凌黑暗面背后的思考

    大多数人将霸凌与童年联系在一起,但任何年龄段的任何人都可能发生欺凌行为。它也可以采取多种形式,从言语骚扰到身体虐待等等。欺凌行为也不只发生在操场上。个人可能会在网上、办公室、家里和其他地方遭受霸凌。

1 / 4