要点:
人工智能/AI的子集正在以惊人的速度增长,并且已经完成了许多原本只有人类才能胜任的任务。 Google DeepMind宣布推出Alpha家族的新成员AlphaDev,这是一种利用强化学习来改进计算机科学算法的人工智能系统,其发现了一种速度更快的排序算法,被誉为打破了十年来的算法“封印” ,成为使用人工智能优化代码的重要里程碑。
科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。
狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。
狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。
联系我们// 相关文章
DeepMind Technologies背景
人工智能/AI的子集正在以惊人的速度增长,并且已经完成了许多原本只有人类才能胜任的任务。例如,像机器学习这样的技术可以执行管理任务、人脸识别、下棋,甚至翻译语言。毫无疑问,过去十年人工智能领域取得了巨大的发展。此外,深度学习通过从非结构化数据中学习,能够生成分析报告或执行无人监督任务。所有这些进展都为不同的公司发挥作用,并证明了它们的价值。
DeepMind Technologies于2010年在伦敦成立,但四年后被Google收购。 2015年,它的所有权再次发生变化,被Alphabet公司收购,此后成为其子公司。自成立以来,DeepMind Technologies在美国、加拿大和法国设立了研究中心。自从2016年AlphaGo 战胜世界围棋冠军李世石后,它开始得到许多人的认可。此外,他们还开发了另一个名为AlphaZero的程序,可以下国际象棋、日本象棋,并取得了最佳成绩。
除了众所周知的AlphaGo产品,DeepMind 保持着持续的高产节奏。 2017年,AlphaGo的最新版本AlphaGo Zero,在自我训练3天后以100比0的成绩战胜了AlphaGo。 2018年推出的AlphaFold成功预测了98.5%的人类蛋白质结构,对医学和生物学产生了深远影响。 2022年发布的基于Transformer的新模型AlphaCode实现了大规模代码生成。 2022年发布的AI智能体“Gato” 迈进了通用人工智能的一步。
DeepMind的AI AlphaFold显示蛋白质结构的图片
DeepMind在通用学习算法方面非常有趣,它不仅可以改善这一领域,还将帮助人们更好地理解人类大脑。该公司已经开始通过开发能够玩各种不同游戏的系统来实现这一目标。其中一位创始人提到,他们相信,当一个程序可以玩各种不同的游戏时,就可以达到人类水平的人工智能。他们的策略得到科学研究的支持,这些科学研究证明,像象棋这样的游戏可以提高战略思维能力。通过学习如何玩这些复杂的游戏,机器将获得思考和釆取战略行动的能力。
DeepMind的通用学习算法让机器可以通过游戏化学习,试图获得类似人类的智力和行为。尽管该公司对实现人类智能的机器学习非常感兴趣,但它对使用这些技术的安全性也有客观的看法。为了避免机器灾难,DeepMind开发了一个开源测试平台,以确定算法在存在不良行为时是否具有终止开关。这个开源测试平台称为GridWorld,它可以确保AI对自身、开发人员和其他接触到它的人都是安全无害的。 DeepMind通过实现一个完全不同的技术系统,将深度学习提升到了一个全新的水平。该系统称为深度强化学习,与常规的人工智能系统不同,它是完全独立的。
DeepMind的深度强化学习不是预先编程的,而是像人类一样通过经验学习。从本质上讲,它基于卷积神经网络进行深度学习,并将其与Q-learning相结合。随后,他们的系统在各种电子游戏上进行了测试,而无需编写关于如何玩这个游戏的指令。每件事都由系统独立完成,它学习如何玩电子游戏,经过多次尝试,其玩法比任何人都要好。这个系统已经玩过各种游戏,并且比最擅长玩游戏的人掌握得还要好。
谷歌在尝试使用MuZero、AlphaZero和AlphaDev去优化计算机生态系统
人工智能AI算法每天都变得越来越复杂,每个算法都旨在以最佳方式解决问题。谷歌正在努力创建对世界具有广泛理解的AI工具,以便可以在许多不同类型的任务之间传递有用的知识。
基于强化学习,谷歌AI模型AlphaZero和MuZero已经取得了超人的表现赢得比赛。现在,他们正在扩展自己的能力,以帮助优化数据中心和视频压缩。最近,谷歌的AlphaZero专用版本,称为AlphaDev发现了新算法,这些算法已经在我们数字社会的基础上加速了软件的发展。
虽然这些工具在整个计算生态系统中创造了效率飞跃,但早期结果显示了更多通用人工智能工具的变革潜力。以下,我们将解释这些进步如何塑造计算的未来,以及如何帮助数十亿人和地球。
优化数据中心资源<br>数据中心管理从提供搜索结果到处理数据集的一切事务。 Borg 管理着Google 的数十亿个任务,分配这些工作负载就像玩多维俄罗斯方块游戏。该系统有助于优化内部基础设施服务、面向用户的产品,如Google Workspace和搜索的任务,并管理批处理。
Borg使用手动编码的规则来安排任务来管理此工作负载。在谷歌规模上,这些手动编码的规则无法考虑不断变化的工作负载分布的多样性,因此它们被设计为“最适合所有人的一种尺寸”。这就是像AlphaZero这样的机器学习技术特别有用的地方:这些算法能够自动创建单独的最佳定制规则,这些规则对于各种工作负载分配更有效。
在人工智能训练期间,AlphaZero学会了识别进入数据中心的任务模式,还学会了预测管理容量的最佳方法,并做出具有最佳长期结果的决策。
当我们将AlphaZero应用于Borg时,生产中的实验表明,这种方法可以将未充分利用的硬件数量减少多达19%,优化谷歌数据中心的资源利用率。
图片来自谷歌DeepMind
视频压缩的后续步骤
视频流占互联网流量的大部分,消耗大量数据。因此,在这个过程中找到效率,无论大小,都会对每天观看视频的数百万人产生巨大影响。
去年,我们与YouTube合作,将MuZero的问题解决能力应用于帮助压缩和传输视频。通过在不影响视觉质量的情况下将比特率降低4%,MuZero提升了整体YouTube体验。
我们最初应用MuZero来优化视频中每个单独帧的压缩。现在,我们已经扩展了这项工作,以决定在编码过程中如何对帧进行分组和引用,从而节省更多的比特率。
前两个步骤的早期结果表明MuZero有潜力成为一个更通用的工具,帮助在整个视频压缩过程中找到最佳解决方案。
图片来自谷歌DeepMind
发现更快的算法
最近,AlphaDev/AlphaZero的一个版本在计算机科学领域取得了新的突破,发现了更快的排序和哈希算法,这两个基本过程每天使用数万亿次来排序、存储和检索数据。
排序算法会影响所有数字设备处理和显示信息的方式,从在线搜索结果和社交帖子的排名到用户推荐。 AlphaDev发现了一种算法,与C++库中的算法相比,该算法可以将短元素序列的排序效率提高70%,将超过250000个元素的序列的排序效率提高约1.7%。因此,当用户提交搜索查询时,AlphaDev的算法可以帮助更快地对结果进行排序。大规模使用时,它可以节省大量时间和精力。
图片来自谷歌DeepMind
AlphaDev还发现了一种更快的散列信息算法,该算法通常用于数据存储和检索,例如在客户数据库中。散列算法通常使用一个键(例如用户名“Jane Doe”)来生成一个唯一的散列,该散列对应于需要检索的数据值(例如“订单号164335-87”)。
就像使用分类系统快速查找特定书籍的图书管理员一样,借助哈希系统,计算机已经知道它在寻找什么以及在哪里可以找到它。当应用于数据中9至16字节范围的哈希函数时,AlphaDev的算法将效率提高了30%。
自从在LLVM标准C++库中发布排序算法,用RL生成的子程序替换已经使用了十多年的子程序以及abseil库中的散列算法,数百万开发人员和公司现在正在使用这些算法云计算、在线购物和供应链管理等行业。
图片来自谷歌DeepMind
为我们的数字未来提供动力的通用工具
从玩游戏到解决每台设备核心的复杂工程问题,谷歌的人工智能工具正在为数十亿人节省时间和精力。而这仅仅是个开始。谷歌设想在未来,更多的通用人工智能工具可以帮助优化世界整个计算生态系统。但为了支持这些工具,谷歌需要更快、更高效、更可持续的数字基础设施。 要实现完全通用的AI工具,还需要更多的理论和技术突破。通用人工智能工具的变革潜力,以及它们如何应用于技术、科学和医学领域仍面临诸多挑战。