要点:
谷歌表示,今天在Bard聊天机器人中推出的Gemini是其有史以来最强大的人工智能AI模型。它接受了影片、图像等方面的训练。迄今为止,Google一直在努力吸引与OpenAI的ChatGPT一样多的关注和用户。但随着科技的迅速发展,人们对人工智能AI潜在危害的担忧也在增加。即使人工智能模型能够将越来越复杂的提示转换为复杂的回应,但我们仍然需要谨慎,不能完全相信它们仅仅提供看似合理而非实际正确的答案。
科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。
狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。
狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。
联系我们// 相关文章
注意据12月8日最新消息:
在短短24小时内,大众最初对Google Gemini AI平台推出的热情已经消退,取而代之的是对其Gemini实践影片的争议。 Google发布的Gemini,据称是迄今为止最强大的人工智能AI模型套件,但目前已经被指控对其“性能撒谎”。
六分钟的影片展示了Gemini的多模式功能(例如,语音对话提示与影像辨识结合)。 Gemini似乎可以快速识别影像,即使是连点连线的图片,也能在几秒钟内做出回应,并即时追踪杯赛和球类比赛中的一叠纸。但点击YouTube上的这条影片却出现一个Google重要的免责声明:“出于本演示的目的,延迟已减少,并且为了简洁起见,Gemini输出也已缩短。”
Google对外承认,视频演示并不是通过语音提示实时进行的,而是使用原始素材中的静态图像帧,然后写出Gemini做出回应的文本提示。这一做法令不少专家认为,这与Google暗示的超强大人工智能AI工具完全不同,Google对外宣称,当Gemini观察周围的世界并即时做出反应时,一个人可以与Gemini进行流畅的语音对话。而事实上,并不是如此。
此外,Google类似的做法已经不是第一次。 Google早前的Duplex演示(一种人工智能语音助手,可以打电话给美发店和餐厅进行预订),也被质疑是预先录制的人工智能AI模型影片,明显缺乏环境噪音和真实员工的反应。而现在对于Gemini的“性能撒谎”,又引起了大众对其的质疑。不少专家认为,在这种情况下,Google是在“炫耀”,目的是误导人们,让他们忽视Gemini仍然落后于OpenAI的GPT的事实。但Gemini仍然是Google向前迈出的一大步,因为它希望与人工智慧先驱者ChatGPT保持同步,只是这可能不像最初想的如此大突破而已。
2023年12月6日原文:
在过去的十年中,Google一直是人工智能领域的领先巨头企业。目前,Google正迅速扩展其在人工智能AI领域的地位。尽管OpenAI的ChatGPT已经成为全球瞩目的现象,也是有史以来增长最快的消费产品之一,但截至今天,Bard已拥有来自170个国家/地区的英语用户。
今天,Google推出新的人工智能AI模型“Gemini”,据称该模型在多个方面甚至超越了OpenAI的技术水平,具有先进的“推理能力”,甚至在应对困难问题时表现得“更为深思熟虑”。
Gemini强大生成AI模式
Gemini代表了人工智能领域的一次巨大转变。虽然基于文字的聊天至关重要,但在我们身处不断变化的三维世界中,人类需要处理包括语言和图像等更丰富的信息,而不仅仅是简单的文字。因此,Gemini成为了一种备受瞩目的新尝试。
据Google表示,Gemini有三个版本,针对不同的运算能力等级
Gemini Nano运行在手机上,有两个版本供应不同级别的可用记忆体使用。它将支持Google Pixel 8手机上的新功能,例如在Recorder应用程式中总结对话,或在使用Google Gboard输入的WhatsApp中回覆消息。
Gemini Pro专为快速响应而设计,在Google资料中心运行,将从周三开始为新版本的Bard提供支援。
Gemini Ultra目前仅限于测试小组,预计将于2024年初在新的Bard Advanced聊天机器人中提供。虽然Google拒绝透露定价细节,但预计这项顶级功能将需要支付额外的费用。
Google Bard和Assistant的主管对外表示,Gemini是Bard至今最大、最优越的一次升级。 Google执行长桑达尔·皮查伊/Sundar Pichai也分享道,“我相信Gemini可以更好地理解使用者的意图,也能够以更真实、更高品质的方式作出回应。”
目前,Bard虽然只是一个聊天机器人:你输入文字,它回应文字。然而明年,Google计划推出由Gemini Ultra提供支援的“Bard Advanced”预览版,这将是Google新的大型语言模型中最强大且功能最丰富的版本。此外,Gemini Ultra也是该模型的多模式版本,这意味着除了文字之外,它还能够处理和生成图像、音讯和视讯。
Google DeepMind的主管Demis Hassabis表示,非文字互动是Gemini的一大亮点。 “我们从一开始就设计它成为原生多模式,这是它的新功能之一,能够无缝整合和进行跨模式推理。”之前,Gemini已经通过解决数学和人文等57个学科领域的问题,展示了其问题解决能力和知识水平。
Gemini具有跨足文字、图像、音讯、视讯和程式码的推理能力。此外,它还能够参与使用者的互动,执行创建游戏、解决视觉谜题、建立连结、生成图像与文本、进行逻辑与空间推理、进行视觉翻译、理解文化等具有创意性的任务。以下一段示范影片展示了Gemini在辨识蓝色鸭子、手偶、戏法等任务时表现出来的强大理解能力、想象能力和创造力。
Sundar Pichai强调,Gemini的推出标志着人工智能的“新时代”。 Gemini具备辨识和生成文字、图像以及音讯的能力,但值得注意的是,Gemini本身并非一个独立的产品。相反,它是一个基础模型,这意味着它将被融合进Google现有的工具中,包括搜寻和Bard。
人工智能竞赛火热进行
Google的新版本凸显了生成式人工智能领域的迅速进展,这使得聊天机器人能够根据我们以简单语言而非复杂程式指令编写的提示来生成自己的回应。
值得注意的是,谷歌的主要竞争对手OpenAI在一年前推出了ChatGPT,抢占了先机,但谷歌已经进行了三次重大的人工智能模型修订,期望通过数十亿用户使用的产品(如搜索、 Chrome、谷歌文档)来推广这一技术,甚至包括Gmail。 Gartner分析师Chirag Dekate指出,Gemini似乎设立了一个“新标准”,强调其具备从文字以外的来源学习的能力。他表示,这可能引发生成式人工智能领域的创新变革。
迄今为止,Google一直在努力吸引与OpenAI的ChatGPT一样多的关注和用户。与此同时,OpenAI的更强大软体新版本将于明年发布。最近OpenAI的动荡,Altman在几天之内被解雇又重新受聘,这是否会对这一次的发布产生任何影响还有待观察。此外,Google还面临来自Elon Musk的xAI的新竞争,该公司近日正寻求筹集最多10亿美元进行研发投资。在中国,百度公司也正在推出自己的人工智能产品。面对来自不同国家和地区的“直面竞争”,Gemini面临着机遇的同时,也面临着对应的挑战。
随着科技的迅速发展,人们对人工智能AI潜在危害的担忧也在增加。世界各国政府正在努力制定规则甚至立法来遏制人工智慧未来可能出现的风险。早在今年11月,英国峰会上讨论了该主题,签署方同意了一项呼吁其安全开发的声明。此外,英国还表示,需要以紧迫感、团结和集体力量来应对人工智能可能带来的危险。
人工智能变得更聪明但并不完美
随着多媒体的崛起,人工智能AI可能带来显著的变革。即使人工智能模型能够将越来越复杂的提示转换为复杂的回应,但我们仍然需要谨慎,不能完全相信它们仅仅提供看似合理而非实际正确的答案。正如Google的聊天机器人在使用时所警告的那样,“Bard可能会呈现不准确的信息,包括有关个人的信息,因此请仔细检查其回复的答案。”
Gemini代表了Google大型语言模型的下一代,是PaLM和PaLM 2的延续,这两者迄今为止一直是Bard的基础。然而,透过同时训练Gemini处理文字、程式码、图像、音讯和视频,它能够更有效地应对多媒体输入,相较于使用单独但相互关联的人工智能模型对每种输入模式进行训练。
根据Google的一项研究报告,Gemini展现了卓越的综合能力。当面对一系列由三角形、正方形和五边形组成的形状时,Gemini能够准确猜测该系列中的下一个形状是六边形。在呈现月球和一只手拿着高尔夫球的照片,要求找到连结时,Gemini正确指出阿波罗太空人于1971年在月球上击中了两个高尔夫球。此外,该研究还呈现了Gemini处理手写物理问题的过程,包括一个简单的草图,找出学生的错误,并解释纠正方法。
但目前,Gemini Ultra正在等待进一步的测试才能在明年上市
Gemini Ultra目前正积极进行“红队合作”,制造商正在招募人员寻找安全漏洞和其他潜在问题。在涉及多媒体输入数据的情况下,这种测试变得更加复杂。举例来说,简讯和照片单独看可能是无害的,但一旦组合在一起,可能传达出完全不同的含义。
Sundar Pichai向外宣称:“我们正在以大胆而负责任的态度进行这项工作。” 这不仅代表着雄心勃勃的研究与巨大的潜在回报相结合,同时也显示出Google增加保障措施、与政府和其他机构合作以应对不断增强的人工智能风险的承诺。
至于该技术在解决问题能力方面,Google宣称Gemini特别擅长数学和物理。这让对人工智能乐观派燃起了希望,认为它可能会带来科学突破,改善人类的生活。但对人工智能发展持悲观看法的一派,则担心该技术最终会超越人类智能,导致数以百万计的工作流失,甚至可能产生更具破坏性的行为,例如放大错误讯息,或什至触发核武战争。
随着人工智能AI的迅猛发展,具备强大AI技能的人才将在未来担担更多职责,不仅限于传统的技术性工作,还包括具有高度创意性的工作任务。 AI的崛起不仅为自动化提供了更多可能性,也在业务领域中引入了更多的智慧和革新。这种变革将促使人们重新思考和定位自己在这个新时代的角色。
对于一般大众而言,AI的蓬勃发展也将为普通人提供更多机会找到自己的定位。随着AI自动化日益普及,人们将更多地投身于具有高度人文性和创意性的工作,这些领域往往需要人类的情感、直觉和艺术创造力。这种趋势将推动社会实现更大程度的多元化,使每个个体都能够发挥其独特的才华,融入AI时代的脉动。
因此,AI的普及并非仅仅是技术革新,更是一场引领人类重新定义工作与生活的革命。人们将面对更多的选择,从而找到更符合自身兴趣和天赋的工作方向。这种变革带来的机会和挑战将推动着整个社会向更加智慧和包容的方向发展,促使每个人都能在这个AI时代中找到属于自己的清晰定位。