Google推出人工智能模型“Gemini”,或超越GPT-4?

Google推出人工智能模型“Gemini”,或超越GPT-4?

發布日期:

想法 Ideas 科技 Tech


要点:
谷歌表示,今天在Bard聊天机器人中推出的Gemini是其有史以来最强大的人工智能AI模型。它接受了影片、图像等方面的训练。迄今为止,Google一直在努力吸引与OpenAI的ChatGPT一样多的关注和用户。但随着科技的迅速发展,人们对人工智能AI潜在危害的担忧也在增加。即使人工智能模型能够将越来越复杂的提示转换为复杂的回应,但我们仍然需要谨慎,不能完全相信它们仅仅提供看似合理而非实际正确的答案。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

注意据12月8日最新消息:
在短短24小时内,大众最初对Google Gemini AI平台推出的热情已经消退,取而代之的是对其Gemini实践影片的争议。 Google发布的Gemini,据称是迄今为止最强大的人工智能AI模型套件,但目前已经被指控对其“性能撒谎”。

六分钟的影片展示了Gemini的多模式功能(例如,语音对话提示与影像辨识结合)。 Gemini似乎可以快速识别影像,即使是连点连线的图片,也能在几秒钟内做出回应,并即时追踪杯赛和球类比赛中的一叠纸。但点击YouTube上的这条影片却出现一个Google重要的免责声明:“出于本演示的目的,延迟已减少,并且为了简洁起见,Gemini输出也已缩短。”

Google对外承认,视频演示并不是通过语音提示实时进行的,而是使用原始素材中的静态图像帧,然后写出Gemini做出回应的文本提示。这一做法令不少专家认为,这与Google暗示的超强大人工智能AI工具完全不同,Google对外宣称,当Gemini观察周围的世界并即时做出反应时,一个人可以与Gemini进行流畅的语音对话。而事实上,并不是如此。

此外,Google类似的做法已经不是第一次。 Google早前的Duplex演示(一种人工智能语音助手,可以打电话给美发店和餐厅进行预订),也被质疑是预先录制的人工智能AI模型影片,明显缺乏环境噪音和真实员工的反应。而现在对于Gemini的“性能撒谎”,又引起了大众对其的质疑。不少专家认为,在这种情况下,Google是在“炫耀”,目的是误导人们,让他们忽视Gemini仍然落后于OpenAI的GPT的事实。但Gemini仍然是Google向前迈出的一大步,因为它希望与人工智慧先驱者ChatGPT保持同步,只是这可能不像最初想的如此大突破而已。

2023年12月6日原文:
在过去的十年中,Google一直是人工智能领域的领先巨头企业。目前,Google正迅速扩展其在人工智能AI领域的地位。尽管OpenAI的ChatGPT已经成为全球瞩目的现象,也是有史以来增长最快的消费产品之一,但截至今天,Bard已拥有来自170个国家/地区的英语用户。

今天,Google推出新的人工智能AI模型“Gemini”,据称该模型在多个方面甚至超越了OpenAI的技术水平,具有先进的“推理能力”,甚至在应对困难问题时表现得“更为深思熟虑”。

Gemini强大生成AI模式
Gemini代表了人工智能领域的一次巨大转变。虽然基于文字的聊天至关重要,但在我们身处不断变化的三维世界中,人类需要处理包括语言和图像等更丰富的信息,而不仅仅是简单的文字。因此,Gemini成为了一种备受瞩目的新尝试。

据Google表示,Gemini有三个版本,针对不同的运算能力等级
Gemini Nano运行在手机上,有两个版本供应不同级别的可用记忆体使用。它将支持Google Pixel 8手机上的新功能,例如在Recorder应用程式中总结对话,或在使用Google Gboard输入的WhatsApp中回覆消息。

Gemini Pro专为快速响应而设计,在Google资料中心运行,将从周三开始为新版本的Bard提供支援。

Gemini Ultra目前仅限于测试小组,预计将于2024年初在新的Bard Advanced聊天机器人中提供。虽然Google拒绝透露定价细节,但预计这项顶级功能将需要支付额外的费用。

Google Bard和Assistant的主管对外表示,Gemini是Bard至今最大、最优越的一次升级。 Google执行长桑达尔·皮查伊/Sundar Pichai也分享道,“我相信Gemini可以更好地理解使用者的意图,也能够以更真实、更高品质的方式作出回应。”

目前,Bard虽然只是一个聊天机器人:你输入文字,它回应文字。然而明年,Google计划推出由Gemini Ultra提供支援的“Bard Advanced”预览版,这将是Google新的大型语言模型中最强大且功能最丰富的版本。此外,Gemini Ultra也是该模型的多模式版本,这意味着除了文字之外,它还能够处理和生成图像、音讯和视讯。

Google DeepMind的主管Demis Hassabis表示,非文字互动是Gemini的一大亮点。 “我们从一开始就设计它成为原生多模式,这是它的新功能之一,能够无缝整合和进行跨模式推理。”之前,Gemini已经通过解决数学和人文等57个学科领域的问题,展示了其问题解决能力和知识水平。

Gemini具有跨足文字、图像、音讯、视讯和程式码的推理能力。此外,它还能够参与使用者的互动,执行创建游戏、解决视觉谜题、建立连结、生成图像与文本、进行逻辑与空间推理、进行视觉翻译、理解文化等具有创意性的任务。以下一段示范影片展示了Gemini在辨识蓝色鸭子、手偶、戏法等任务时表现出来的强大理解能力、想象能力和创造力。

Sundar Pichai强调,Gemini的推出标志着人工智能的“新时代”。 Gemini具备辨识和生成文字、图像以及音讯的能力,但值得注意的是,Gemini本身并非一个独立的产品。相反,它是一个基础模型,这意味着它将被融合进Google现有的工具中,包括搜寻和Bard。

人工智能竞赛火热进行
Google的新版本凸显了生成式人工智能领域的迅速进展,这使得聊天机器人能够根据我们以简单语言而非复杂程式指令编写的提示来生成自己的回应。

值得注意的是,谷歌的主要竞争对手OpenAI在一年前推出了ChatGPT,抢占了先机,但谷歌已经进行了三次重大的人工智能模型修订,期望通过数十亿用户使用的产品(如搜索、 Chrome、谷歌文档)来推广这一技术,甚至包括Gmail。 Gartner分析师Chirag Dekate指出,Gemini似乎设立了一个“新标准”,强调其具备从文字以外的来源学习的能力。他表示,这可能引发生成式人工智能领域的创新变革。

迄今为止,Google一直在努力吸引与OpenAI的ChatGPT一样多的关注和用户。与此同时,OpenAI的更强大软体新版本将于明年发布。最近OpenAI的动荡,Altman在几天之内被解雇又重新受聘,这是否会对这一次的发布产生任何影响还有待观察。此外,Google还面临来自Elon Musk的xAI的新竞争,该公司近日正寻求筹集最多10亿美元进行研发投资。在中国,百度公司也正在推出自己的人工智能产品。面对来自不同国家和地区的“直面竞争”,Gemini面临着机遇的同时,也面临着对应的挑战。

随着科技的迅速发展,人们对人工智能AI潜在危害的担忧也在增加。世界各国政府正在努力制定规则甚至立法来遏制人工智慧未来可能出现的风险。早在今年11月,英国峰会上讨论了该主题,签署方同意了一项呼吁其安全开发的声明。此外,英国还表示,需要以紧迫感、团结和集体力量来应对人工智能可能带来的危险。

人工智能变得更聪明但并不完美
随着多媒体的崛起,人工智能AI可能带来显著的变革。即使人工智能模型能够将越来越复杂的提示转换为复杂的回应,但我们仍然需要谨慎,不能完全相信它们仅仅提供看似合理而非实际正确的答案。正如Google的聊天机器人在使用时所警告的那样,“Bard可能会呈现不准确的信息,包括有关个人的信息,因此请仔细检查其回复的答案。”

Gemini代表了Google大型语言模型的下一代,是PaLM和PaLM 2的延续,这两者迄今为止一直是Bard的基础。然而,透过同时训练Gemini处理文字、程式码、图像、音讯和视频,它能够更有效地应对多媒体输入,相较于使用单独但相互关联的人工智能模型对每种输入模式进行训练。

根据Google的一项研究报告,Gemini展现了卓越的综合能力。当面对一系列由三角形、正方形和五边形组成的形状时,Gemini能够准确猜测该系列中的下一个形状是六边形。在呈现月球和一只手拿着高尔夫球的照片,要求找到连结时,Gemini正确指出阿波罗太空人于1971年在月球上击中了两个高尔夫球。此外,该研究还呈现了Gemini处理手写物理问题的过程,包括一个简单的草图,找出学生的错误,并解释纠正方法。

但目前,Gemini Ultra正在等待进一步的测试才能在明年上市
Gemini Ultra目前正积极进行“红队合作”,制造商正在招募人员寻找安全漏洞和其他潜在问题。在涉及多媒体输入数据的情况下,这种测试变得更加复杂。举例来说,简讯和照片单独看可能是无害的,但一旦组合在一起,可能传达出完全不同的含义。

Sundar Pichai向外宣称:“我们正在以大胆而负责任的态度进行这项工作。” 这不仅代表着雄心勃勃的研究与巨大的潜在回报相结合,同时也显示出Google增加保障措施、与政府和其他机构合作以应对不断增强的人工智能风险的承诺。

至于该技术在解决问题能力方面,Google宣称Gemini特别擅长数学和物理。这让对人工智能乐观派燃起了希望,认为它可能会带来科学突破,改善人类的生活。但对人工智能发展持悲观看法的一派,则担心该技术最终会超越人类智能,导致数以百万计的工作流失,甚至可能产生更具破坏性的行为,例如放大错误讯息,或什至触发核武战争。

随着人工智能AI的迅猛发展,具备强大AI技能的人才将在未来担担更多职责,不仅限于传统的技术性工作,还包括具有高度创意性的工作任务。 AI的崛起不仅为自动化提供了更多可能性,也在业务领域中引入了更多的智慧和革新。这种变革将促使人们重新思考和定位自己在这个新时代的角色。

对于一般大众而言,AI的蓬勃发展也将为普通人提供更多机会找到自己的定位。随着AI自动化日益普及,人们将更多地投身于具有高度人文性和创意性的工作,这些领域往往需要人类的情感、直觉和艺术创造力。这种趋势将推动社会实现更大程度的多元化,使每个个体都能够发挥其独特的才华,融入AI时代的脉动。

因此,AI的普及并非仅仅是技术革新,更是一场引领人类重新定义工作与生活的革命。人们将面对更多的选择,从而找到更符合自身兴趣和天赋的工作方向。这种变革带来的机会和挑战将推动着整个社会向更加智慧和包容的方向发展,促使每个人都能在这个AI时代中找到属于自己的清晰定位。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • AMZN亞馬遜AWS本季營收同比增長20.2%到$309億!

    AMZN亚马逊AWS本季营收同比增长20.2%到$309亿!

    久等的AWS 提速终于到来:目前云业务的增速几乎成为了压倒一切、“决定生死” 的单一指标。而AWS 本季营收同比增长20.2% 到$309 亿,相比上季增速明显提升2.7pct。市场久久期待的AWS 增长再提速终于到来。

    AMZN亚马逊AWS本季营收同比增长20.2%到$309亿!

    久等的AWS 提速终于到来:目前云业务的增速几乎成为了压倒一切、“决定生死” 的单一指标。而AWS 本季营收同比增长20.2% 到$309 亿,相比上季增速明显提升2.7pct。市场久久期待的AWS 增长再提速终于到来。

  • AAPL蘋果2025財年第四季度營收1025億美元,同比增長7.9%!

    AAPL苹果2025财年第四季度营收1025亿美元,同比增长7.9%!

    本季度苹果公司实现营收1025 亿美元,同比增长7.9%,基本符合市场预期(1020 亿美元)。公司本季度收入端的提升,主要受益于iPhone、Mac 和软件服务业务增长的带动。苹果公司毛利率 47.2%,同比增加1pct,好于市场一致预期(46.6%)。

    AAPL苹果2025财年第四季度营收1025亿美元,同比增长7.9%!

    本季度苹果公司实现营收1025 亿美元,同比增长7.9%,基本符合市场预期(1020 亿美元)。公司本季度收入端的提升,主要受益于iPhone、Mac 和软件服务业务增长的带动。苹果公司毛利率 47.2%,同比增加1pct,好于市场一致预期(46.6%)。

  • RBLX業績指引隱含增速放緩?

    RBLX业绩指引隐含增速放缓?

    RBLX四季度指引隐含增速放缓过快:在三季度70% 的跳跃式增长下,四季度指引流水增速迅速放缓到50% 达到20 亿,意味着环比只增加了4%,年化未来一年的增速为17% 低于20% 的长期目标。

    RBLX业绩指引隐含增速放缓?

    RBLX四季度指引隐含增速放缓过快:在三季度70% 的跳跃式增长下,四季度指引流水增速迅速放缓到50% 达到20 亿,意味着环比只增加了4%,年化未来一年的增速为17% 低于20% 的长期目标。

  • META財報Opex蹭蹭漲,市場慌了?

    META财报Opex蹭蹭涨,市场慌了?

    META Opex 蹭蹭涨:大模型进展不顺,AI 实验室高薪挖人,挖完又大裁员。再加上高增长的折旧费用,引发市场对支出不受控的担忧。三季度这个担忧正在被印证:研发同比高增35%,管理支出因为法务支出、员工薪资高增等,同比更是增长了88%,彻底重回高增区间。

    META财报Opex蹭蹭涨,市场慌了?

    META Opex 蹭蹭涨:大模型进展不顺,AI 实验室高薪挖人,挖完又大裁员。再加上高增长的折旧费用,引发市场对支出不受控的担忧。三季度这个担忧正在被印证:研发同比高增35%,管理支出因为法务支出、员工薪资高增等,同比更是增长了88%,彻底重回高增区间。

  • MSFT微軟業績不俗,但Azure沒有意外之喜

    MSFT微软业绩不俗,但Azure没有意外之喜

    整体上,本季微软业绩不俗,几乎没有缺点,各项指标普遍好于预期。问题在于作为最被一致看多的标的,市场对微软的期待非常高。可以说,需要大幅度的超预期,才能再让市场感到惊喜。且本季核心Azure 增速并未好于买方预期,让市场对微软本季业绩反应平平。

    MSFT微软业绩不俗,但Azure没有意外之喜

    整体上,本季微软业绩不俗,几乎没有缺点,各项指标普遍好于预期。问题在于作为最被一致看多的标的,市场对微软的期待非常高。可以说,需要大幅度的超预期,才能再让市场感到惊喜。且本季核心Azure 增速并未好于买方预期,让市场对微软本季业绩反应平平。

  • GOOG谷歌2025年三季度財報,交了一份漂亮的業績!

    GOOG谷歌2025年三季度财报,交了一份漂亮的业绩!

    Alphabet 发布了2025 年三季度财报。在顶着OpenAI 的风头靠着全栈AI 的逻辑重估了两个月,直接修复空间有限、市场急需进一步上涨理由的时候,谷歌硬是交了一份漂亮的业绩,来延续自己的重估之路。

    GOOG谷歌2025年三季度财报,交了一份漂亮的业绩!

    Alphabet 发布了2025 年三季度财报。在顶着OpenAI 的风头靠着全栈AI 的逻辑重估了两个月,直接修复空间有限、市场急需进一步上涨理由的时候,谷歌硬是交了一份漂亮的业绩,来延续自己的重估之路。

  • 和獨響APP王登科聊:消失的附近、深度關系與AI帶來的新觸點 | 播客Podcast

    和独响APP王登科聊:消失的附近、深度关系与AI带来的新触点| 播客Podcast

    独响APP创造了复杂的行为Agent 模式,让AI 更立体,围绕你的生活,和你喜欢的AI角色建立舒服,正向,长期的关系,和TA们一起轻松创建你的自定义角色,不管开心还是难过,你可以获得足够的情绪支持,舒服,不累的建立和AI朋友们的关系。

    和独响APP王登科聊:消失的附近、深度关系与AI带来的新触点| 播客Podcast

    独响APP创造了复杂的行为Agent 模式,让AI 更立体,围绕你的生活,和你喜欢的AI角色建立舒服,正向,长期的关系,和TA们一起轻松创建你的自定义角色,不管开心还是难过,你可以获得足够的情绪支持,舒服,不累的建立和AI朋友们的关系。

  • INTC英特爾2025年第三季度財報毛利率環比大幅回升!

    INTC英特尔2025年第三季度财报毛利率环比大幅回升!

    INTC本季度实现营收136.5亿美元,同比微增2.8%,略超公司指引上限,主要是受客户端业务回暖的带动。本季度毛利率环比大幅回升至38.2%,明显好于指引预期(34.1%)。上季度毛利率的“闪崩”,主要是受非经营性费用影响。

    INTC英特尔2025年第三季度财报毛利率环比大幅回升!

    INTC本季度实现营收136.5亿美元,同比微增2.8%,略超公司指引上限,主要是受客户端业务回暖的带动。本季度毛利率环比大幅回升至38.2%,明显好于指引预期(34.1%)。上季度毛利率的“闪崩”,主要是受非经营性费用影响。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4