Google推出人工智能模型“Gemini”,或超越GPT-4?

Google推出人工智能模型“Gemini”,或超越GPT-4?

發布日期:

想法 Ideas 科技 Tech


要点:
谷歌表示,今天在Bard聊天机器人中推出的Gemini是其有史以来最强大的人工智能AI模型。它接受了影片、图像等方面的训练。迄今为止,Google一直在努力吸引与OpenAI的ChatGPT一样多的关注和用户。但随着科技的迅速发展,人们对人工智能AI潜在危害的担忧也在增加。即使人工智能模型能够将越来越复杂的提示转换为复杂的回应,但我们仍然需要谨慎,不能完全相信它们仅仅提供看似合理而非实际正确的答案。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

注意据12月8日最新消息:
在短短24小时内,大众最初对Google Gemini AI平台推出的热情已经消退,取而代之的是对其Gemini实践影片的争议。 Google发布的Gemini,据称是迄今为止最强大的人工智能AI模型套件,但目前已经被指控对其“性能撒谎”。

六分钟的影片展示了Gemini的多模式功能(例如,语音对话提示与影像辨识结合)。 Gemini似乎可以快速识别影像,即使是连点连线的图片,也能在几秒钟内做出回应,并即时追踪杯赛和球类比赛中的一叠纸。但点击YouTube上的这条影片却出现一个Google重要的免责声明:“出于本演示的目的,延迟已减少,并且为了简洁起见,Gemini输出也已缩短。”

Google对外承认,视频演示并不是通过语音提示实时进行的,而是使用原始素材中的静态图像帧,然后写出Gemini做出回应的文本提示。这一做法令不少专家认为,这与Google暗示的超强大人工智能AI工具完全不同,Google对外宣称,当Gemini观察周围的世界并即时做出反应时,一个人可以与Gemini进行流畅的语音对话。而事实上,并不是如此。

此外,Google类似的做法已经不是第一次。 Google早前的Duplex演示(一种人工智能语音助手,可以打电话给美发店和餐厅进行预订),也被质疑是预先录制的人工智能AI模型影片,明显缺乏环境噪音和真实员工的反应。而现在对于Gemini的“性能撒谎”,又引起了大众对其的质疑。不少专家认为,在这种情况下,Google是在“炫耀”,目的是误导人们,让他们忽视Gemini仍然落后于OpenAI的GPT的事实。但Gemini仍然是Google向前迈出的一大步,因为它希望与人工智慧先驱者ChatGPT保持同步,只是这可能不像最初想的如此大突破而已。

2023年12月6日原文:
在过去的十年中,Google一直是人工智能领域的领先巨头企业。目前,Google正迅速扩展其在人工智能AI领域的地位。尽管OpenAI的ChatGPT已经成为全球瞩目的现象,也是有史以来增长最快的消费产品之一,但截至今天,Bard已拥有来自170个国家/地区的英语用户。

今天,Google推出新的人工智能AI模型“Gemini”,据称该模型在多个方面甚至超越了OpenAI的技术水平,具有先进的“推理能力”,甚至在应对困难问题时表现得“更为深思熟虑”。

Gemini强大生成AI模式
Gemini代表了人工智能领域的一次巨大转变。虽然基于文字的聊天至关重要,但在我们身处不断变化的三维世界中,人类需要处理包括语言和图像等更丰富的信息,而不仅仅是简单的文字。因此,Gemini成为了一种备受瞩目的新尝试。

据Google表示,Gemini有三个版本,针对不同的运算能力等级
Gemini Nano运行在手机上,有两个版本供应不同级别的可用记忆体使用。它将支持Google Pixel 8手机上的新功能,例如在Recorder应用程式中总结对话,或在使用Google Gboard输入的WhatsApp中回覆消息。

Gemini Pro专为快速响应而设计,在Google资料中心运行,将从周三开始为新版本的Bard提供支援。

Gemini Ultra目前仅限于测试小组,预计将于2024年初在新的Bard Advanced聊天机器人中提供。虽然Google拒绝透露定价细节,但预计这项顶级功能将需要支付额外的费用。

Google Bard和Assistant的主管对外表示,Gemini是Bard至今最大、最优越的一次升级。 Google执行长桑达尔·皮查伊/Sundar Pichai也分享道,“我相信Gemini可以更好地理解使用者的意图,也能够以更真实、更高品质的方式作出回应。”

目前,Bard虽然只是一个聊天机器人:你输入文字,它回应文字。然而明年,Google计划推出由Gemini Ultra提供支援的“Bard Advanced”预览版,这将是Google新的大型语言模型中最强大且功能最丰富的版本。此外,Gemini Ultra也是该模型的多模式版本,这意味着除了文字之外,它还能够处理和生成图像、音讯和视讯。

Google DeepMind的主管Demis Hassabis表示,非文字互动是Gemini的一大亮点。 “我们从一开始就设计它成为原生多模式,这是它的新功能之一,能够无缝整合和进行跨模式推理。”之前,Gemini已经通过解决数学和人文等57个学科领域的问题,展示了其问题解决能力和知识水平。

Gemini具有跨足文字、图像、音讯、视讯和程式码的推理能力。此外,它还能够参与使用者的互动,执行创建游戏、解决视觉谜题、建立连结、生成图像与文本、进行逻辑与空间推理、进行视觉翻译、理解文化等具有创意性的任务。以下一段示范影片展示了Gemini在辨识蓝色鸭子、手偶、戏法等任务时表现出来的强大理解能力、想象能力和创造力。

Sundar Pichai强调,Gemini的推出标志着人工智能的“新时代”。 Gemini具备辨识和生成文字、图像以及音讯的能力,但值得注意的是,Gemini本身并非一个独立的产品。相反,它是一个基础模型,这意味着它将被融合进Google现有的工具中,包括搜寻和Bard。

人工智能竞赛火热进行
Google的新版本凸显了生成式人工智能领域的迅速进展,这使得聊天机器人能够根据我们以简单语言而非复杂程式指令编写的提示来生成自己的回应。

值得注意的是,谷歌的主要竞争对手OpenAI在一年前推出了ChatGPT,抢占了先机,但谷歌已经进行了三次重大的人工智能模型修订,期望通过数十亿用户使用的产品(如搜索、 Chrome、谷歌文档)来推广这一技术,甚至包括Gmail。 Gartner分析师Chirag Dekate指出,Gemini似乎设立了一个“新标准”,强调其具备从文字以外的来源学习的能力。他表示,这可能引发生成式人工智能领域的创新变革。

迄今为止,Google一直在努力吸引与OpenAI的ChatGPT一样多的关注和用户。与此同时,OpenAI的更强大软体新版本将于明年发布。最近OpenAI的动荡,Altman在几天之内被解雇又重新受聘,这是否会对这一次的发布产生任何影响还有待观察。此外,Google还面临来自Elon Musk的xAI的新竞争,该公司近日正寻求筹集最多10亿美元进行研发投资。在中国,百度公司也正在推出自己的人工智能产品。面对来自不同国家和地区的“直面竞争”,Gemini面临着机遇的同时,也面临着对应的挑战。

随着科技的迅速发展,人们对人工智能AI潜在危害的担忧也在增加。世界各国政府正在努力制定规则甚至立法来遏制人工智慧未来可能出现的风险。早在今年11月,英国峰会上讨论了该主题,签署方同意了一项呼吁其安全开发的声明。此外,英国还表示,需要以紧迫感、团结和集体力量来应对人工智能可能带来的危险。

人工智能变得更聪明但并不完美
随着多媒体的崛起,人工智能AI可能带来显著的变革。即使人工智能模型能够将越来越复杂的提示转换为复杂的回应,但我们仍然需要谨慎,不能完全相信它们仅仅提供看似合理而非实际正确的答案。正如Google的聊天机器人在使用时所警告的那样,“Bard可能会呈现不准确的信息,包括有关个人的信息,因此请仔细检查其回复的答案。”

Gemini代表了Google大型语言模型的下一代,是PaLM和PaLM 2的延续,这两者迄今为止一直是Bard的基础。然而,透过同时训练Gemini处理文字、程式码、图像、音讯和视频,它能够更有效地应对多媒体输入,相较于使用单独但相互关联的人工智能模型对每种输入模式进行训练。

根据Google的一项研究报告,Gemini展现了卓越的综合能力。当面对一系列由三角形、正方形和五边形组成的形状时,Gemini能够准确猜测该系列中的下一个形状是六边形。在呈现月球和一只手拿着高尔夫球的照片,要求找到连结时,Gemini正确指出阿波罗太空人于1971年在月球上击中了两个高尔夫球。此外,该研究还呈现了Gemini处理手写物理问题的过程,包括一个简单的草图,找出学生的错误,并解释纠正方法。

但目前,Gemini Ultra正在等待进一步的测试才能在明年上市
Gemini Ultra目前正积极进行“红队合作”,制造商正在招募人员寻找安全漏洞和其他潜在问题。在涉及多媒体输入数据的情况下,这种测试变得更加复杂。举例来说,简讯和照片单独看可能是无害的,但一旦组合在一起,可能传达出完全不同的含义。

Sundar Pichai向外宣称:“我们正在以大胆而负责任的态度进行这项工作。” 这不仅代表着雄心勃勃的研究与巨大的潜在回报相结合,同时也显示出Google增加保障措施、与政府和其他机构合作以应对不断增强的人工智能风险的承诺。

至于该技术在解决问题能力方面,Google宣称Gemini特别擅长数学和物理。这让对人工智能乐观派燃起了希望,认为它可能会带来科学突破,改善人类的生活。但对人工智能发展持悲观看法的一派,则担心该技术最终会超越人类智能,导致数以百万计的工作流失,甚至可能产生更具破坏性的行为,例如放大错误讯息,或什至触发核武战争。

随着人工智能AI的迅猛发展,具备强大AI技能的人才将在未来担担更多职责,不仅限于传统的技术性工作,还包括具有高度创意性的工作任务。 AI的崛起不仅为自动化提供了更多可能性,也在业务领域中引入了更多的智慧和革新。这种变革将促使人们重新思考和定位自己在这个新时代的角色。

对于一般大众而言,AI的蓬勃发展也将为普通人提供更多机会找到自己的定位。随着AI自动化日益普及,人们将更多地投身于具有高度人文性和创意性的工作,这些领域往往需要人类的情感、直觉和艺术创造力。这种趋势将推动社会实现更大程度的多元化,使每个个体都能够发挥其独特的才华,融入AI时代的脉动。

因此,AI的普及并非仅仅是技术革新,更是一场引领人类重新定义工作与生活的革命。人们将面对更多的选择,从而找到更符合自身兴趣和天赋的工作方向。这种变革带来的机会和挑战将推动着整个社会向更加智慧和包容的方向发展,促使每个人都能在这个AI时代中找到属于自己的清晰定位。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • 以色列科技創新,中國能學到什麼?硬科技VC的十年復盤 | 播客Podcast

    以色列科技创新,中国能学到什么?硬科技VC的十年复盘| 播客Podcast

    对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业,经过大浪淘沙,在整个中国VC行业经历巨大转变之际,仍然活在牌桌上。其中,既有硬科技领域的扎实累积、方​​法论,也能看出,他们充分利用了中国市场和人才。

    以色列科技创新,中国能学到什么?硬科技VC的十年复盘| 播客Podcast

    对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业,经过大浪淘沙,在整个中国VC行业经历巨大转变之际,仍然活在牌桌上。其中,既有硬科技领域的扎实累积、方​​法论,也能看出,他们充分利用了中国市场和人才。

  • LULU財報營收不及市場預期,表現讓人失望!

    LULU财报营收不及市场预期,表现让人失望!

    整体上,不达预期的二季度业绩加上再次下修的全年指引,使得公司盘后估计再次暴跌15% 以上,核心还是在于无论是本季度的业绩,还是公司对未来的指引,非但没有成长性的边际好转反而还在恶化,没季财报噩耗连珠,因此只能继续杀估值。

    LULU财报营收不及市场预期,表现让人失望!

    整体上,不达预期的二季度业绩加上再次下修的全年指引,使得公司盘后估计再次暴跌15% 以上,核心还是在于无论是本季度的业绩,还是公司对未来的指引,非但没有成长性的边际好转反而还在恶化,没季财报噩耗连珠,因此只能继续杀估值。

  • 對話前OpenAI科學家:GPT-5能獲得奧賽金牌,但那可能具有欺騙性? | 播客Podcast

    对话前OpenAI科学家:GPT-5能获得奥赛金牌,但那可能具有欺骗性? | 播客Podcast

    对话OpenAI 的两位前科学家:Kenneth Stanley和Joel Lehman;他们曾亲历前ChatGPT 时代的OpenAI,也是《为什么伟大不能被计划》一书的作者。 2023 年,这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

    对话前OpenAI科学家:GPT-5能获得奥赛金牌,但那可能具有欺骗性? | 播客Podcast

    对话OpenAI 的两位前科学家:Kenneth Stanley和Joel Lehman;他们曾亲历前ChatGPT 时代的OpenAI,也是《为什么伟大不能被计划》一书的作者。 2023 年,这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

  • BABA最新財報,阿里雲增長和利潤率雙提升

    BABA最新财报,阿里云增长和利润率双提升

    BABA 最新一季业绩,整体来看虽因外卖大战导致的亏损同样比预期要高,但相比京东、美团两家的利润清空,明显要好。且除此之外几乎没有缺点,CMR 保持不俗增长,阿里云增长和利润率双提升,国际电商板块也超预期近乎扭亏,整体来看无疑不错。

    BABA最新财报,阿里云增长和利润率双提升

    BABA 最新一季业绩,整体来看虽因外卖大战导致的亏损同样比预期要高,但相比京东、美团两家的利润清空,明显要好。且除此之外几乎没有缺点,CMR 保持不俗增长,阿里云增长和利润率双提升,国际电商板块也超预期近乎扭亏,整体来看无疑不错。

  • NVDA英偉達財報整體符合預期

    NVDA英伟达财报整体符合预期

    NVDA 本季度计算收入338.4 亿美元,网络业务收入72.5 亿美元。其中本季度计算收入环比增长有所放缓,主要受H20 被禁售向中国的影响。由于下游部分客户更加期待后续量产的GB300 产品,各家也陆续调高了下半年的资本开支。

    NVDA英伟达财报整体符合预期

    NVDA 本季度计算收入338.4 亿美元,网络业务收入72.5 亿美元。其中本季度计算收入环比增长有所放缓,主要受H20 被禁售向中国的影响。由于下游部分客户更加期待后续量产的GB300 产品,各家也陆续调高了下半年的资本开支。

  • BILI嗶哩嗶哩2025年二季度財報,整體收入基本符合指引

    BILI哔哩哔哩2025年二季度财报,整体收入基本符合指引

    BILI利润超预期,这次亮点仍然是盈利端,明显超市场预期,但主要是营销费用较低带来。二季度虽然没新游本身营销费用理应不多,但《三谋》有周年庆活动,年初几次赛季更新变动也不小,因此也并非完全不需要额外的营销。

    BILI哔哩哔哩2025年二季度财报,整体收入基本符合指引

    BILI利润超预期,这次亮点仍然是盈利端,明显超市场预期,但主要是营销费用较低带来。二季度虽然没新游本身营销费用理应不多,但《三谋》有周年庆活动,年初几次赛季更新变动也不小,因此也并非完全不需要额外的营销。

  • BIDU百度二季度業績略超預期

    BIDU百度二季度业绩略超预期

    百度智慧云预期中高增长:云业务在当下是风口,高增长自然没得说。不过少了上季度的惊艳,二季度的27% 增长符合市场大部分预期,利好早已经打入估值。广告陷痛苦转型期:转型的阵痛开始变得醒目,目前搜索结果中AI 生成内容的渗透率已经提高至64%。

    BIDU百度二季度业绩略超预期

    百度智慧云预期中高增长:云业务在当下是风口,高增长自然没得说。不过少了上季度的惊艳,二季度的27% 增长符合市场大部分预期,利好早已经打入估值。广告陷痛苦转型期:转型的阵痛开始变得醒目,目前搜索结果中AI 生成内容的渗透率已经提高至64%。

  • LABUBU泡泡瑪特2025年H1業績,利潤均超過了去年全年水平

    LABUBU泡泡玛特2025年H1业绩,利润均超过了去年全年水平

    THE MONSTERS 系列目前作为泡泡玛特的第一大IP,经过近一年的“狂飙”,目前销售占比已经接近35%,这还是在公司主动控货的情况下。这意味着明年在高基数的情况下,如果消费者对LABUBU 产生审美疲劳,对泡泡玛特整体的业绩冲击会比较大。

    LABUBU泡泡玛特2025年H1业绩,利润均超过了去年全年水平

    THE MONSTERS 系列目前作为泡泡玛特的第一大IP,经过近一年的“狂飙”,目前销售占比已经接近35%,这还是在公司主动控货的情况下。这意味着明年在高基数的情况下,如果消费者对LABUBU 产生审美疲劳,对泡泡玛特整体的业绩冲击会比较大。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4