阿里巴巴推出Qwen2.5-VL模型,成為全球AI格局下的新競爭者?

阿里巴巴推出Qwen2.5-VL模型,成为全球AI格局下的新竞争者?

發布日期:

商業 Business 狂呼金融 Convo Finance 科技 Tech


要点:
中国AI初创公司DeepSeek的崛起震撼全球科技市场,并激发了阿里巴巴等中国科技巨头的再度关注,推动其股价大幅上涨。

近日,中国AI初创公司DeepSeek的爆火引起了全球科技行业的巨大震动。然而随着大众对DeepSeek的关注逐渐升温,阿里巴巴等中国科技公司也被再次聚焦。

实际上,早在1月26日,阿里巴巴已发布了其最新的Qwen2.5-1M模型又名“通义千问”,纷纷加入到这场激烈的人工智能竞争之中。受此影响,今天阿里巴巴(BABA)的股价在美股市场上大幅上涨,显示出投资者对其未来发展前景的高度信心。

阿里巴巴全新人工智能模型

近日,阿里巴巴的Qwen团队推出了全新的人工智能AI模型家族Qwen2.5-VL,这些模型能够执行多项文字与图像分析任务,包括档案解析、影片理解、影像物件识别以及PC控制,功能类似于OpenAI近期发布的“Operator”模型。

根据Qwen团队的基准测试,Qwen2.5-VL在视频理解、数学计算、文件分析以及问答评估等多个领域的表现超越了OpenAI的GPT-4、Anthropic的Claude 3.5 Sonnet和Google的Gemini 2.0 Flash等竞争对手。

Qwen2.5-VL是一款多模态模型,旨在将文字提示与图像或视频资料结合,转换为标记,并预测统计上最可能的输出标记,最终生成响应。与所有大型语言模型/LLM及相关系统类似,Qwen2.5-VL的回应有时可能不会直接与查询的正确答案相对应。

其创建者宣称,Qwen2.5-VL具有“直观理解事物”的能力,虽然实际上并不进行真实理解,而是根据文字、图表和其他图形所提供的内容来生成回应,并能处理物件和场景的分析。

相比先前的模型,Qwen2.5-VL的最大升级之一是能处理长度超过一小时的视频内容,并精确定位影片中的特定事件,通过时间戳来标记。图像中的物体可以用边界框进行本地化,并附带JSON格式的数据,输出的结果不仅限于纯文字,还可以是结构化的数据。更重要的是,Qwen2.5-VL被设计为具备“代理功能”,意味着它不仅能生成回应,还能根据用户指令主动执行行动,协助完成特定任务。

该模型作为视觉代理,能够推理并引导工具进行动作。它不仅可以在电脑和手机上操作,还能在多种应用中执行具体任务。举例来说,Qwen2.5-VL可以在航空公司应用中预订航班,使用浏览器查找天气预报,利用影像编辑器调整照片的色彩鲜艳度,甚至能安装Microsoft Visual Studio Code/VS Code扩充功能,展示了它强大的实用性与多样性。

目前,Qwen2.5-VL模型可在阿里巴巴的Qwen Chat应用程式中测试,并可以从人工智能AI开发平台Hugging Face下载。该模型能够分析图表和图形,从发票和表格扫描中提取数据,并“理解”多小时的长内容。

Qwen团队对此表示,Qwen2.5-VL能识别电影和电视剧中的知识产权/IP以及各种产品,暗示该模型可能经过受版权保护内容的训练。尽管如此,Qwen2.5-VL在敏感政治话题上有所限制,当要求该模型讨论如“习近平的错误”时,它会抛出错误讯息,这反映了中国网络监管机构对本土开发模型的控制,要求其遵守社会主义核心价值观。

此外,Qwen2.5-VL的另一大亮点是其能与PC及移动装置上的应用程式互动,进一步拓宽了其应用范围。一段由Hugging Face技术负责人Philipp Schmid发布的影片显示,Qwen2.5-VL成功启动并预订了Android版Booking.com的机票,显示了其操作真实世界软体的能力。

Qwen高级计算机和AI移动代理示例:移动使用帮助我送我的QQ好友变三,放牧一新春祝福

性能媲美全球领先竞争者

Qwen宣称其最新的大型模型Qwen2.5-VL-72B-Instruct拥有720亿个参数,在各类任务中的表现与Google的Gemini-2 Flash、OpenAI的GPT-4o以及Anthropic的Claude 3.5 Sonnet模型相当,甚至在某些领域(如文件分析)略有优势。同时,较小的Qwen2.5-VL-7B模型在性能上与GPT-4o-Mini竞争力十足,而参数数量为30亿的Qwen2.5-VL-3B模型则能够匹配或超越Qwen自家最新一代Qwen2-VL-7B参数数量超过两倍的模型。

Qwen在HuggingFace上发布了三种不同尺寸的新模型,并为每个版本提供了不同的许可证。拥有720亿参数的大型模型使用Qwen License,允许免费使用和修改,但商业用途仅限于月活跃用户/MAU低于1亿的服务、拥有30亿参数的小型模型则使用Qwen Research许可证,禁止商业用途,而中等规模的70亿参数模型则采用了更为宽松的Apache License 2.0许可证。

阿里巴巴子公司Qwen在谈到其最新模型系列时表示,“我们发布了Qwen2.5-VL,这是Qwen的新旗舰视觉语言模型,也是较之前的Qwen2-VL的重大飞跃。”就旗舰型号Qwen2.5-VL-72B-Instruct而言,它在一系列涵盖领域和任务的基准测试中取得了具有竞争力的表现,包括大学级问题、数学、文档理解、一般问答、视频理解且值得注意的是,Qwen2.5-VL在理解文件和图表方面具有显著优势,并且无需针对特定任务进行微调即可充当视觉代理。

尽管如此,Qwen2.5-VL在操作系统基准测试/OSWorld中的表现较为一般,并未达到预期的高效能。而该系列中的两个较小型号Qwen2.5-VL-3B和Qwen2.5-VL-7B已可供许可使用,但旗舰型号Qwen2.5-VL-72B则要求获得阿里巴巴的专门许可,尤其是对于每月活跃用户超过一亿的企业和开发者,需在商业部署前申请许可。

近期DeepSeek的崛起,全球科技界的竞争格局发生了显著变化,特别是在中国科技公司在人工智能领域的竞争力逐步提升之际。中国的AI企业不仅在技术创新方面取得突破,还成功挑战了西方科技巨头的市场领导地位。阿里巴巴最新推出的Qwen2.5-VL模型家族,正是这股技术创新浪潮中的代表之一。

随着AI技术的日益成熟,企业对于AI的需求已不仅限于提升效率,更多的是将其应用于日常操作中,解决更复杂的问题。阿里巴巴的Qwen2.5-VL就是这种需求的具体体现,它不仅在多个领域的基准测试中表现出色,还能与PC及移动设备的应用程式进行深度交互,拓宽了人工智能技术的边界。更重要的是,随着阿里巴巴的这些突破性产品的发布,其在全球AI市场中的影响力正在持续增强,对竞争者构成了前所未有的挑战。这不仅为中国科技企业提供了更多的发展机会,也让全球科技生态系统面临着新的竞争态势,促使行业快速向前发展。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • BILI嗶哩嗶哩2025年二季度財報,整體收入基本符合指引

    BILI哔哩哔哩2025年二季度财报,整体收入基本符合指引

    BILI利润超预期,这次亮点仍然是盈利端,明显超市场预期,但主要是营销费用较低带来。二季度虽然没新游本身营销费用理应不多,但《三谋》有周年庆活动,年初几次赛季更新变动也不小,因此也并非完全不需要额外的营销。

    BILI哔哩哔哩2025年二季度财报,整体收入基本符合指引

    BILI利润超预期,这次亮点仍然是盈利端,明显超市场预期,但主要是营销费用较低带来。二季度虽然没新游本身营销费用理应不多,但《三谋》有周年庆活动,年初几次赛季更新变动也不小,因此也并非完全不需要额外的营销。

  • BIDU百度二季度業績略超預期

    BIDU百度二季度业绩略超预期

    百度智慧云预期中高增长:云业务在当下是风口,高增长自然没得说。不过少了上季度的惊艳,二季度的27% 增长符合市场大部分预期,利好早已经打入估值。广告陷痛苦转型期:转型的阵痛开始变得醒目,目前搜索结果中AI 生成内容的渗透率已经提高至64%。

    BIDU百度二季度业绩略超预期

    百度智慧云预期中高增长:云业务在当下是风口,高增长自然没得说。不过少了上季度的惊艳,二季度的27% 增长符合市场大部分预期,利好早已经打入估值。广告陷痛苦转型期:转型的阵痛开始变得醒目,目前搜索结果中AI 生成内容的渗透率已经提高至64%。

  • LABUBU泡泡瑪特2025年H1業績,利潤均超過了去年全年水平

    LABUBU泡泡玛特2025年H1业绩,利润均超过了去年全年水平

    THE MONSTERS 系列目前作为泡泡玛特的第一大IP,经过近一年的“狂飙”,目前销售占比已经接近35%,这还是在公司主动控货的情况下。这意味着明年在高基数的情况下,如果消费者对LABUBU 产生审美疲劳,对泡泡玛特整体的业绩冲击会比较大。

    LABUBU泡泡玛特2025年H1业绩,利润均超过了去年全年水平

    THE MONSTERS 系列目前作为泡泡玛特的第一大IP,经过近一年的“狂飙”,目前销售占比已经接近35%,这还是在公司主动控货的情况下。这意味着明年在高基数的情况下,如果消费者对LABUBU 产生审美疲劳,对泡泡玛特整体的业绩冲击会比较大。

  • 小米2025年第二季度財報,汽車業務毛利率繼續提升!

    小米2025年第二季度财报,汽车业务毛利率继续提升!

    小米公司本季度汽车出货量8.1 万台,单车均价进一步提升至25.3 万元。主要是受Ultra 车型等高价车型出货,结构性带动均价提升。本季度汽车业务毛利率继续提升至26.4%,再超市场预期23.5%,主要是受均价提升和规模效应的带动。

    小米2025年第二季度财报,汽车业务毛利率继续提升!

    小米公司本季度汽车出货量8.1 万台,单车均价进一步提升至25.3 万元。主要是受Ultra 车型等高价车型出货,结构性带动均价提升。本季度汽车业务毛利率继续提升至26.4%,再超市场预期23.5%,主要是受均价提升和规模效应的带动。

  • 本周資本市場推測9月降息的聲音越來越響亮

    本周资本市场推测9月降息的声音越来越响亮

    降息之路并非一帆风顺。市场时而充满期待,时而又因联准会未如预期行动而感到失望。然而,专家们仍认为利率走势有望保持在相对低位。随着通膨持续疲弱、劳动市场压力逐步显现,风险平衡正加速倾向降息。

    本周资本市场推测9月降息的声音越来越响亮

    降息之路并非一帆风顺。市场时而充满期待,时而又因联准会未如预期行动而感到失望。然而,专家们仍认为利率走势有望保持在相对低位。随着通膨持续疲弱、劳动市场压力逐步显现,风险平衡正加速倾向降息。

  • 美國政府正考慮入股英特爾,新模式或重塑全球芯片產業格局?

    美国政府正考虑入股英特尔,新模式或重塑全球芯片产业格局?

    美国政府正在与芯片制造商英特尔/Intel进行谈判,希望入股这家陷入困境的公司。随后该公司股价周四上涨7% 。这一消息的传出,标志着美国政府将自己置于关键产业核心的决心,并符合特朗普总统长期以来呼吁在美国本土生产更多芯片和高科技产品的政策主张。

    美国政府正考虑入股英特尔,新模式或重塑全球芯片产业格局?

    美国政府正在与芯片制造商英特尔/Intel进行谈判,希望入股这家陷入困境的公司。随后该公司股价周四上涨7% 。这一消息的传出,标志着美国政府将自己置于关键产业核心的决心,并符合特朗普总统长期以来呼吁在美国本土生产更多芯片和高科技产品的政策主张。

  • 中加貿易戰升級:中國對加拿大油菜籽徵收75.8%關稅

    中加贸易战升级:中国对加拿大油菜籽征收75.8%关税

    中加两国持续一年的贸易争端再次升级。中国于本周二宣布,将对从加拿大进口的“油菜籽/Canola”加征高达75.8%的临时反倾销税,此举是对去年加拿大对中国电动汽车征收关税的最新反制。这项突如其来的关税政策,立即在加拿大油籽市场引发剧烈震荡。

    中加贸易战升级:中国对加拿大油菜籽征收75.8%关税

    中加两国持续一年的贸易争端再次升级。中国于本周二宣布,将对从加拿大进口的“油菜籽/Canola”加征高达75.8%的临时反倾销税,此举是对去年加拿大对中国电动汽车征收关税的最新反制。这项突如其来的关税政策,立即在加拿大油籽市场引发剧烈震荡。

  • 騰訊2025年二季度業績,股王依舊穩得讓人安心

    腾讯2025年二季度业绩,股王依旧稳得让人安心

    腾讯毛利率主要是因为游戏、广告等本身高利润率的业务占比提升,聚焦长青游戏IP 开发的战略,也使得近两年新游的变现效率高于以往。而费用上,增长主要体现在由AI 带来的的服务器带宽、设备折旧上,以及研发人员的成本,但整体看均相对可控。

    腾讯2025年二季度业绩,股王依旧稳得让人安心

    腾讯毛利率主要是因为游戏、广告等本身高利润率的业务占比提升,聚焦长青游戏IP 开发的战略,也使得近两年新游的变现效率高于以往。而费用上,增长主要体现在由AI 带来的的服务器带宽、设备折旧上,以及研发人员的成本,但整体看均相对可控。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4