阿里巴巴推出Qwen2.5-VL模型,成為全球AI格局下的新競爭者?

阿里巴巴推出Qwen2.5-VL模型,成为全球AI格局下的新竞争者?

發布日期:

商業 Business 狂呼金融 Convo Finance 科技 Tech


要点:
中国AI初创公司DeepSeek的崛起震撼全球科技市场,并激发了阿里巴巴等中国科技巨头的再度关注,推动其股价大幅上涨。

近日,中国AI初创公司DeepSeek的爆火引起了全球科技行业的巨大震动。然而随着大众对DeepSeek的关注逐渐升温,阿里巴巴等中国科技公司也被再次聚焦。

实际上,早在1月26日,阿里巴巴已发布了其最新的Qwen2.5-1M模型又名“通义千问”,纷纷加入到这场激烈的人工智能竞争之中。受此影响,今天阿里巴巴(BABA)的股价在美股市场上大幅上涨,显示出投资者对其未来发展前景的高度信心。

阿里巴巴全新人工智能模型

近日,阿里巴巴的Qwen团队推出了全新的人工智能AI模型家族Qwen2.5-VL,这些模型能够执行多项文字与图像分析任务,包括档案解析、影片理解、影像物件识别以及PC控制,功能类似于OpenAI近期发布的“Operator”模型。

根据Qwen团队的基准测试,Qwen2.5-VL在视频理解、数学计算、文件分析以及问答评估等多个领域的表现超越了OpenAI的GPT-4、Anthropic的Claude 3.5 Sonnet和Google的Gemini 2.0 Flash等竞争对手。

Qwen2.5-VL是一款多模态模型,旨在将文字提示与图像或视频资料结合,转换为标记,并预测统计上最可能的输出标记,最终生成响应。与所有大型语言模型/LLM及相关系统类似,Qwen2.5-VL的回应有时可能不会直接与查询的正确答案相对应。

其创建者宣称,Qwen2.5-VL具有“直观理解事物”的能力,虽然实际上并不进行真实理解,而是根据文字、图表和其他图形所提供的内容来生成回应,并能处理物件和场景的分析。

相比先前的模型,Qwen2.5-VL的最大升级之一是能处理长度超过一小时的视频内容,并精确定位影片中的特定事件,通过时间戳来标记。图像中的物体可以用边界框进行本地化,并附带JSON格式的数据,输出的结果不仅限于纯文字,还可以是结构化的数据。更重要的是,Qwen2.5-VL被设计为具备“代理功能”,意味着它不仅能生成回应,还能根据用户指令主动执行行动,协助完成特定任务。

该模型作为视觉代理,能够推理并引导工具进行动作。它不仅可以在电脑和手机上操作,还能在多种应用中执行具体任务。举例来说,Qwen2.5-VL可以在航空公司应用中预订航班,使用浏览器查找天气预报,利用影像编辑器调整照片的色彩鲜艳度,甚至能安装Microsoft Visual Studio Code/VS Code扩充功能,展示了它强大的实用性与多样性。

目前,Qwen2.5-VL模型可在阿里巴巴的Qwen Chat应用程式中测试,并可以从人工智能AI开发平台Hugging Face下载。该模型能够分析图表和图形,从发票和表格扫描中提取数据,并“理解”多小时的长内容。

Qwen团队对此表示,Qwen2.5-VL能识别电影和电视剧中的知识产权/IP以及各种产品,暗示该模型可能经过受版权保护内容的训练。尽管如此,Qwen2.5-VL在敏感政治话题上有所限制,当要求该模型讨论如“习近平的错误”时,它会抛出错误讯息,这反映了中国网络监管机构对本土开发模型的控制,要求其遵守社会主义核心价值观。

此外,Qwen2.5-VL的另一大亮点是其能与PC及移动装置上的应用程式互动,进一步拓宽了其应用范围。一段由Hugging Face技术负责人Philipp Schmid发布的影片显示,Qwen2.5-VL成功启动并预订了Android版Booking.com的机票,显示了其操作真实世界软体的能力。

Qwen高级计算机和AI移动代理示例:移动使用帮助我送我的QQ好友变三,放牧一新春祝福

性能媲美全球领先竞争者

Qwen宣称其最新的大型模型Qwen2.5-VL-72B-Instruct拥有720亿个参数,在各类任务中的表现与Google的Gemini-2 Flash、OpenAI的GPT-4o以及Anthropic的Claude 3.5 Sonnet模型相当,甚至在某些领域(如文件分析)略有优势。同时,较小的Qwen2.5-VL-7B模型在性能上与GPT-4o-Mini竞争力十足,而参数数量为30亿的Qwen2.5-VL-3B模型则能够匹配或超越Qwen自家最新一代Qwen2-VL-7B参数数量超过两倍的模型。

Qwen在HuggingFace上发布了三种不同尺寸的新模型,并为每个版本提供了不同的许可证。拥有720亿参数的大型模型使用Qwen License,允许免费使用和修改,但商业用途仅限于月活跃用户/MAU低于1亿的服务、拥有30亿参数的小型模型则使用Qwen Research许可证,禁止商业用途,而中等规模的70亿参数模型则采用了更为宽松的Apache License 2.0许可证。

阿里巴巴子公司Qwen在谈到其最新模型系列时表示,“我们发布了Qwen2.5-VL,这是Qwen的新旗舰视觉语言模型,也是较之前的Qwen2-VL的重大飞跃。”就旗舰型号Qwen2.5-VL-72B-Instruct而言,它在一系列涵盖领域和任务的基准测试中取得了具有竞争力的表现,包括大学级问题、数学、文档理解、一般问答、视频理解且值得注意的是,Qwen2.5-VL在理解文件和图表方面具有显著优势,并且无需针对特定任务进行微调即可充当视觉代理。

尽管如此,Qwen2.5-VL在操作系统基准测试/OSWorld中的表现较为一般,并未达到预期的高效能。而该系列中的两个较小型号Qwen2.5-VL-3B和Qwen2.5-VL-7B已可供许可使用,但旗舰型号Qwen2.5-VL-72B则要求获得阿里巴巴的专门许可,尤其是对于每月活跃用户超过一亿的企业和开发者,需在商业部署前申请许可。

近期DeepSeek的崛起,全球科技界的竞争格局发生了显著变化,特别是在中国科技公司在人工智能领域的竞争力逐步提升之际。中国的AI企业不仅在技术创新方面取得突破,还成功挑战了西方科技巨头的市场领导地位。阿里巴巴最新推出的Qwen2.5-VL模型家族,正是这股技术创新浪潮中的代表之一。

随着AI技术的日益成熟,企业对于AI的需求已不仅限于提升效率,更多的是将其应用于日常操作中,解决更复杂的问题。阿里巴巴的Qwen2.5-VL就是这种需求的具体体现,它不仅在多个领域的基准测试中表现出色,还能与PC及移动设备的应用程式进行深度交互,拓宽了人工智能技术的边界。更重要的是,随着阿里巴巴的这些突破性产品的发布,其在全球AI市场中的影响力正在持续增强,对竞争者构成了前所未有的挑战。这不仅为中国科技企业提供了更多的发展机会,也让全球科技生态系统面临着新的竞争态势,促使行业快速向前发展。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • NVDA財報超市場預期,總收入570億美元!

    NVDA财报超市场预期,总收入570亿美元!

    随着英伟达数据中心的持续增长,当前已经成为公司收入中最大的一项,占比已经接近9 成。作为公司此前主要收入来源的游戏业务,占比已经被压缩至1 成左右。其主要产品包括Blackwell、Hopper 等算力芯片,公司的核心客户是亚马逊、微软、谷歌等云服务大厂。

    NVDA财报超市场预期,总收入570亿美元!

    随着英伟达数据中心的持续增长,当前已经成为公司收入中最大的一项,占比已经接近9 成。作为公司此前主要收入来源的游戏业务,占比已经被压缩至1 成左右。其主要产品包括Blackwell、Hopper 等算力芯片,公司的核心客户是亚马逊、微软、谷歌等云服务大厂。

  • QCOM高通財報,業績相對平淡

    QCOM高通财报,业绩相对平淡

    高通公司本季度业绩相对平淡,收入端的超预期主要来自于旗舰新品的提前发布。至于本季度利润端的回落,主要是受公司计入57 亿美元的递延税资产准备金影响。若剔除该影响,公司本季度的净利润约为26 亿美元。

    QCOM高通财报,业绩相对平淡

    高通公司本季度业绩相对平淡,收入端的超预期主要来自于旗舰新品的提前发布。至于本季度利润端的回落,主要是受公司计入57 亿美元的递延税资产准备金影响。若剔除该影响,公司本季度的净利润约为26 亿美元。

  • AMD財報,市場對數據中心AI Capex依然火熱

    AMD财报,市场对数据中心AI Capex依然火热

    AMD 在2025 年第三季度实现营收92.5 亿美元,同比增长35.6%,市场预期(87.4 亿美元)。收入端的同比增长,主要来自于客户端及游戏业务、数据中心业务的带动。公司本季度毛利率(GAAP)51.7%,同比提升1.6pct。

    AMD财报,市场对数据中心AI Capex依然火热

    AMD 在2025 年第三季度实现营收92.5 亿美元,同比增长35.6%,市场预期(87.4 亿美元)。收入端的同比增长,主要来自于客户端及游戏业务、数据中心业务的带动。公司本季度毛利率(GAAP)51.7%,同比提升1.6pct。

  • AMZN亞馬遜AWS本季營收同比增長20.2%到$309億!

    AMZN亚马逊AWS本季营收同比增长20.2%到$309亿!

    久等的AWS 提速终于到来:目前云业务的增速几乎成为了压倒一切、“决定生死” 的单一指标。而AWS 本季营收同比增长20.2% 到$309 亿,相比上季增速明显提升2.7pct。市场久久期待的AWS 增长再提速终于到来。

    AMZN亚马逊AWS本季营收同比增长20.2%到$309亿!

    久等的AWS 提速终于到来:目前云业务的增速几乎成为了压倒一切、“决定生死” 的单一指标。而AWS 本季营收同比增长20.2% 到$309 亿,相比上季增速明显提升2.7pct。市场久久期待的AWS 增长再提速终于到来。

  • AAPL蘋果2025財年第四季度營收1025億美元,同比增長7.9%!

    AAPL苹果2025财年第四季度营收1025亿美元,同比增长7.9%!

    本季度苹果公司实现营收1025 亿美元,同比增长7.9%,基本符合市场预期(1020 亿美元)。公司本季度收入端的提升,主要受益于iPhone、Mac 和软件服务业务增长的带动。苹果公司毛利率 47.2%,同比增加1pct,好于市场一致预期(46.6%)。

    AAPL苹果2025财年第四季度营收1025亿美元,同比增长7.9%!

    本季度苹果公司实现营收1025 亿美元,同比增长7.9%,基本符合市场预期(1020 亿美元)。公司本季度收入端的提升,主要受益于iPhone、Mac 和软件服务业务增长的带动。苹果公司毛利率 47.2%,同比增加1pct,好于市场一致预期(46.6%)。

  • RBLX業績指引隱含增速放緩?

    RBLX业绩指引隐含增速放缓?

    RBLX四季度指引隐含增速放缓过快:在三季度70% 的跳跃式增长下,四季度指引流水增速迅速放缓到50% 达到20 亿,意味着环比只增加了4%,年化未来一年的增速为17% 低于20% 的长期目标。

    RBLX业绩指引隐含增速放缓?

    RBLX四季度指引隐含增速放缓过快:在三季度70% 的跳跃式增长下,四季度指引流水增速迅速放缓到50% 达到20 亿,意味着环比只增加了4%,年化未来一年的增速为17% 低于20% 的长期目标。

  • META財報Opex蹭蹭漲,市場慌了?

    META财报Opex蹭蹭涨,市场慌了?

    META Opex 蹭蹭涨:大模型进展不顺,AI 实验室高薪挖人,挖完又大裁员。再加上高增长的折旧费用,引发市场对支出不受控的担忧。三季度这个担忧正在被印证:研发同比高增35%,管理支出因为法务支出、员工薪资高增等,同比更是增长了88%,彻底重回高增区间。

    META财报Opex蹭蹭涨,市场慌了?

    META Opex 蹭蹭涨:大模型进展不顺,AI 实验室高薪挖人,挖完又大裁员。再加上高增长的折旧费用,引发市场对支出不受控的担忧。三季度这个担忧正在被印证:研发同比高增35%,管理支出因为法务支出、员工薪资高增等,同比更是增长了88%,彻底重回高增区间。

  • MSFT微軟業績不俗,但Azure沒有意外之喜

    MSFT微软业绩不俗,但Azure没有意外之喜

    整体上,本季微软业绩不俗,几乎没有缺点,各项指标普遍好于预期。问题在于作为最被一致看多的标的,市场对微软的期待非常高。可以说,需要大幅度的超预期,才能再让市场感到惊喜。且本季核心Azure 增速并未好于买方预期,让市场对微软本季业绩反应平平。

    MSFT微软业绩不俗,但Azure没有意外之喜

    整体上,本季微软业绩不俗,几乎没有缺点,各项指标普遍好于预期。问题在于作为最被一致看多的标的,市场对微软的期待非常高。可以说,需要大幅度的超预期,才能再让市场感到惊喜。且本季核心Azure 增速并未好于买方预期,让市场对微软本季业绩反应平平。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4