阿里巴巴推出Qwen2.5-VL模型，成为全球AI格局下的新竞争者?

發布日期:2025年1月28日

要点:
中国AI初创公司DeepSeek的崛起震撼全球科技市场，并激发了阿里巴巴等中国科技巨头的再度关注，推动其股价大幅上涨。

近日，中国AI初创公司DeepSeek的爆火引起了全球科技行业的巨大震动。然而随着大众对DeepSeek的关注逐渐升温，阿里巴巴等中国科技公司也被再次聚焦。

实际上，早在1月26日，阿里巴巴已发布了其最新的Qwen2.5-1M模型又名“通义千问”，纷纷加入到这场激烈的人工智能竞争之中。受此影响，今天阿里巴巴(BABA)的股价在美股市场上大幅上涨，显示出投资者对其未来发展前景的高度信心。

阿里巴巴全新人工智能模型

近日，阿里巴巴的Qwen团队推出了全新的人工智能AI模型家族Qwen2.5-VL，这些模型能够执行多项文字与图像分析任务，包括档案解析、影片理解、影像物件识别以及PC控制，功能类似于OpenAI近期发布的“Operator”模型。

根据Qwen团队的基准测试，Qwen2.5-VL在视频理解、数学计算、文件分析以及问答评估等多个领域的表现超越了OpenAI的GPT-4、Anthropic的Claude 3.5 Sonnet和Google的Gemini 2.0 Flash等竞争对手。

Qwen2.5-VL是一款多模态模型，旨在将文字提示与图像或视频资料结合，转换为标记，并预测统计上最可能的输出标记，最终生成响应。与所有大型语言模型/LLM及相关系统类似，Qwen2.5-VL的回应有时可能不会直接与查询的正确答案相对应。

其创建者宣称，Qwen2.5-VL具有“直观理解事物”的能力，虽然实际上并不进行真实理解，而是根据文字、图表和其他图形所提供的内容来生成回应，并能处理物件和场景的分析。

相比先前的模型，Qwen2.5-VL的最大升级之一是能处理长度超过一小时的视频内容，并精确定位影片中的特定事件，通过时间戳来标记。图像中的物体可以用边界框进行本地化，并附带JSON格式的数据，输出的结果不仅限于纯文字，还可以是结构化的数据。更重要的是，Qwen2.5-VL被设计为具备“代理功能”，意味着它不仅能生成回应，还能根据用户指令主动执行行动，协助完成特定任务。

该模型作为视觉代理，能够推理并引导工具进行动作。它不仅可以在电脑和手机上操作，还能在多种应用中执行具体任务。举例来说，Qwen2.5-VL可以在航空公司应用中预订航班，使用浏览器查找天气预报，利用影像编辑器调整照片的色彩鲜艳度，甚至能安装Microsoft Visual Studio Code/VS Code扩充功能，展示了它强大的实用性与多样性。

目前，Qwen2.5-VL模型可在阿里巴巴的Qwen Chat应用程式中测试，并可以从人工智能AI开发平台Hugging Face下载。该模型能够分析图表和图形，从发票和表格扫描中提取数据，并“理解”多小时的长内容。

Qwen团队对此表示，Qwen2.5-VL能识别电影和电视剧中的知识产权/IP以及各种产品，暗示该模型可能经过受版权保护内容的训练。尽管如此，Qwen2.5-VL在敏感政治话题上有所限制，当要求该模型讨论如“习近平的错误”时，它会抛出错误讯息，这反映了中国网络监管机构对本土开发模型的控制，要求其遵守社会主义核心价值观。

此外，Qwen2.5-VL的另一大亮点是其能与PC及移动装置上的应用程式互动，进一步拓宽了其应用范围。一段由Hugging Face技术负责人Philipp Schmid发布的影片显示，Qwen2.5-VL成功启动并预订了Android版Booking.com的机票，显示了其操作真实世界软体的能力。

Qwen高级计算机和AI移动代理示例:移动使用帮助我送我的QQ好友变三,放牧一新春祝福

性能媲美全球领先竞争者

Qwen宣称其最新的大型模型Qwen2.5-VL-72B-Instruct拥有720亿个参数，在各类任务中的表现与Google的Gemini-2 Flash、OpenAI的GPT-4o以及Anthropic的Claude 3.5 Sonnet模型相当，甚至在某些领域（如文件分析）略有优势。同时，较小的Qwen2.5-VL-7B模型在性能上与GPT-4o-Mini竞争力十足，而参数数量为30亿的Qwen2.5-VL-3B模型则能够匹配或超越Qwen自家最新一代Qwen2-VL-7B参数数量超过两倍的模型。

Qwen在HuggingFace上发布了三种不同尺寸的新模型，并为每个版本提供了不同的许可证。拥有720亿参数的大型模型使用Qwen License，允许免费使用和修改，但商业用途仅限于月活跃用户/MAU低于1亿的服务、拥有30亿参数的小型模型则使用Qwen Research许可证，禁止商业用途，而中等规模的70亿参数模型则采用了更为宽松的Apache License 2.0许可证。

阿里巴巴子公司Qwen在谈到其最新模型系列时表示，“我们发布了Qwen2.5-VL，这是Qwen的新旗舰视觉语言模型，也是较之前的Qwen2-VL的重大飞跃。”就旗舰型号Qwen2.5-VL-72B-Instruct而言，它在一系列涵盖领域和任务的基准测试中取得了具有竞争力的表现，包括大学级问题、数学、文档理解、一般问答、视频理解且值得注意的是，Qwen2.5-VL在理解文件和图表方面具有显著优势，并且无需针对特定任务进行微调即可充当视觉代理。

尽管如此，Qwen2.5-VL在操作系统基准测试/OSWorld中的表现较为一般，并未达到预期的高效能。而该系列中的两个较小型号Qwen2.5-VL-3B和Qwen2.5-VL-7B已可供许可使用，但旗舰型号Qwen2.5-VL-72B则要求获得阿里巴巴的专门许可，尤其是对于每月活跃用户超过一亿的企业和开发者，需在商业部署前申请许可。

近期DeepSeek的崛起，全球科技界的竞争格局发生了显著变化，特别是在中国科技公司在人工智能领域的竞争力逐步提升之际。中国的AI企业不仅在技术创新方面取得突破，还成功挑战了西方科技巨头的市场领导地位。阿里巴巴最新推出的Qwen2.5-VL模型家族，正是这股技术创新浪潮中的代表之一。

随着AI技术的日益成熟，企业对于AI的需求已不仅限于提升效率，更多的是将其应用于日常操作中，解决更复杂的问题。阿里巴巴的Qwen2.5-VL就是这种需求的具体体现，它不仅在多个领域的基准测试中表现出色，还能与PC及移动设备的应用程式进行深度交互，拓宽了人工智能技术的边界。更重要的是，随着阿里巴巴的这些突破性产品的发布，其在全球AI市场中的影响力正在持续增强，对竞争者构成了前所未有的挑战。这不仅为中国科技企业提供了更多的发展机会，也让全球科技生态系统面临着新的竞争态势，促使行业快速向前发展。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富，更是一種洞察宏觀經濟的態度，見證社會演變與科技發展。我們一起，從大變局中看清發展趨勢，希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下，金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角，洞察分析每一個趨勢與機會，為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼，比一部分人更快、更准地看清市場，讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明：本網站提供的信息僅供一般信息分享目的，並不應被視為投資建議。

相關主題:

返回博客

思钱想后Convo Money

查看全部

MU美光业绩已成新的AI硬件风向标

美光本季度营收 415 亿美元，环比直接拉涨了 74%，连续两季度保持 70%+ 的环比增长。与公司此前指引的最高 342 亿美金，以及市场预期的 354 亿美金，完全不在一个维度上。

MU美光业绩已成新的AI硬件风向标

美光本季度营收 415 亿美元，环比直接拉涨了 74%，连续两季度保持 70%+ 的环比增长。与公司此前指引的最高 342 亿美金，以及市场预期的 354 亿美金，完全不在一个维度上。
PDD拼多多2026年第一季财报，不及市场预期

因国内主站营收增长不及预期，营销支出也并未明显下滑，因此实际利润表现并不及预期。分板块来看背后原因，我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多，另外国内主站的经营利润增长应当也相当有限。

PDD拼多多2026年第一季财报，不及市场预期

因国内主站营收增长不及预期，营销支出也并未明显下滑，因此实际利润表现并不及预期。分板块来看背后原因，我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多，另外国内主站的经营利润增长应当也相当有限。
小米2026年第一季度财报，主要受手机和汽车毛利率同比回落影响

小米本季度汽车业务毛利率下滑至 20.1%，接近市场预期（20.5%），主要是受均价下滑的影响，其中包含了小米对购置税进行补贴的影响，并在本季度销售了一部分的低价现车。由于毛利率再次回落，海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。

小米2026年第一季度财报，主要受手机和汽车毛利率同比回落影响

小米本季度汽车业务毛利率下滑至 20.1%，接近市场预期（20.5%），主要是受均价下滑的影响，其中包含了小米对购置税进行补贴的影响，并在本季度销售了一部分的低价现车。由于毛利率再次回落，海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。
英伟达2027财年第一季度财报，收入752亿美元，环比增量为129亿美元

NVDA核心经营指标：总收入816亿美元，好于上调后的买方预期（780-800亿美元），其中季度环比增长135亿美元，几乎都来自于数据中心业务中Blackwell量产增加的带动。

英伟达2027财年第一季度财报，收入752亿美元，环比增量为129亿美元

NVDA核心经营指标：总收入816亿美元，好于上调后的买方预期（780-800亿美元），其中季度环比增长135亿美元，几乎都来自于数据中心业务中Blackwell量产增加的带动。
比亚迪2025年第四季度业绩仍然不及预期，卖车单价仍处于下行轨道

比亚迪的业绩仍然不及预期。收入虽超预期，但主要由于非核心的比亚迪电子业务高增带来，而在核心的卖车业务上，卖车单价仍处于下行轨道，卖车成本降幅不够，最后卖车毛利率虽有回暖，但仍低于市场预期。

比亚迪2025年第四季度业绩仍然不及预期，卖车单价仍处于下行轨道

比亚迪的业绩仍然不及预期。收入虽超预期，但主要由于非核心的比亚迪电子业务高增带来，而在核心的卖车业务上，卖车单价仍处于下行轨道，卖车成本降幅不够，最后卖车毛利率虽有回暖，但仍低于市场预期。
GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌，但这合理吗？

消息一出，华尔街一度陷入恐慌：如果 AI 突然间不再需要那么多 RAM 就能运作，这是否意味着内存产业的“超级周期”即将结束？答案是否定的。事实上，从历史规律与经济学角度来看，情况正好相反。要理解这一点，我们只需要观察你电脑上的网页浏览器。

GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌，但这合理吗？

消息一出，华尔街一度陷入恐慌：如果 AI 突然间不再需要那么多 RAM 就能运作，这是否意味着内存产业的“超级周期”即将结束？答案是否定的。事实上，从历史规律与经济学角度来看，情况正好相反。要理解这一点，我们只需要观察你电脑上的网页浏览器。
BABA财报AI投入比较激进

BABA发布第四季财报后股价下跌，财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%，而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资（总额超过530亿美元）有效性的担忧。

BABA财报AI投入比较激进

BABA发布第四季财报后股价下跌，财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%，而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资（总额超过530亿美元）有效性的担忧。
MU美光业绩，季度毛利率达到 74.4%!

MU 整体业绩：美光本季度营收 238.6 亿美元，环比增长 75%，好于上调后的买方预期（199 亿美元），本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动，两大业务环增都在 70% 以上。

MU美光业绩，季度毛利率达到 74.4%!

MU 整体业绩：美光本季度营收 238.6 亿美元，环比增长 75%，好于上调后的买方预期（199 亿美元），本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动，两大业务环增都在 70% 以上。

1 8

查看全部

流科百世Convo Tech

查看全部

Sharpa机器人削苹果

对人类来说，削苹果是件轻而易举的晨间小事，但对机器人而言，这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。

Sharpa机器人削苹果

对人类来说，削苹果是件轻而易举的晨间小事，但对机器人而言，这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。
肿瘤疗法突破，中国团队给癌细胞打上“猪”标签，癌细胞“伪装术”被破解

近期，中国科学家在“Cell”杂志上发表的一项突破性研究，为这一顽疾提供了全新思路。他们利用基因编辑技术，将癌细胞改造成免疫系统眼中的“异类”，类似于人体对猪器官产生的超急性排斥反应，从而引发了一场针对癌细胞的精准“免疫歼灭战”。

肿瘤疗法突破，中国团队给癌细胞打上“猪”标签，癌细胞“伪装术”被破解

近期，中国科学家在“Cell”杂志上发表的一项突破性研究，为这一顽疾提供了全新思路。他们利用基因编辑技术，将癌细胞改造成免疫系统眼中的“异类”，类似于人体对猪器官产生的超急性排斥反应，从而引发了一场针对癌细胞的精准“免疫歼灭战”。
新型大脑设备首次读出内心声音，脑机接口技术打破失语者困境

新系统的核心原理与常见的“尝试说话”型脑机介面相似，都是在大脑运动皮质植入感测器，这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型，模型依据个人化数据判断信号对应的声音，进而预测使用者想说的单字。

新型大脑设备首次读出内心声音，脑机接口技术打破失语者困境

新系统的核心原理与常见的“尝试说话”型脑机介面相似，都是在大脑运动皮质植入感测器，这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型，模型依据个人化数据判断信号对应的声音，进而预测使用者想说的单字。
“垃圾DNA”新发现：远古病毒DNA在人类发育中发挥关键作用

自这类非编码DNA片段首次被发现并被称作“垃圾”以来，生物学家们一直在探讨它们是否真的无用。如今的主流观点认为，这些片段虽不直接参与蛋白质合成，却在整体基因组中占据了极大比例，显示它们可能具有重要功能。

“垃圾DNA”新发现：远古病毒DNA在人类发育中发挥关键作用

自这类非编码DNA片段首次被发现并被称作“垃圾”以来，生物学家们一直在探讨它们是否真的无用。如今的主流观点认为，这些片段虽不直接参与蛋白质合成，却在整体基因组中占据了极大比例，显示它们可能具有重要功能。

1 4

查看全部

观点Opinion

查看全部

人工智能AI时代，人类如何重拾批判性思维？

作为批判性思维培养的原始土壤：教育，必须进行重塑。教育政策的制定者和学校必须釆取积极措施，将批判性思维的练习深度融入课程。这远不止是增加几节理论课，而是要在每一个学科、每一个学习环节中，鼓励学生质疑和分析AI生成的信息。

人工智能AI时代，人类如何重拾批判性思维？

作为批判性思维培养的原始土壤：教育，必须进行重塑。教育政策的制定者和学校必须釆取积极措施，将批判性思维的练习深度融入课程。这远不止是增加几节理论课，而是要在每一个学科、每一个学习环节中，鼓励学生质疑和分析AI生成的信息。
长城汽车面向35岁以上人才开启专场招聘，职场中的年龄歧视及“35岁现象”挑战引发深思

长期以来，“35岁现象”如无形枷锁，将众多经验丰富、能力成熟的中年人才拒之门外。长城汽车的“35+计划”不仅是一项招聘举措，更是一场关于年龄、经验与价值的社会呼吁，挑战了传统的职场偏见，倡导尊重和激活中年人才的力量，为行业和社会注入了新的活力与希望。

长城汽车面向35岁以上人才开启专场招聘，职场中的年龄歧视及“35岁现象”挑战引发深思

长期以来，“35岁现象”如无形枷锁，将众多经验丰富、能力成熟的中年人才拒之门外。长城汽车的“35+计划”不仅是一项招聘举措，更是一场关于年龄、经验与价值的社会呼吁，挑战了传统的职场偏见，倡导尊重和激活中年人才的力量，为行业和社会注入了新的活力与希望。
打破线性人生，在不确定中寻找多元化的人生出路

近年来，全球经济与地缘格局发生剧烈变化，从疫情冲击、通胀压力，到产业结构重塑，无一不深刻影响着普通人的生活节奏与发展路径。原本被视为“稳定之路”的人生规划：考学、毕业、就业、升职、买房，如今变得越来越不确定。

打破线性人生，在不确定中寻找多元化的人生出路

近年来，全球经济与地缘格局发生剧烈变化，从疫情冲击、通胀压力，到产业结构重塑，无一不深刻影响着普通人的生活节奏与发展路径。原本被视为“稳定之路”的人生规划：考学、毕业、就业、升职、买房，如今变得越来越不确定。
从名校精英到杀手，Luigi Mangione枪击案背后揭示的美国医疗体系

Luigi Mangione用极端方式撕开了美国医疗体系深藏的裂痕，也逼迫社会不得不重新审视，何为正义？何为悲剧。当医疗保障变成逐利机器，当患者在病痛中苦苦挣扎却换来拒绝与冷眼，社会的不满和愤怒便会潜滋暗长，最终以最不可控的方式爆发。

从名校精英到杀手，Luigi Mangione枪击案背后揭示的美国医疗体系

Luigi Mangione用极端方式撕开了美国医疗体系深藏的裂痕，也逼迫社会不得不重新审视，何为正义？何为悲剧。当医疗保障变成逐利机器，当患者在病痛中苦苦挣扎却换来拒绝与冷眼，社会的不满和愤怒便会潜滋暗长，最终以最不可控的方式爆发。

1 4

查看全部

胡说北道Convo Ave(播客)

查看全部

从中国经济看背后困境及发展新构想?

中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施，中国经济可能有一个全新的契机注入新的动力，推动经济稳定健康发展。

从中国经济看背后困境及发展新构想?

中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施，中国经济可能有一个全新的契机注入新的动力，推动经济稳定健康发展。
在变革中的抉择：当今大环境下如何实现职业规划与人生价值？

随着时代的变迁，人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同，有些人追求的是即时的快乐和成就感，而有些人则看重长期的进步和自我超越。

在变革中的抉择：当今大环境下如何实现职业规划与人生价值？

随着时代的变迁，人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同，有些人追求的是即时的快乐和成就感，而有些人则看重长期的进步和自我超越。
再见爱人：探索现代婚姻中的情感困境

芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子，麦琳、李行亮，葛夕、刘爽三对情感关系10年以上的夫妻，以“婚姻纪实观察”为切口，呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

再见爱人：探索现代婚姻中的情感困境

芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子，麦琳、李行亮，葛夕、刘爽三对情感关系10年以上的夫妻，以“婚姻纪实观察”为切口，呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。
抖音短剧新风潮：中老年人成为新的增长点?

近日，不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十，闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事，成了当下短剧创作的“新流量密码”。

抖音短剧新风潮：中老年人成为新的增长点?

近日，不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十，闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事，成了当下短剧创作的“新流量密码”。

1 4

查看全部

阿里巴巴全新人工智能模型

性能媲美全球领先竞争者

免费订阅优质资讯