阿里巴巴推出Qwen2.5-VL模型,成為全球AI格局下的新競爭者?

阿里巴巴推出Qwen2.5-VL模型,成为全球AI格局下的新竞争者?

發布日期:

商業 Business 狂呼金融 Convo Finance 科技 Tech


要点:
中国AI初创公司DeepSeek的崛起震撼全球科技市场,并激发了阿里巴巴等中国科技巨头的再度关注,推动其股价大幅上涨。

近日,中国AI初创公司DeepSeek的爆火引起了全球科技行业的巨大震动。然而随着大众对DeepSeek的关注逐渐升温,阿里巴巴等中国科技公司也被再次聚焦。

实际上,早在1月26日,阿里巴巴已发布了其最新的Qwen2.5-1M模型又名“通义千问”,纷纷加入到这场激烈的人工智能竞争之中。受此影响,今天阿里巴巴(BABA)的股价在美股市场上大幅上涨,显示出投资者对其未来发展前景的高度信心。

阿里巴巴全新人工智能模型

近日,阿里巴巴的Qwen团队推出了全新的人工智能AI模型家族Qwen2.5-VL,这些模型能够执行多项文字与图像分析任务,包括档案解析、影片理解、影像物件识别以及PC控制,功能类似于OpenAI近期发布的“Operator”模型。

根据Qwen团队的基准测试,Qwen2.5-VL在视频理解、数学计算、文件分析以及问答评估等多个领域的表现超越了OpenAI的GPT-4、Anthropic的Claude 3.5 Sonnet和Google的Gemini 2.0 Flash等竞争对手。

Qwen2.5-VL是一款多模态模型,旨在将文字提示与图像或视频资料结合,转换为标记,并预测统计上最可能的输出标记,最终生成响应。与所有大型语言模型/LLM及相关系统类似,Qwen2.5-VL的回应有时可能不会直接与查询的正确答案相对应。

其创建者宣称,Qwen2.5-VL具有“直观理解事物”的能力,虽然实际上并不进行真实理解,而是根据文字、图表和其他图形所提供的内容来生成回应,并能处理物件和场景的分析。

相比先前的模型,Qwen2.5-VL的最大升级之一是能处理长度超过一小时的视频内容,并精确定位影片中的特定事件,通过时间戳来标记。图像中的物体可以用边界框进行本地化,并附带JSON格式的数据,输出的结果不仅限于纯文字,还可以是结构化的数据。更重要的是,Qwen2.5-VL被设计为具备“代理功能”,意味着它不仅能生成回应,还能根据用户指令主动执行行动,协助完成特定任务。

该模型作为视觉代理,能够推理并引导工具进行动作。它不仅可以在电脑和手机上操作,还能在多种应用中执行具体任务。举例来说,Qwen2.5-VL可以在航空公司应用中预订航班,使用浏览器查找天气预报,利用影像编辑器调整照片的色彩鲜艳度,甚至能安装Microsoft Visual Studio Code/VS Code扩充功能,展示了它强大的实用性与多样性。

目前,Qwen2.5-VL模型可在阿里巴巴的Qwen Chat应用程式中测试,并可以从人工智能AI开发平台Hugging Face下载。该模型能够分析图表和图形,从发票和表格扫描中提取数据,并“理解”多小时的长内容。

Qwen团队对此表示,Qwen2.5-VL能识别电影和电视剧中的知识产权/IP以及各种产品,暗示该模型可能经过受版权保护内容的训练。尽管如此,Qwen2.5-VL在敏感政治话题上有所限制,当要求该模型讨论如“习近平的错误”时,它会抛出错误讯息,这反映了中国网络监管机构对本土开发模型的控制,要求其遵守社会主义核心价值观。

此外,Qwen2.5-VL的另一大亮点是其能与PC及移动装置上的应用程式互动,进一步拓宽了其应用范围。一段由Hugging Face技术负责人Philipp Schmid发布的影片显示,Qwen2.5-VL成功启动并预订了Android版Booking.com的机票,显示了其操作真实世界软体的能力。

Qwen高级计算机和AI移动代理示例:移动使用帮助我送我的QQ好友变三,放牧一新春祝福

性能媲美全球领先竞争者

Qwen宣称其最新的大型模型Qwen2.5-VL-72B-Instruct拥有720亿个参数,在各类任务中的表现与Google的Gemini-2 Flash、OpenAI的GPT-4o以及Anthropic的Claude 3.5 Sonnet模型相当,甚至在某些领域(如文件分析)略有优势。同时,较小的Qwen2.5-VL-7B模型在性能上与GPT-4o-Mini竞争力十足,而参数数量为30亿的Qwen2.5-VL-3B模型则能够匹配或超越Qwen自家最新一代Qwen2-VL-7B参数数量超过两倍的模型。

Qwen在HuggingFace上发布了三种不同尺寸的新模型,并为每个版本提供了不同的许可证。拥有720亿参数的大型模型使用Qwen License,允许免费使用和修改,但商业用途仅限于月活跃用户/MAU低于1亿的服务、拥有30亿参数的小型模型则使用Qwen Research许可证,禁止商业用途,而中等规模的70亿参数模型则采用了更为宽松的Apache License 2.0许可证。

阿里巴巴子公司Qwen在谈到其最新模型系列时表示,“我们发布了Qwen2.5-VL,这是Qwen的新旗舰视觉语言模型,也是较之前的Qwen2-VL的重大飞跃。”就旗舰型号Qwen2.5-VL-72B-Instruct而言,它在一系列涵盖领域和任务的基准测试中取得了具有竞争力的表现,包括大学级问题、数学、文档理解、一般问答、视频理解且值得注意的是,Qwen2.5-VL在理解文件和图表方面具有显著优势,并且无需针对特定任务进行微调即可充当视觉代理。

尽管如此,Qwen2.5-VL在操作系统基准测试/OSWorld中的表现较为一般,并未达到预期的高效能。而该系列中的两个较小型号Qwen2.5-VL-3B和Qwen2.5-VL-7B已可供许可使用,但旗舰型号Qwen2.5-VL-72B则要求获得阿里巴巴的专门许可,尤其是对于每月活跃用户超过一亿的企业和开发者,需在商业部署前申请许可。

近期DeepSeek的崛起,全球科技界的竞争格局发生了显著变化,特别是在中国科技公司在人工智能领域的竞争力逐步提升之际。中国的AI企业不仅在技术创新方面取得突破,还成功挑战了西方科技巨头的市场领导地位。阿里巴巴最新推出的Qwen2.5-VL模型家族,正是这股技术创新浪潮中的代表之一。

随着AI技术的日益成熟,企业对于AI的需求已不仅限于提升效率,更多的是将其应用于日常操作中,解决更复杂的问题。阿里巴巴的Qwen2.5-VL就是这种需求的具体体现,它不仅在多个领域的基准测试中表现出色,还能与PC及移动设备的应用程式进行深度交互,拓宽了人工智能技术的边界。更重要的是,随着阿里巴巴的这些突破性产品的发布,其在全球AI市场中的影响力正在持续增强,对竞争者构成了前所未有的挑战。这不仅为中国科技企业提供了更多的发展机会,也让全球科技生态系统面临着新的竞争态势,促使行业快速向前发展。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
1 / 8
1 / 4
  • 中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    “我的前女友叫劉佳”、“前女友叫劉佳”、“劉佳是我前女友”.。以上這些男士的前女友竟然都叫“劉佳”,而更離奇的是,這些男士還都是同一棟樓的業主,他們都表示自己是前女友“劉佳”介紹來買房的。這一切看似巧合,實則隱藏着不為人知的騙局。

    中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    “我的前女友叫劉佳”、“前女友叫劉佳”、“劉佳是我前女友”.。以上這些男士的前女友竟然都叫“劉佳”,而更離奇的是,這些男士還都是同一棟樓的業主,他們都表示自己是前女友“劉佳”介紹來買房的。這一切看似巧合,實則隱藏着不為人知的騙局。

  • 美國性勒索與網路犯罪:青少年如何避免成為下一個受害者?

    美国性勒索与网路犯罪:青少年如何避免成为下一个受害者?

    在数字化时代,网络犯罪的形式愈加多样且隐蔽,其中“性勒索”/sextortion已成为一个日益严重的问题。这类网络犯罪不仅涉及个人隐私的泄露,还会对受害者的心理健康和社会生活造成深远影响。 “性勒索”/Sextortion犯罪在现代技术的推动下,呈现出爆发式增长。

    美国性勒索与网路犯罪:青少年如何避免成为下一个受害者?

    在数字化时代,网络犯罪的形式愈加多样且隐蔽,其中“性勒索”/sextortion已成为一个日益严重的问题。这类网络犯罪不仅涉及个人隐私的泄露,还会对受害者的心理健康和社会生活造成深远影响。 “性勒索”/Sextortion犯罪在现代技术的推动下,呈现出爆发式增长。

  • 美國加州洛杉磯野火的“囚犯消防員”

    加州洛杉矶野火的“囚犯消防员”

    加州洛杉矶囚犯参与了构筑防火线、清除废墟及易燃物等工作,弥补了加州消防队伍的不足。然而,他们的低薪待遇却令人震惊。囚犯消防员的收入在每天5.8美元至10.2美元之间,而相比之下,加州的最低工资标准为每小时16.5美元。

    加州洛杉矶野火的“囚犯消防员”

    加州洛杉矶囚犯参与了构筑防火线、清除废墟及易燃物等工作,弥补了加州消防队伍的不足。然而,他们的低薪待遇却令人震惊。囚犯消防员的收入在每天5.8美元至10.2美元之间,而相比之下,加州的最低工资标准为每小时16.5美元。

  • 從吉他少年到海嘎小學教師,顧亞用音樂敲開鄉村孩子通往世界的大門

    从吉他少年到海嘎小学教师,顾亚用音乐敲开乡村孩子通往世界的大门

    2014年,在家人的“怂恿”下,27岁的顾亚参加了乡镇特岗教师的招聘考试,意外地来到了这个偏远的村庄。海嘎村的孩子们大多没有见过吉他,但他们天生拥有出色的嗓音和节奏感。顾亚毅然申请从大湾镇的腊寨小学调动,前往海嘎村当起了老师。

    从吉他少年到海嘎小学教师,顾亚用音乐敲开乡村孩子通往世界的大门

    2014年,在家人的“怂恿”下,27岁的顾亚参加了乡镇特岗教师的招聘考试,意外地来到了这个偏远的村庄。海嘎村的孩子们大多没有见过吉他,但他们天生拥有出色的嗓音和节奏感。顾亚毅然申请从大湾镇的腊寨小学调动,前往海嘎村当起了老师。

1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4