阿里巴巴推出Qwen2.5-VL模型，成為全球AI格局下的新競爭者?

發布日期:2025年1月28日

要點:
中國AI初創公司DeepSeek的崛起震撼全球科技市場，並激發了阿里巴巴等中國科技巨頭的再度關注，推動其股價大幅上漲。

近日，中國AI初創公司DeepSeek的爆火引起了全球科技行業的巨大震動。然而隨着大眾對DeepSeek的關注逐漸升溫，阿里巴巴等中國科技公司也被再次聚焦。

實際上，早在1月26日，阿里巴巴已發布了其最新的Qwen2.5-1M模型又名“通義千問”，紛紛加入到這場激烈的人工智能競爭之中。受此影響，今天阿里巴巴 (BABA) 的股價在美股市場上大幅上漲，顯示出投資者對其未來發展前景的高度信心。

阿里巴巴全新人工智能模型

近日，阿里巴巴的Qwen團隊推出了全新的人工智能AI模型家族Qwen2.5-VL，這些模型能夠執行多項文字與圖像分析任務，包括檔案解析、影片理解、影像物件識別以及PC控制，功能類似於OpenAI近期發布的“Operator”模型。

根據Qwen團隊的基準測試，Qwen2.5-VL在視頻理解、數學計算、文件分析以及問答評估等多個領域的表現超越了OpenAI的GPT-4、Anthropic的Claude 3.5 Sonnet和Google的Gemini 2.0 Flash等競爭對手。

Qwen2.5-VL是一款多模態模型，旨在將文字提示與圖像或視頻資料結合，轉換為標記，並預測統計上最可能的輸出標記，最終生成響應。與所有大型語言模型/LLM及相關系統類似，Qwen2.5-VL的回應有時可能不會直接與查詢的正確答案相對應。

其創建者宣稱，Qwen2.5-VL具有“直觀理解事物”的能力，雖然實際上並不進行真實理解，而是根據文字、圖表和其他圖形所提供的內容來生成回應，並能處理物件和場景的分析。

相比先前的模型，Qwen2.5-VL的最大升級之一是能處理長度超過一小時的視頻內容，並精確定位影片中的特定事件，通過時間戳來標記。圖像中的物體可以用邊界框進行本地化，並附帶JSON格式的數據，輸出的結果不僅限於純文字，還可以是結構化的數據。更重要的是，Qwen2.5-VL被設計為具備“代理功能”，意味著它不僅能生成回應，還能根據用戶指令主動執行行動，協助完成特定任務。

該模型作為視覺代理，能夠推理並引導工具進行動作。它不僅可以在電腦和手機上操作，還能在多種應用中執行具體任務。舉例來說，Qwen2.5-VL可以在航空公司應用中預訂航班，使用瀏覽器查找天氣預報，利用影像編輯器調整照片的色彩鮮豔度，甚至能安裝Microsoft Visual Studio Code/VS Code擴充功能，展示了它強大的實用性與多樣性。

目前，Qwen2.5-VL模型可在阿里巴巴的Qwen Chat應用程式中測試，並可以從人工智能AI開發平台Hugging Face下載。該模型能夠分析圖表和圖形，從發票和表格掃描中提取數據，並“理解”多小時的長內容。

Qwen團隊對此表示，Qwen2.5-VL能識別電影和電視劇中的知識產權/IP以及各種產品，暗示該模型可能經過受版權保護內容的訓練。儘管如此，Qwen2.5-VL在敏感政治話題上有所限制，當要求該模型討論如“習近平的錯誤”時，它會拋出錯誤訊息，這反映了中國網絡監管機構對本土開發模型的控制，要求其遵守社會主義核心價值觀。

此外，Qwen2.5-VL的另一大亮點是其能與PC及移動裝置上的應用程式互動，進一步拓寬了其應用範圍。一段由Hugging Face技術負責人Philipp Schmid發布的影片顯示，Qwen2.5-VL成功啟動並預訂了Android版Booking.com的機票，顯示了其操作真實世界軟體的能力。

Qwen高級計算機和AI移動代理示例:移動使用
幫助我送我的QQ好友變三,放牧一新春祝福

性能媲美全球領先競爭者

Qwen宣稱其最新的大型模型Qwen2.5-VL-72B-Instruct擁有720億個參數，在各類任務中的表現與Google的Gemini-2 Flash、OpenAI的GPT-4o以及Anthropic的Claude 3.5 Sonnet模型相當，甚至在某些領域（如文件分析）略有優勢。同時，較小的Qwen2.5-VL-7B模型在性能上與GPT-4o-Mini競爭力十足，而參數數量為30億的Qwen2.5-VL-3B模型則能夠匹配或超越Qwen自家最新一代Qwen2-VL-7B參數數量超過兩倍的模型。

Qwen在HuggingFace上發布了三種不同尺寸的新模型，並為每個版本提供了不同的許可證。擁有720億參數的大型模型使用Qwen License，允許免費使用和修改，但商業用途僅限於月活躍用戶/MAU低於1億的服務、擁有30億參數的小型模型則使用Qwen Research許可證，禁止商業用途，而中等規模的70億參數模型則採用了更為寬鬆的Apache License 2.0許可證。

阿里巴巴子公司Qwen在談到其最新模型系列時表示，“我們發布了Qwen2.5-VL，這是Qwen的新旗艦視覺語言模型，也是較之前的Qwen2-VL的重大飛躍。”就旗艦型號Qwen2.5-VL-72B-Instruct而言，它在一系列涵蓋領域和任務的基準測試中取得了具有競爭力的表現，包括大學級問題、數學、文檔理解、一般問答、視頻理解且值得注意的是，Qwen2.5-VL在理解文件和圖表方面具有顯著優勢，並且無需針對特定任務進行微調即可充當視覺代理。

儘管如此，Qwen2.5-VL在操作系統基準測試/OSWorld中的表現較為一般，並未達到預期的高效能。而該系列中的兩個較小型號Qwen2.5-VL-3B和Qwen2.5-VL-7B已可供許可使用，但旗艦型號Qwen2.5-VL-72B則要求獲得阿里巴巴的專門許可，尤其是對於每月活躍用戶超過一億的企業和開發者，需在商業部署前申請許可。

近期DeepSeek的崛起，全球科技界的競爭格局發生了顯著變化，特別是在中國科技公司在人工智能領域的競爭力逐步提升之際。中國的AI企業不僅在技術創新方面取得突破，還成功挑戰了西方科技巨頭的市場領導地位。阿里巴巴最新推出的Qwen2.5-VL模型家族，正是這股技術創新浪潮中的代表之一。

隨著AI技術的日益成熟，企業對於AI的需求已不僅限於提升效率，更多的是將其應用於日常操作中，解決更複雜的問題。阿里巴巴的Qwen2.5-VL就是這種需求的具體體現，它不僅在多個領域的基準測試中表現出色，還能與PC及移動設備的應用程式進行深度交互，拓寬了人工智能技術的邊界。更重要的是，隨著阿里巴巴的這些突破性產品的發布，其在全球AI市場中的影響力正在持續增強，對競爭者構成了前所未有的挑戰。這不僅為中國科技企業提供了更多的發展機會，也讓全球科技生態系統面臨著新的競爭態勢，促使行業快速向前發展。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富，更是一種洞察宏觀經濟的態度，見證社會演變與科技發展。我們一起，從大變局中看清發展趨勢，希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下，金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角，洞察分析每一個趨勢與機會，為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼，比一部分人更快、更准地看清市場，讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明：本網站提供的信息僅供一般信息分享目的，並不應被視為投資建議。

相關主題:

返回網誌

思錢想後Convo Money

查看全部

MU美光業績已成新的AI硬件風向標

美光本季度營收 415 億美元，環比直接拉漲了 74%，連續兩季度保持 70%+ 的環比增長。與公司此前指引的最高 342 億美金，以及市場預期的 354 億美金，完全不在一個維度上。

MU美光業績已成新的AI硬件風向標

美光本季度營收 415 億美元，環比直接拉漲了 74%，連續兩季度保持 70%+ 的環比增長。與公司此前指引的最高 342 億美金，以及市場預期的 354 億美金，完全不在一個維度上。
PDD拼多多2026年第一季財報，不及市場預期

因國內主站營收增長不及預期，營銷支出也並未明顯下滑，因此實際利潤表現並不及預期。分板塊來看背後原因，我們認為一方面是 Temu 本季減虧的幅度大概率並沒有預期的那麼多，另外國內主站的經營利潤增長應當也相當有限。

PDD拼多多2026年第一季財報，不及市場預期

因國內主站營收增長不及預期，營銷支出也並未明顯下滑，因此實際利潤表現並不及預期。分板塊來看背後原因，我們認為一方面是 Temu 本季減虧的幅度大概率並沒有預期的那麼多，另外國內主站的經營利潤增長應當也相當有限。
小米2026年第一季度財報，主要受手機和汽車毛利率同比回落影響

小米本季度汽車業務毛利率下滑至 20.1%，接近市場預期（20.5%），主要是受均價下滑的影響，其中包含了小米對購置税進行補貼的影響，並在本季度銷售了一部分的低價現車。由於毛利率再次回落，海豚君測算本季度小米汽車業務核心經營利潤再度陷入虧損 31 億元。

小米2026年第一季度財報，主要受手機和汽車毛利率同比回落影響

小米本季度汽車業務毛利率下滑至 20.1%，接近市場預期（20.5%），主要是受均價下滑的影響，其中包含了小米對購置税進行補貼的影響，並在本季度銷售了一部分的低價現車。由於毛利率再次回落，海豚君測算本季度小米汽車業務核心經營利潤再度陷入虧損 31 億元。
NVDA英偉達2027財年第一季度財報，收入752億美元，環比增量為129億美元

NVDA 核心經營指標：總收入 816 億美元，好於上調後的買方預期（780-800 億美元），其中季度環比增長 135 億美元，幾乎都來自於數據中心業務中 Blackwell 量產增加的帶動。

NVDA英偉達2027財年第一季度財報，收入752億美元，環比增量為129億美元

NVDA 核心經營指標：總收入 816 億美元，好於上調後的買方預期（780-800 億美元），其中季度環比增長 135 億美元，幾乎都來自於數據中心業務中 Blackwell 量產增加的帶動。
BYD比亞迪2025年第四季度業績仍然不及預期，賣車單價仍處於下行軌道

比亞迪的業績仍然不及預期。收入雖超預期，但主要由於非核心的比亞迪電子業務高增帶來，而在核心的賣車業務上，賣車單價仍處於下行軌道，賣車成本降幅不夠，最後賣車毛利率雖有回暖，但仍低於市場預期。

BYD比亞迪2025年第四季度業績仍然不及預期，賣車單價仍處於下行軌道

比亞迪的業績仍然不及預期。收入雖超預期，但主要由於非核心的比亞迪電子業務高增帶來，而在核心的賣車業務上，賣車單價仍處於下行軌道，賣車成本降幅不夠，最後賣車毛利率雖有回暖，但仍低於市場預期。
GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌，但這合理嗎？

消息一出，華爾街一度陷入恐慌：如果 AI 突然間不再需要那麼多 RAM 就能運作，這是否意味著記憶體產業的「超級週期」即將結束？答案是否定的。事實上，從歷史規律與經濟學角度來看，情況正好相反。要理解這一點，我們只需要觀察你電腦上的網頁瀏覽器。

GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌，但這合理嗎？

消息一出，華爾街一度陷入恐慌：如果 AI 突然間不再需要那麼多 RAM 就能運作，這是否意味著記憶體產業的「超級週期」即將結束？答案是否定的。事實上，從歷史規律與經濟學角度來看，情況正好相反。要理解這一點，我們只需要觀察你電腦上的網頁瀏覽器。
BABA財報AI投入比較激進

BABA發布第四季財報後股價下跌，財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%，而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資（總額超過530億美元）有效性的擔憂。

BABA財報AI投入比較激進

BABA發布第四季財報後股價下跌，財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%，而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資（總額超過530億美元）有效性的擔憂。
MU美光業績，季度毛利率達到 74.4%!

MU 整體業績：美光本季度營收 238.6 億美元，環比增長 75%，好於上調後的買方預期（199 億美元），本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動，兩大業務環增都在 70% 以上。

MU美光業績，季度毛利率達到 74.4%!

MU 整體業績：美光本季度營收 238.6 億美元，環比增長 75%，好於上調後的買方預期（199 億美元），本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動，兩大業務環增都在 70% 以上。

1 8

查看全部

流科百世Convo Tech

查看全部

Sharpa機器人削蘋果

對人類來說，削蘋果是件輕而易舉的晨間小事，但對機器人而言，這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

Sharpa機器人削蘋果

對人類來說，削蘋果是件輕而易舉的晨間小事，但對機器人而言，這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。
腫瘤療法突破，中國團隊給癌細胞打上“豬”標簽，癌細胞“偽裝朮”被破解

近期，中國科學家在“Cell”雜志上發表的一項突破性研究，為這一頑疾提供了全新思路。他們利用基因編輯技朮，將癌細胞改造成免疫系統眼中的“異類”，類似於人體對豬器官產生的超急性排斥反應，從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

腫瘤療法突破，中國團隊給癌細胞打上“豬”標簽，癌細胞“偽裝朮”被破解

近期，中國科學家在“Cell”雜志上發表的一項突破性研究，為這一頑疾提供了全新思路。他們利用基因編輯技朮，將癌細胞改造成免疫系統眼中的“異類”，類似於人體對豬器官產生的超急性排斥反應，從而引發了一場針對癌細胞的精准“免疫殲滅戰”。
新型大腦設備首次讀出內心聲音，腦機接口技朮打破失語者困境

新系統的核心原理與常見的“嘗試說話”型腦機介面相似，都是在大腦運動皮質植入感測器，這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型，模型依據個人化數據判斷信號對應的聲音，進而預測使用者想說的單字。

新型大腦設備首次讀出內心聲音，腦機接口技朮打破失語者困境

新系統的核心原理與常見的“嘗試說話”型腦機介面相似，都是在大腦運動皮質植入感測器，這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型，模型依據個人化數據判斷信號對應的聲音，進而預測使用者想說的單字。
“垃圾DNA”新發現：遠古病毒DNA在人類發育中發揮關鍵作用

自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來，生物學家們一直在探討它們是否真的無用。如今的主流觀點認為，這些片段雖不直接參與蛋白質合成，卻在整體基因組中佔據了極大比例，顯示它們可能具有重要功能。

“垃圾DNA”新發現：遠古病毒DNA在人類發育中發揮關鍵作用

自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來，生物學家們一直在探討它們是否真的無用。如今的主流觀點認為，這些片段雖不直接參與蛋白質合成，卻在整體基因組中佔據了極大比例，顯示它們可能具有重要功能。

1 4

查看全部

觀點Opinion

查看全部

人工智能AI時代，人類如何重拾批判性思維？

作為批判性思維培養的原始土壤：教育，必須進行重塑。教育政策的制定者和學校必須釆取積極措施，將批判性思維的練習深度融入課程。這遠不止是增加几節理論課，而是要在每一個學科、每一個學習環節中，鼓勵學生質疑和分析AI生成的信息。

人工智能AI時代，人類如何重拾批判性思維？

作為批判性思維培養的原始土壤：教育，必須進行重塑。教育政策的制定者和學校必須釆取積極措施，將批判性思維的練習深度融入課程。這遠不止是增加几節理論課，而是要在每一個學科、每一個學習環節中，鼓勵學生質疑和分析AI生成的信息。
長城汽車面向35歲以上人才開啟專場招聘，職場中的年齡歧視及“35歲現象”挑戰引發深思

長期以來，“35歲現象”如無形枷鎖，將眾多經驗丰富、能力成熟的中年人才拒之門外。長城汽車的“35+計划”不僅是一項招聘舉措，更是一場關於年齡、經驗與價值的社會呼吁，挑戰了傳統的職場偏見，倡導尊重和激活中年人才的力量，為行業和社會注入了新的活力與希望。

長城汽車面向35歲以上人才開啟專場招聘，職場中的年齡歧視及“35歲現象”挑戰引發深思

長期以來，“35歲現象”如無形枷鎖，將眾多經驗丰富、能力成熟的中年人才拒之門外。長城汽車的“35+計划”不僅是一項招聘舉措，更是一場關於年齡、經驗與價值的社會呼吁，挑戰了傳統的職場偏見，倡導尊重和激活中年人才的力量，為行業和社會注入了新的活力與希望。
打破線性人生，在不確定中尋找多元化的人生出路

近年來，全球經濟與地緣格局發生劇烈變化，從疫情沖擊、通脹壓力，到產業結搆重塑，無一不深刻影響着普通人的生活節奏與發展路徑。原本被視為“穩定之路”的人生規划：考學、畢業、就業、升職、買房，如今變得越來越不確定。

打破線性人生，在不確定中尋找多元化的人生出路

近年來，全球經濟與地緣格局發生劇烈變化，從疫情沖擊、通脹壓力，到產業結搆重塑，無一不深刻影響着普通人的生活節奏與發展路徑。原本被視為“穩定之路”的人生規划：考學、畢業、就業、升職、買房，如今變得越來越不確定。
從名校精英到殺手，Luigi Mangione槍擊案背后揭示的美國醫療體系

Luigi Mangione用極端方式撕開了美國醫療體系深藏的裂痕，也逼迫社會不得不重新審視，何為正義？何為悲劇。當醫療保障變成逐利機器，當患者在病痛中苦苦掙扎卻換來拒絕與冷眼，社會的不滿和憤怒便會潛滋暗長，最終以最不可控的方式爆發。

從名校精英到殺手，Luigi Mangione槍擊案背后揭示的美國醫療體系

Luigi Mangione用極端方式撕開了美國醫療體系深藏的裂痕，也逼迫社會不得不重新審視，何為正義？何為悲劇。當醫療保障變成逐利機器，當患者在病痛中苦苦掙扎卻換來拒絕與冷眼，社會的不滿和憤怒便會潛滋暗長，最終以最不可控的方式爆發。

1 4

查看全部

胡說北道Convo Ave(播客)

查看全部

從中國經濟看背後困境及發展新構想?

中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施，中國經濟可能有一個全新的契機注入新的動力，推動經濟穩定健康發展。

從中國經濟看背後困境及發展新構想?

中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施，中國經濟可能有一個全新的契機注入新的動力，推動經濟穩定健康發展。
在變革中的抉擇：當今大環境下如何實現職業規劃與人生價值？

隨著時代的變遷，人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同，有些人追求的是即時的快樂和成就感，而有些人則看重長期的進步和自我超越。

在變革中的抉擇：當今大環境下如何實現職業規劃與人生價值？

隨著時代的變遷，人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同，有些人追求的是即時的快樂和成就感，而有些人則看重長期的進步和自我超越。
再見愛人：探索現代婚姻中的情感困境

芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子，麥琳、李行亮，葛夕、劉爽三對情感關系10年以上的夫妻，以“婚姻紀實觀察”為切口，呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

再見愛人：探索現代婚姻中的情感困境

芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子，麥琳、李行亮，葛夕、劉爽三對情感關系10年以上的夫妻，以“婚姻紀實觀察”為切口，呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。
抖音短劇新風潮：中老年人成為新的增長點?

近日，不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十，閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事，成了當下短劇創作的“新流量密碼”。

抖音短劇新風潮：中老年人成為新的增長點?

近日，不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十，閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事，成了當下短劇創作的“新流量密碼”。

1 4

查看全部

阿里巴巴全新人工智能模型

性能媲美全球領先競爭者

免費訂閱优質資訊