DeepSeek的R1模型凸顯優勢,開源模型或成人工智能開發新選擇?

DeepSeek的R1模型凸顯優勢,開源模型或成人工智能開發新選擇?

發布日期:

商業 Business 狂呼金融 Convo Finance 科技 Tech


要點:
DeepSeek的崛起凸顯了開源技朮的優勢,推動了全球AI技朮的創新與進步,促使更多企業重新審視其人工智能開發模式。

近日,中國AI初創公司DeepSeek/深度求索在發布其最新的DeepSeek-R1模型后,因低開發成本與出色的性能迅速引起了硅谷的關注和市場廣泛關注,甚至引發美股市場的震蕩。Meta首席人工智能科學家Yann LeCun在LinkedIn上表示,部分人看到DeepSeek的表現后誤解為“中國AI正在超越美國”,他認為這種解讀是不准確的,正確的理解應該是“開源模型正在超越專有模型”。他強調,DeepSeek的成功展示了開源模型的力量,特別是在Meta的PyTorch和Llama等開源工具的幫助下,他們能夠基於已有的研究和技朮進行創新,并將其成果開源,造福全球開發者。

在DeepSeek的崛起之際,開源/Open Source技朮的優勢逐漸顯現,它不僅讓全球開發者能夠共同推進技朮創新,還推動了AI領域的快速進步。在DeepSeek等開源驅動的公司推動下,開源的魅力和潛力變得愈發明顯,成為全球人工智能領域的重要推動力量。

開源的發展曆史:不僅是開放源代碼這么簡單

在現代軟件開發領域,開源/Open Source與閉源/Closed Source是兩種主要的開發模式,它們在開發方法、代碼開放程度、社區參與以及商業模式等方面有顯著差異。

開源軟件是指其源代碼對外開放,任何人都可以查看、修改和分發這些代碼。開源的核心理念是共享與協作、開放源代碼,允許公眾訪問、使用、修改和分發模型的源代碼,促使全球開發者在此基礎上進行創新與協作。著名的開源軟件如Linux操作系統、Apache HTTP Server和Python等編程語言的實現版本,都是在這種開放的環境下發展壯大的。

而開源的理念可以追溯到計算機技朮的初期,那個時候軟件和硬件緊密結合,用戶往往需要自行編寫或修改軟件來解決特定問題。

1955年,IBM啟動了“IBM用戶組分享”,希望讓更多人能夠深入研究操作系統。到了20世紀70年代中期,隨着計算機技朮的迅猛發展,軟件逐漸成為商品,開始脫離硬件單獨出售,這一轉變限制了軟件的共享文化。為此,Richard Stallman於1983年發起了GNU項目,并在1985年成立了自由軟件基金會/FSF,推動自由軟件的發展。

1998年,Eric Raymond和Bruce Perens成立了開源促進會/Open Source Initiative簡稱OSI,并制定了“開源定義”/Open Source Definition,正式為開源軟件設定標准。開源促進會明確規定,開源軟件不僅需要公開源代碼,還要允許用戶自由使用、修改和分發,同時,開源項目必須遵循某種開源許可證,如GPL、Apache、BSD和MIT等。

從技朮角度來看,大模型涉及許多復雜的技朮問題,單靠一家企業的力量難以解決。開源大模型鼓勵全球開發者社區參與和貢獻,集體智慧的力量能夠加速技朮的迭代和創新,像GitHub上的多個AI項目便驗證了這一點。

其次,開源模式的最大優勢之一是透明性,開發者可以對代碼進行審查和優化,從而提高軟件的安全性與穩定性。開源還鼓勵全球開發者的參與,通過社區的貢獻與反饋,推動軟件的快速迭代與創新。同時,低成本的試錯也幫助開源大模型迅速觸及潛在用戶,降低了企業在認知和決策上的難度,推動了創新的加速。

與此相對,閉源軟件是指源代碼不公開,只有開發者或公司內部人員可以訪問和修改。閉源軟件通常由商業公司開發和銷售,比如Microsoft Windows操作系統和Adobe Photoshop圖像處理軟件等。閉源軟件的主要優勢在於開發公司對源代碼的完全控制,能夠確保軟件質量的一致性。同時,閉源軟件通過銷售許可證和提供技朮支持等服務,獲得穩定的收入來源,支持持續的研發和創新。

事實上,大模型的技朮浪潮,某種程度上也是由開源開啟,谷歌開源了Transformer,才有了后來OpenAI引爆行業的ChatGPT。不少專家認為,開源人工智能可以促進合作,加速創新,并讓尖端技朮的獲取變得更加民主化。通過共享模型和代碼庫,全球的研究人員和開發者可以在前人的基礎上進行創新,從而推動快速進步和多樣化的應用開發。也支持這一理念。

OpenAI最初也是一家開源人工智能公司,但近年來已逐漸轉向閉源模式,研發人工智能專有模型。雖然這種方法可以帶來顯著的突破,但也可能導致重復勞動和技朮傳播速度的減緩。而且,專有模型往往給小型組織或研究人員帶來了進入的門檻,可能會抑制創新。與之相比,DeepSeek的R1模型和Meta的Llama模型都屬於開源,通過受益於開放研究和開源,推動了技朮的快速發展。

DeepSeek突破:低成本開源技朮挑戰巨頭

DeepSeek,來自中國的人工智能初創公司,近日因發布其推理大模型DeepSeek-R1后,憑借其“高性能、低成本”的特性迅速在海外開發者社區中引起轟動,尤其是在硅谷,它的低訓練成本震撼了整個行業。

據相關資料顯示,作為一款開源模型,DeepSeek-R1在數學、代碼、自然語言推理等任務中的表現能夠與OpenAI的GPT-4模型媲美。更令人驚訝的是,DeepSeek透露,R1的預訓練費用僅為557.6萬美元,且在2048塊英偉達H800 GPU集群上(為中國市場定制的低配版GPU)運行55天完成,訓練成本不到OpenAI GPT-4模型的十分之一。DeepSeek表示,R1在后訓練階段大規模釆用了強化學習技朮,即使使用的標注數據極少,也大幅提升了模型的推理能力。

較低的訓練成本使得DeepSeek的使用成本也較低,這使其在市場上具備了強大的競爭力。這一優勢引發了業內的廣泛關注。受此影響,Meta成立了四個專門研究小組,試圖了解DeepSeek是如何降低訓練和運行成本的。OpenAI、Meta以及其他頂級人工智能團隊的開發人員也在仔細研究DeepSeek模型,試圖揭開其比某些美國制造的模型更加經濟高效的秘密。

更為值得註意的是,DeepSeek的R1模型在MIT許可證下完全開源,允許免費用於商業和學朮領域,這種做法與OpenAI等競爭對手的昂貴訂閱模式形成了鮮明對比。DeepSeek通過將監督微調/SFT與強化學習/RL相結合,釆用多階段訓練管道,以提升高階推理能力。這種創新的做法引起了美國研究人員的高度關注,并展示了中國在人工智能領域與硅谷競爭的潛力。

從當前的成就來看,DeepSeek無疑值得全球業界的驚嘆

一方面,DeepSeek展示了中國在大模型領域的強大能力,甚至有潛力追趕并超越全球最先進的技朮。另一方面,DeepSeek得益於開源研究和項目,比如PyTorch和Meta的Llama。其次,技朮創新可以從意想不到的地方涌現。 DeepSeek源自量化私募公司幻方量化。所謂量化私募,是將投資理念轉化為數學模型,通過計算機處理大量曆史股票數據并篩選投資標的。

在DeepSeek發布后,Meta首席執行官馬克·扎克伯格/Mark Zuckerberg宣布,Meta將在2025年投入超過600億美元加大對AI的投資,進一步推動開源模型的發展。扎克伯格一直是開源模式的積極倡導者,他在今年9月表示,他的目標是打造一個下一代的開放平台,并讓這一平台在未來的科技行業中占據主導地位。

隨着這些技朮的發展與普及,開源不僅推動了軟件行業的創新,還為全球開發者提供了一個共享知識、協作創新的平台。通過開放源代碼,開源項目能夠迅速迭代并集結全球開發者的智慧,形成強大的生態系統,進一步促進了技朮進步。

開源大模型:或成未來商業生態

開源世界的飛速發展正在打破軟件行業的壟斷格局,引發了全球范圍內的技朮革新。開源本質上意味着人工智能AI可以替代傳統人力,高效優質的團隊和勞動力也可通過AI技朮得以替代。

盡管開源已成為當前大模型發展的主流趨勢,但也面臨諸多挑戰

開源大模型的商業模式仍處於不確定階段,如何在保持開放的同時實現可持續的商業發展,成為了開源廠商亟待解決的問題。盡管已有成功案例,但開源大模型的商業化依然充滿挑戰。在競爭日益激烈的市場中,如何提升大模型的知名度和用戶接受度,從而促使用戶從免費使用轉向付費服務,是開源廠商面臨的核心問題。同時,如何防止競爭對手基於相同的代碼庫創建自己的產品或服務,也是開源大模型需要應對的難題。

此外,開源人工智能具有明顯的優勢,但安全性、濫用及道德問題依舊是焦點。開源模型有可能被用於惡意目的,如何平衡開放性與潛在風險,成為了行業討論的重要議題。LeCun在倡導開放AI研究的同時,強調了釆取適當安全措施的重要性,并認為開源可以推動人工智能的進步,確保“好的人工智能”領先於“壞的人工智能”。

在全球AI技朮快速發展的背景下,DeepSeek的成功不僅展示了中國AI初創公司的崛起,也突顯了開源大模型的巨大潛力。與OpenAI等公司依賴封閉生態的策略不同,DeepSeek選擇將其技朮開源,推動了全球開發者的參與和創新。這一舉措讓開源模式的優勢得到了進一步驗證,尤其是在技朮共享和協作創新方面,極大提升了AI的普及速度。

但有專家認為,開源與閉源并非非此即彼的選擇,而是需要綜合考慮的策略。對於擁有足夠資源和決心的企業來說,完全可以在開源中展示技朮實力、獲取反饋和數據,從而為后續的商業化變現奠定基礎。而閉源模型則可以封裝技朮優勢,直接實現產品化和商業化。開源和閉源并非像手機操作系統的iOS與安卓那樣只能二選一,開源是為了建立信譽和吸引用戶,同時為商業化做准備。

在現代大模型的開發中,開源提供了更高的透明度,鼓勵全球開發者共同參與,使得技朮能夠更快地迭代和完善。而閉源模式則通過專有技朮的封鎖,確保了公司對核心技朮的控制力。在這個過程中,開源與閉源并不是互相排斥的選擇,而是可以結合使用的策略。在這個大模型時代,科技公司正面臨生態演變的重大考量,開源與閉源的博弈仍在繼續,未來將呈現哪些新的特點和方向,值得我們持續關注。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回網誌
  • PDD拼多多2026年第一季財報,不及市場預期

    PDD拼多多2026年第一季財報,不及市場預期

    因國內主站營收增長不及預期,營銷支出也並未明顯下滑,因此實際利潤表現並不及預期。分板塊來看背後原因,我們認為一方面是 Temu 本季減虧的幅度大概率並沒有預期的那麼多,另外國內主站的經營利潤增長應當也相當有限。

    PDD拼多多2026年第一季財報,不及市場預期

    因國內主站營收增長不及預期,營銷支出也並未明顯下滑,因此實際利潤表現並不及預期。分板塊來看背後原因,我們認為一方面是 Temu 本季減虧的幅度大概率並沒有預期的那麼多,另外國內主站的經營利潤增長應當也相當有限。

  • 小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米本季度汽車業務毛利率下滑至 20.1%,接近市場預期(20.5%),主要是受均價下滑的影響,其中包含了小米對購置税進行補貼的影響,並在本季度銷售了一部分的低價現車。由於毛利率再次回落,海豚君測算本季度小米汽車業務核心經營利潤再度陷入虧損 31 億元。

    小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米本季度汽車業務毛利率下滑至 20.1%,接近市場預期(20.5%),主要是受均價下滑的影響,其中包含了小米對購置税進行補貼的影響,並在本季度銷售了一部分的低價現車。由於毛利率再次回落,海豚君測算本季度小米汽車業務核心經營利潤再度陷入虧損 31 億元。

  • NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    NVDA 核心經營指標:總收入 816 億美元,好於上調後的買方預期(780-800 億美元),其中季度環比增長 135 億美元,幾乎都來自於數據中心業務中 Blackwell 量產增加的帶動。

    NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    NVDA 核心經營指標:總收入 816 億美元,好於上調後的買方預期(780-800 億美元),其中季度環比增長 135 億美元,幾乎都來自於數據中心業務中 Blackwell 量產增加的帶動。

  • BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亞迪的業績仍然不及預期。收入雖超預期,但主要由於非核心的比亞迪電子業務高增帶來,而在核心的賣車業務上,賣車單價仍處於下行軌道,賣車成本降幅不夠,最後賣車毛利率雖有回暖,但仍低於市場預期。

    BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亞迪的業績仍然不及預期。收入雖超預期,但主要由於非核心的比亞迪電子業務高增帶來,而在核心的賣車業務上,賣車單價仍處於下行軌道,賣車成本降幅不夠,最後賣車毛利率雖有回暖,但仍低於市場預期。

  • GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    消息一出,華爾街一度陷入恐慌:如果 AI 突然間不再需要那麼多 RAM 就能運作,這是否意味著記憶體產業的「超級週期」即將結束?答案是否定的。事實上,從歷史規律與經濟學角度來看,情況正好相反。要理解這一點,我們只需要觀察你電腦上的網頁瀏覽器。

    GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    消息一出,華爾街一度陷入恐慌:如果 AI 突然間不再需要那麼多 RAM 就能運作,這是否意味著記憶體產業的「超級週期」即將結束?答案是否定的。事實上,從歷史規律與經濟學角度來看,情況正好相反。要理解這一點,我們只需要觀察你電腦上的網頁瀏覽器。

  • BABA財報AI投入比較激進

    BABA財報AI投入比較激進

    BABA發布第四季財報後股價下跌,財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%,而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資(總額超過530億美元)有效性的擔憂。

    BABA財報AI投入比較激進

    BABA發布第四季財報後股價下跌,財報顯示其營收和利潤均大幅低於預期。這家電商巨頭的季度淨利暴跌67%,而總營收僅成長1.7%約413億美元。這些表現引發了人們對阿里巴巴在AI人工智慧領域巨額投資(總額超過530億美元)有效性的擔憂。

  • MU美光業績,季度毛利率達到 74.4%!

    MU美光業績,季度毛利率達到 74.4%!

    MU 整體業績:美光本季度營收 238.6 億美元,環比增長 75%,好於上調後的買方預期(199 億美元),本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動,兩大業務環增都在 70% 以上。

    MU美光業績,季度毛利率達到 74.4%!

    MU 整體業績:美光本季度營收 238.6 億美元,環比增長 75%,好於上調後的買方預期(199 億美元),本季度收入增長主要來自於 DRAM 和 NAND 業務的雙重帶動,兩大業務環增都在 70% 以上。

  • Tencent騰訊業績整體看無驚無喜?

    Tencent騰訊業績整體看無驚無喜?

    騰訊一口氣連發多個 “龍蝦” 產品,能夠看出公司在元寶春節大戰中失利後的焦慮,雖然倉促推出產品還不夠完善。不過這個緊迫感的轉變很關鍵也很必要。就目前來看,微信入口似乎在 AI 原生應用盛行的當下仍然有無法撼動的地位。

    Tencent騰訊業績整體看無驚無喜?

    騰訊一口氣連發多個 “龍蝦” 產品,能夠看出公司在元寶春節大戰中失利後的焦慮,雖然倉促推出產品還不夠完善。不過這個緊迫感的轉變很關鍵也很必要。就目前來看,微信入口似乎在 AI 原生應用盛行的當下仍然有無法撼動的地位。

1 / 8
  • Sharpa機器人削蘋果

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

  • 腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

  • 新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

  • “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

1 / 4