要點:
DeepSeek的崛起凸顯了開源技朮的優勢,推動了全球AI技朮的創新與進步,促使更多企業重新審視其人工智能開發模式。
科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。
狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。
狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。
聯系我們 // 相關文章
近日,中國AI初創公司DeepSeek/深度求索在發布其最新的DeepSeek-R1模型后,因低開發成本與出色的性能迅速引起了硅谷的關注和市場廣泛關注,甚至引發美股市場的震蕩。Meta首席人工智能科學家Yann LeCun在LinkedIn上表示,部分人看到DeepSeek的表現后誤解為“中國AI正在超越美國”,他認為這種解讀是不准確的,正確的理解應該是“開源模型正在超越專有模型”。他強調,DeepSeek的成功展示了開源模型的力量,特別是在Meta的PyTorch和Llama等開源工具的幫助下,他們能夠基於已有的研究和技朮進行創新,并將其成果開源,造福全球開發者。
在DeepSeek的崛起之際,開源/Open Source技朮的優勢逐漸顯現,它不僅讓全球開發者能夠共同推進技朮創新,還推動了AI領域的快速進步。在DeepSeek等開源驅動的公司推動下,開源的魅力和潛力變得愈發明顯,成為全球人工智能領域的重要推動力量。
開源的發展曆史:不僅是開放源代碼這么簡單
在現代軟件開發領域,開源/Open Source與閉源/Closed Source是兩種主要的開發模式,它們在開發方法、代碼開放程度、社區參與以及商業模式等方面有顯著差異。
開源軟件是指其源代碼對外開放,任何人都可以查看、修改和分發這些代碼。開源的核心理念是共享與協作、開放源代碼,允許公眾訪問、使用、修改和分發模型的源代碼,促使全球開發者在此基礎上進行創新與協作。著名的開源軟件如Linux操作系統、Apache HTTP Server和Python等編程語言的實現版本,都是在這種開放的環境下發展壯大的。
而開源的理念可以追溯到計算機技朮的初期,那個時候軟件和硬件緊密結合,用戶往往需要自行編寫或修改軟件來解決特定問題。
1955年,IBM啟動了“IBM用戶組分享”,希望讓更多人能夠深入研究操作系統。到了20世紀70年代中期,隨着計算機技朮的迅猛發展,軟件逐漸成為商品,開始脫離硬件單獨出售,這一轉變限制了軟件的共享文化。為此,Richard Stallman於1983年發起了GNU項目,并在1985年成立了自由軟件基金會/FSF,推動自由軟件的發展。
1998年,Eric Raymond和Bruce Perens成立了開源促進會/Open Source Initiative簡稱OSI,并制定了“開源定義”/Open Source Definition,正式為開源軟件設定標准。開源促進會明確規定,開源軟件不僅需要公開源代碼,還要允許用戶自由使用、修改和分發,同時,開源項目必須遵循某種開源許可證,如GPL、Apache、BSD和MIT等。
從技朮角度來看,大模型涉及許多復雜的技朮問題,單靠一家企業的力量難以解決。開源大模型鼓勵全球開發者社區參與和貢獻,集體智慧的力量能夠加速技朮的迭代和創新,像GitHub上的多個AI項目便驗證了這一點。
其次,開源模式的最大優勢之一是透明性,開發者可以對代碼進行審查和優化,從而提高軟件的安全性與穩定性。開源還鼓勵全球開發者的參與,通過社區的貢獻與反饋,推動軟件的快速迭代與創新。同時,低成本的試錯也幫助開源大模型迅速觸及潛在用戶,降低了企業在認知和決策上的難度,推動了創新的加速。
與此相對,閉源軟件是指源代碼不公開,只有開發者或公司內部人員可以訪問和修改。閉源軟件通常由商業公司開發和銷售,比如Microsoft Windows操作系統和Adobe Photoshop圖像處理軟件等。閉源軟件的主要優勢在於開發公司對源代碼的完全控制,能夠確保軟件質量的一致性。同時,閉源軟件通過銷售許可證和提供技朮支持等服務,獲得穩定的收入來源,支持持續的研發和創新。
事實上,大模型的技朮浪潮,某種程度上也是由開源開啟,谷歌開源了Transformer,才有了后來OpenAI引爆行業的ChatGPT。不少專家認為,開源人工智能可以促進合作,加速創新,并讓尖端技朮的獲取變得更加民主化。通過共享模型和代碼庫,全球的研究人員和開發者可以在前人的基礎上進行創新,從而推動快速進步和多樣化的應用開發。也支持這一理念。
OpenAI最初也是一家開源人工智能公司,但近年來已逐漸轉向閉源模式,研發人工智能專有模型。雖然這種方法可以帶來顯著的突破,但也可能導致重復勞動和技朮傳播速度的減緩。而且,專有模型往往給小型組織或研究人員帶來了進入的門檻,可能會抑制創新。與之相比,DeepSeek的R1模型和Meta的Llama模型都屬於開源,通過受益於開放研究和開源,推動了技朮的快速發展。
DeepSeek突破:低成本開源技朮挑戰巨頭
DeepSeek,來自中國的人工智能初創公司,近日因發布其推理大模型DeepSeek-R1后,憑借其“高性能、低成本”的特性迅速在海外開發者社區中引起轟動,尤其是在硅谷,它的低訓練成本震撼了整個行業。
據相關資料顯示,作為一款開源模型,DeepSeek-R1在數學、代碼、自然語言推理等任務中的表現能夠與OpenAI的GPT-4模型媲美。更令人驚訝的是,DeepSeek透露,R1的預訓練費用僅為557.6萬美元,且在2048塊英偉達H800 GPU集群上(為中國市場定制的低配版GPU)運行55天完成,訓練成本不到OpenAI GPT-4模型的十分之一。DeepSeek表示,R1在后訓練階段大規模釆用了強化學習技朮,即使使用的標注數據極少,也大幅提升了模型的推理能力。
較低的訓練成本使得DeepSeek的使用成本也較低,這使其在市場上具備了強大的競爭力。這一優勢引發了業內的廣泛關注。受此影響,Meta成立了四個專門研究小組,試圖了解DeepSeek是如何降低訓練和運行成本的。OpenAI、Meta以及其他頂級人工智能團隊的開發人員也在仔細研究DeepSeek模型,試圖揭開其比某些美國制造的模型更加經濟高效的秘密。
更為值得註意的是,DeepSeek的R1模型在MIT許可證下完全開源,允許免費用於商業和學朮領域,這種做法與OpenAI等競爭對手的昂貴訂閱模式形成了鮮明對比。DeepSeek通過將監督微調/SFT與強化學習/RL相結合,釆用多階段訓練管道,以提升高階推理能力。這種創新的做法引起了美國研究人員的高度關注,并展示了中國在人工智能領域與硅谷競爭的潛力。
從當前的成就來看,DeepSeek無疑值得全球業界的驚嘆
一方面,DeepSeek展示了中國在大模型領域的強大能力,甚至有潛力追趕并超越全球最先進的技朮。另一方面,DeepSeek得益於開源研究和項目,比如PyTorch和Meta的Llama。其次,技朮創新可以從意想不到的地方涌現。 DeepSeek源自量化私募公司幻方量化。所謂量化私募,是將投資理念轉化為數學模型,通過計算機處理大量曆史股票數據并篩選投資標的。
在DeepSeek發布后,Meta首席執行官馬克·扎克伯格/Mark Zuckerberg宣布,Meta將在2025年投入超過600億美元加大對AI的投資,進一步推動開源模型的發展。扎克伯格一直是開源模式的積極倡導者,他在今年9月表示,他的目標是打造一個下一代的開放平台,并讓這一平台在未來的科技行業中占據主導地位。
隨着這些技朮的發展與普及,開源不僅推動了軟件行業的創新,還為全球開發者提供了一個共享知識、協作創新的平台。通過開放源代碼,開源項目能夠迅速迭代并集結全球開發者的智慧,形成強大的生態系統,進一步促進了技朮進步。
開源大模型:或成未來商業生態
開源世界的飛速發展正在打破軟件行業的壟斷格局,引發了全球范圍內的技朮革新。開源本質上意味着人工智能AI可以替代傳統人力,高效優質的團隊和勞動力也可通過AI技朮得以替代。
盡管開源已成為當前大模型發展的主流趨勢,但也面臨諸多挑戰
開源大模型的商業模式仍處於不確定階段,如何在保持開放的同時實現可持續的商業發展,成為了開源廠商亟待解決的問題。盡管已有成功案例,但開源大模型的商業化依然充滿挑戰。在競爭日益激烈的市場中,如何提升大模型的知名度和用戶接受度,從而促使用戶從免費使用轉向付費服務,是開源廠商面臨的核心問題。同時,如何防止競爭對手基於相同的代碼庫創建自己的產品或服務,也是開源大模型需要應對的難題。
此外,開源人工智能具有明顯的優勢,但安全性、濫用及道德問題依舊是焦點。開源模型有可能被用於惡意目的,如何平衡開放性與潛在風險,成為了行業討論的重要議題。LeCun在倡導開放AI研究的同時,強調了釆取適當安全措施的重要性,并認為開源可以推動人工智能的進步,確保“好的人工智能”領先於“壞的人工智能”。
在全球AI技朮快速發展的背景下,DeepSeek的成功不僅展示了中國AI初創公司的崛起,也突顯了開源大模型的巨大潛力。與OpenAI等公司依賴封閉生態的策略不同,DeepSeek選擇將其技朮開源,推動了全球開發者的參與和創新。這一舉措讓開源模式的優勢得到了進一步驗證,尤其是在技朮共享和協作創新方面,極大提升了AI的普及速度。
但有專家認為,開源與閉源并非非此即彼的選擇,而是需要綜合考慮的策略。對於擁有足夠資源和決心的企業來說,完全可以在開源中展示技朮實力、獲取反饋和數據,從而為后續的商業化變現奠定基礎。而閉源模型則可以封裝技朮優勢,直接實現產品化和商業化。開源和閉源并非像手機操作系統的iOS與安卓那樣只能二選一,開源是為了建立信譽和吸引用戶,同時為商業化做准備。
在現代大模型的開發中,開源提供了更高的透明度,鼓勵全球開發者共同參與,使得技朮能夠更快地迭代和完善。而閉源模式則通過專有技朮的封鎖,確保了公司對核心技朮的控制力。在這個過程中,開源與閉源并不是互相排斥的選擇,而是可以結合使用的策略。在這個大模型時代,科技公司正面臨生態演變的重大考量,開源與閉源的博弈仍在繼續,未來將呈現哪些新的特點和方向,值得我們持續關注。
投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。
狂呼金融研究所聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。
狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。
聯系我們 // 相關文章