要点:
随着AI大模型时代的到来,开源与闭源之争已从技术路径分歧演变为一场生态主导权与产业规则制定的博弈,开源正逐步展现出打破垄断、重构竞争格局的强大势能。
2025年初,中国人工智能公司DeepSeek-R1的成功引爆了全球开源热潮。紧接着中国大模型的开源消息频频出现,覆盖了自然语言处理、计算机视觉、多模态等多个技术领域。近日,华为首次将盘古大模型的核心能力开放,标志着国产大模型开源竞争迈入一个新的阶段。
回顾“开源AI大模型”的起点,Meta率先推出的LLaMA系列模型,被广泛认为是开源AI领域的先驱。如今,全球范围内的AI开源浪潮正逐渐形成。那么,开源为何成为趋势?开源又将带来怎样的深远影响?让我们一同深入探讨。
开源VS 闭源的定义及区别
自人工智能AI大模型兴起以来,围绕“大模型应该开源还是闭源”的讨论始终是业界争议的焦点。这不仅关乎技术路径的选择,更是一场关于生态主导权与价值分配方式的深层博弈。
所谓开源/Open Source,是指将源代码向公众开放,允许开发者自由使用、修改、分发及构建衍生项目。相较之下,闭源模式/Closed Source则将控制权集中于模型创造者手中,其源代码与训练权重通常保密,仅向特定对象开放。
两者的差异,不仅体现为代码是否开放,更体现为技术扩散路径与价值创造逻辑的根本不同。本质上,开源意味着以开放换生态,以生态促进发展。相比闭源所构建的壁垒体系,开源模式更易聚合全球开发者的集体智慧,加快模型的迭代与扩散速度。
而从商业视角来看,开源与闭源往往被视作“短期盈利”与“长期生态”的两种路径。闭源模式如同“专利药”,在初期依赖技术壁垒快速变现,却易受技术演进或生态变化冲击。而开源则像“通用药”,通过降低使用门槛、构建开发者社区与应用生态,逐步形成长期竞争优势,但回报周期更长、风险更分散。
事实上,开源的兴起可追溯至20世纪中叶。最早,计算机软件与硬件往往捆绑销售,用户需自行编写或修改代码以满足需求。上世纪70年代,软件开始商业化,催生了自由软件运动。 1983年,理查德·斯托曼发起GNU项目,随后在1985年创立自由软件基金会/FSF,标志开源精神正式登场。 1998年,“开源定义”由开源促进会/OSI提出,为开源项目设定了明确标准,包括可自由使用、修改、再发布等核心条款,伴随各种开源许可证(如GPL、MIT、Apache)一同发展。
这些原则推动了以LAMP(Linux、Apache、MySQL、PHP/Python/Perl)为代表的技术栈崛起,支撑了大批网站和网络应用的开发。 Linux负责操作系统,Apache为Web服务器,MySQL处理数据库,PHP等语言则用于业务逻辑编写。这一协作体系为现代互联网构建了基础,也为全球开发者提供了协作、共享、创新的平台。
如今,进入大模型时代,开源不再只是技术分享,更成为重塑AI创新模式的重要变量。
谷歌/Google开源Transformer架构,为大模型技术奠定基础。随后由OpenAI率先通过闭源ChatGPT引爆市场,但开源的力量从未停歇。今年1月,中国人工智能公司DeepSeek横空出世,以开源模式迅速聚拢开发者与产业链资源,加速AI应用场景爆发,更是直接撼动了OpenAI等主流闭源巨头的地位。
在全球监管日益明朗、技术边界不断扩展的背景下,开源大模型正逐渐成为AI产业的共识,一场由全球科技巨头主导的“大模型开源竞赛”悄然展开。这不仅标志着商业模式的深刻重构,更可能左右下一阶段人工智能技术话语权的归属,而这一浪潮的先行者便是全球开源先锋Meta推出的大型语言模型LLaMA 2。
全球开源先锋:Meta大型语言模型LLaMA
2014年,谷歌以超过4亿美元的高价收购了初出茅庐的AI新星DeepMind,引发业内轰动。这场收购战的另一位竞标者是Facebook,当时还未更名为Meta。对扎克伯格而言,失去DeepMind的代价不仅是一次商业竞购的失败,更是错失构建AI核心能力的机会。几乎在同一时间,马斯克也对谷歌的AI野心感到不安,担忧AI若掌握在少数巨头之手,将对人类构成潜在威胁。
两人随后分别做出了自己的回应。扎克伯格高薪挖来了纽约大学的AI专家杨立昆,在Facebook内部组建FAIR实验室,试图自主打造AI技术体系。马斯克则联合山姆・奥尔特曼,发起了OpenAI,一个以“开源”为旗帜、对抗封闭巨头的非营利项目。
而在接下来的几年里,OpenAI迅速崛起,从GPT-2的开源出发,到GPT-3之后的闭源转型,再到GPT-4的“全面封闭”,逐渐与微软形成深度绑定。另一边,谷歌则将DeepMind与自家AI部门合并,打造Gemini系列模型,构建起“Google DeepMind”这一产业巨轮。大模型赛道进入了OpenAI-微软、DeepMind-谷歌双雄争霸的局面。
这让Meta的处境变得微妙。尤其在ChatGPT掀起全球轰动的那段时间,Meta的AI努力几乎被淹没在元宇宙裁员、战略转型等负面消息中。
在OpenAI站上神坛、谷歌奋起直追的背景下,Meta似乎失去了在AI领域的主导权。此时,转向“开源”成为它的一种战略突破口。某种意义上,是在资源、声量和估值压力下的“被动选择”。
2023年2月,在ChatGPT引爆全球后仅三个月,Meta发布了LLaMA模型,并以研究许可形式开源。彼时,这款模型的开放更多是学术导向,尚不具备商用自由。但到了7月,Meta正式推出LLaMA 2,并大幅放开商用限制,同时完整公开训练数据、模型架构、优化细节乃至训练代码。这一手堪称“开源大礼包”,不仅赢得开发者好感,也使Meta从“陪跑者”跃升为开源阵营的领军者。
开源之举让Meta在OpenAI与谷歌的闭源对抗格局中撕开一道裂口。它不再试图硬碰硬争夺封闭技术的高地,而是通过透明、共享的技术路径构建广泛生态,在开源社群中重塑影响力。可以说,Meta借助开源,绕开了正面战场,以“第三极力量”的姿态突围成功。在开源的名义下,Meta赢得了社区、开发者与企业的支持,成为挑战“封闭双雄”格局的重要变量。
而在今年年初,中国人工智能AI公司DeepSeek团队率先打出“开源+深度思考/DeepThink”组合拳,在技术层面引入多轮推理链条与动态记忆机制,使模型具备更强的问题理解与逻辑演绎能力。而这场由DeepSeek引发的震荡,也在倒逼曾坚持闭源的公司做出调整。
2月,OpenAI首席执行官山姆·奥特曼公开表示,未来将重新审视开源战略,承认此前在开源问题上“站在历史的错误一边”,并透露公司内部正讨论模型权重等内容的开放方式。这意味着,即便是最坚定的闭源拥护者,也开始意识到生态协同的不可替代性。
目前,全球范围内的主流大模型厂商,包括Meta的LLaMA、谷歌的Gemini以及OpenAI旗下部分新模型,也陆续在原来的基础上,加入了类似“深度思考”模块。这一能力的标准化和普及,预示着大模型从表层语言生成,迈向更接近人类逻辑推理与认知决策的关键一步,全球AI发展由此进入“类智能增强”的新阶段。更重要的是,这一行动激励了全球特别是中国更多企业积极投身开源浪潮,推动行业整体向开放协作迈进。
中国开源新例:华为首个开源盘古大模型
6月30日,华为首次宣布开源盘古大模型的核心能力,包括70亿参数的稠密模型、720亿参数的盘古Pro MoE(混合专家模型),以及基于升腾芯片的模型推理技术。此次开源面向全球开发者、企业和研究机构,标志着华为在AI基础模型领域迈出关键一步,旨在加速构建开放、协同、共赢的人工智能生态。
盘古大模型平台集数据管理、模型训练与部署于一体,支持多场景模型定制与开发,提供全生命周期工具链,帮助企业高效实现模型能力的生产化落地。此次开源也进一步巩固了华为在AI模型开放性和产业赋能方面的技术布局。
在此前举行的华为开发者大会2025(HDC 2025)上,华为常务董事、华为云CEO张平安宣布,基于CloudMatrix 384超节点架构的新一代升腾AI云服务正式上线,为盘古大模型5.5提供强劲算力支持。盘古5.5涵盖自然语言处理/NLP、计算机视觉/CV、多模态、预测分析与科学计算五大基础模型,全面升级性能与通用性。
升腾AI云服务是华为面向AI时代的重要基础设施,其核心创新在于通过MatrixLink高速互联技术,将384颗升腾NPU与192颗鲲鹏CPU组成一台“超级AI服务器”。该架构不仅支持“一卡一专家”的并行推理模式,能高效运行MoE模型,还能灵活实现“训推一体化”,将算力利用率提升50%以上。超节点可扩展至16万张卡的超大集群,满足未来万亿级参数大模型的训练与推理需求。目前,升腾AI云已为科大讯飞、中国科学院、面壁智能、360等超1300家客户提供服务,广泛覆盖政企、科研、工业等多个领域,成为国产AI基础设施的关键一环。
华为表示,此次开源举措是其升腾生态战略的延伸,旨在推动大模型技术研发与行业应用的深度融合,助力千行百业实现智能化转型。同时,这也被视为华为AI国际化战略的重要一环,公司正积极拓展包括发展中国家在内的新兴市场,构建全球协同创新网络。
而业内人士则认为,华为此次的“芯片+模型”开源模式,与谷歌正在推进的Gemma模型和TPU架构有异曲同工之妙,在当前中美技术割裂背景下,或将成为中国AI产业走向自主可控与国际化的重要突破口。
更值得注意的是,在同一天,百度也宣布完全开源文心大模型4.5系列中的10款模型,涵盖预训练权重与推理代码,反映中国AI大模型生态正面临日益激烈的竞争格局。
中国开源加速:百度文心大模型4.5系列
同一天,百度正式开源文心大模型4.5系列,包括47B和3B激活参数的混合专家/MoE模型,以及0.3B参数的稠密模型在内的10款模型,全面开放预训练权重和推理代码。用户现可通过飞桨星河社区、HuggingFace平台下载部署模型,也可在百度智能云千帆平台使用相应API服务。
早在今年2月,百度已公布开源文心4.5系列的计划,并明确将于6月底前完成开源落地。此次开源标志百度在开源战略上迈出实质性一步,也意味着其在国产大模型生态建设上已形成从算力、框架、模型到应用的全栈能力闭环。
据介绍,文心4.5开源系列在MoE架构基础上,提出创新性多模态异构结构,适配大语言模型向多模态模型的迁移预训练范式。该架构不仅保持甚至提升了文本任务的性能,同时显着增强图文、语言等多模态理解能力。其优越表现得益于三大核心技术:多模态混合专家预训练机制、高效训练与推理框架,以及面向特定模态的后训练优化方案。
本次模型权重基于Apache 2.0协议开源,允许学术研究和商业应用自由使用,并通过飞桨提供的产业级开源开发套件实现广泛芯片兼容性,进一步降低模型落地门槛。与模型同步,百度还发布了文心大模型开发套件ERNIEKit 和部署工具FastDeploy,提供从开发到部署的全流程工具支持,实现开箱即用。
值得关注的是,此次开源使百度完成了“框架层+模型层”的双层开源战略。作为中国最早布局人工智能的科技企业之一,百度凭借自研飞桨深度学习平台,已在模型开发与产业应用之间打通技术链路,形成具有自主可控能力的AI生态系统。飞桨作为中国首个自主开源的产业级AI框架,至今已形成丰富的模型库与开发工具集。
在此之前,阿里巴巴与腾讯也相继宣布开源旗下大模型。华为与百度此次的联动式开放行动,被业界普遍视为中国AI厂商从“闭源竞争”迈向“开源生态”的重要转折点,预计将加速本土大模型在技术共建与生态共荣方向上的发展步伐,推动行业走向更加开放协作的新阶段。
大模型之争:开源与闭源成为“零和博弈”
在商业竞争中,开源不仅是技术共享的手段,也是一种深具战略性的市场重构工具。对于许多企业而言,开源的真正价值并不在于直接变现,而在于通过开放协作,重塑市场规则、降低进入门槛,并削弱主导企业的垄断地位。换句话说,开源是一种间接但高效的“破局手段”,尤其适用于资源有限、但想打入关键市场的公司。
以Apache为例,它通过社区合作的方式,共同开发Web服务器核心技术,使众多厂商在面对微软IIS这样的巨头时,具备了可行的替代方案。微软凭借其雄厚资金和在桌面市场的控制力,几乎无人能敌,但Apache的兴起让所有参与者共享了一个高质量、低成本的技术平台。这不仅提升了例如IBM WebSphere等增值产品的竞争力,也让客户对供应商锁定的担忧大大减少,从而扩大了市场接受度。
而Red Hat出资开发RPM软件包管理系统的目的,也并非单纯提供一个工具,而是试图为Linux建立统一的安装规范。这种标准化带来了客户信任,降低了部署与运维难度,也强化了Red Hat自身的市场领导地位。通过“先造池塘,再做大青蛙”,Red Hat不仅提升了整个Linux生态的商业化基础,也有效削弱了微软在系统易用性方面的既有优势。
当前业界常将开源与闭源大模型视作对立阵营,是一场非此即彼的“零和博弈”。过去,闭源模型凭借其商业化程度高、产品体验成熟,获得了市场的主流青睐。而开源模型则因技术门槛高、生态尚不健全,常被视为“小众玩家”的选择。但随着人工智能进入深水区,开源正以其极具性价比的灵活模式、快速迭代的生态机制,以及更容易“看懂”的透明性,正在赢得越来越多开发者、企业和政府的青睐。
如今的大模型竞争格局,正在被“开源”彻底改写。一位业内人士直言,这种转变就像当年安卓替代塞班,不是因为硬碰硬赢了性能比拼,而是通过生态开放和平台思维,实现了对封闭体系的“降维打击”。在OpenAI与谷歌两强争霸的格局中,Meta借助LLaMA的开源突围,DeepSeek凭借开源一战成名,正是开源策略赋予了“后来者”超越的可能。
尤其在AI大模型这一“基础设施型”赛道中,谁能成为行业标准的定义者,谁就拥有话语权。而开源,正是掌握标准制定权的捷径。 DeepSeek在开源的同时,公布了完整的训练数据集、模型结构、推理代码等,不仅方便全球开发者协同优化,也使其迅速成为各类AI应用构建的底座平台。一旦成为“默认选项”,闭源模型将不得不跟随其技术节奏,被动响应市场变化。
更关键的是,开源为中国AI打破技术壁垒、缩小差距提供了绝佳窗口。过去,在芯片、算力等硬件层面,中国一度被限制追赶。但在开源模型与基础软件层,中国厂商正借助全球协作力量快速起势。从智谱GLM、百川Baichuan、文心ERNIE到华为盘古,再到DeepSeek-R1,中国大模型厂商的活跃已不仅是企业竞争,更逐步上升为国家间的战略角力,体现着数字时代新一轮科技主权的重构与争夺。
开源所引发的“内卷化”,本质上是一种正向激励机制。在共享与开放的前提下,不同团队不断拉高性能上限、压低使用门槛,促进了整个行业的技术繁荣和使用普及。从API调用、私有化部署,到定制微调和行业适配,开源模型已成为推动AI规模落地的关键底座,让更多中小企业和开发者也能参与其中,实现从使用者到贡献者的跃升。
作为投资者,开源带来的不只是成本优化和市场下沉,更是生态护城河和未来增长预期。那些既能以开源吸引广泛社区共建,又能构建闭环能力实现商业化的公司,将具备更强的生存弹性与估值想象空间。开源不等于免费,而是一种以共建换市场、以生态换份额的新型竞争模式。在AI引领的新时代,开源又能否继续提供快速的发展“动力”?我们拭目以待。