DeepSeek的R1模型凸顯優勢,開源模型或成人工智能開發新選擇?

DeepSeek的R1模型凸显优势,开源模型或成人工智能开发新选择?

發布日期:

商業 Business


要点:
DeepSeek的崛起凸显了开源技术的优势,推动了全球AI技术的创新与进步,促使更多企业重新审视其人工智能开发模式。

科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。

狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。

狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。

联系我们// 相关文章

近日,中国AI初创公司DeepSeek/深度求索在发布其最新的DeepSeek-R1模型后,因低开发成本与出色的性能迅速引起了硅谷的关注和市场广泛关注,甚至引发美股市场的震荡。 Meta首席人工智能科学家Yann LeCun在LinkedIn上表示,部分人看到DeepSeek的表现后误解为“中国AI正在超越美国”,他认为这种解读是不准确的,正确的理解应该是“开源模型正在超越专有模型”。他强调,DeepSeek的成功展示了开源模型的力量,特别是在Meta的PyTorch和Llama等开源工具的帮助下,他们能够基于已有的研究和技术进行创新,并将其成果开源,造福全球开发者。

在DeepSeek的崛起之际,开源/Open Source技术的优势逐渐显现,它不仅让全球开发者能够共同推进技术创新,还推动了AI领域的快速进步。在DeepSeek等开源驱动的公司推动下,开源的魅力和潜力变得愈发明显,成为全球人工智能领域的重要推动力量。

开源的发展历史:不仅是开放源代码这么简单
在现代软件开发领域,开源/Open Source与闭源/Closed Source是两种主要的开发模式,它们在开发方法、代码开放程度、社区参与以及商业模式等方面有显著差异。

开源软件是指其源代码对外开放,任何人都可以查看、修改和分发这些代码。开源的核心理念是共享与协作、开放源代码,允许公众访问、使用、修改和分发模型的源代码,促使全球开发者在此基础上进行创新与协作。著名的开源软件如Linux操作系统、Apache HTTP Server和Python等编程语言的实现版本,都是在这种开放的环境下发展壮大的。

而开源的理念可以追溯到计算机技术的初期,那个时候软件和硬件紧密结合,用户往往需要自行编写或修改软件来解决特定问题。

1955年,IBM启动了“IBM用户组分享”,希望让更多人能够深入研究操作系统。到了20世纪70年代中期,随着计算机技术的迅猛发展,软件逐渐成为商品,开始脱离硬件单独出售,这一转变限制了软件的共享文化。为此,Richard Stallman于1983年发起了GNU项目,并在1985年成立了自由软件基金会/FSF,推动自由软件的发展。

1998年,Eric Raymond和Bruce Perens成立了开源促进会/Open Source Initiative简称OSI,并制定了“开源定义”/Open Source Definition,正式为开源软件设定标准。开源促进会明确规定,开源软件不仅需要公开源代码,还要允许用户自由使用、修改和分发,同时,开源项目必须遵循某种开源许可证,如GPL、Apache、BSD和MIT等。

从技术角度来看,大模型涉及许多复杂的技术问题,单靠一家企业的力量难以解决。开源大模型鼓励全球开发者社区参与和贡献,集体智慧的力量能够加速技术的迭代和创新,像GitHub上的多个AI项目便验证了这一点。

其次,开源模式的最大优势之一是透明性,开发者可以对代码进行审查和优化,从而提高软件的安全性与稳定性。开源还鼓励全球开发者的参与,通过社区的贡献与反馈,推动软件的快速迭代与创新。同时,低成本的试错也帮助开源大模型迅速触及潜在用户,降低了企业在认知和决策上的难度,推动了创新的加速。

与此相对,闭源软件是指源代码不公开,只有开发者或公司内部人员可以访问和修改。闭源软件通常由商业公司开发和销售,比如Microsoft Windows操作系统和Adobe Photoshop图像处理软件等。闭源软件的主要优势在于开发公司对源代码的完全控制,能够确保软件质量的一致性。同时,闭源软件通过销售许可证和提供技术支持等服务,获得稳定的收入来源,支持持续的研发和创新。

事实上,大模型的技术浪潮,某种程度上也是由开源开启,谷歌开源了Transformer,才有了后来OpenAI引爆行业的ChatGPT。不少专家认为,开源人工智能可以促进合作,加速创新,并让尖端技术的获取变得更加民主化。通过共享模型和代码库,全球的研究人员和开发者可以在前人的基础上进行创新,从而推动快速进步和多样化的应用开发。也支持这一理念。

OpenAI最初也是一家开源人工智能公司,但近年来已逐渐转向闭源模式,研发人工智能专有模型。虽然这种方法可以带来显著的突破,但也可能导致重复劳动和技术传播速度的减缓。而且,专有模型往往给小型组织或研究人员带来了进入的门槛,可能会抑制创新。与之相比,DeepSeek的R1模型和Meta的Llama模型都属于开源,通过受益于开放研究和开源,推动了技术的快速发展。

DeepSeek突破:低成本开源技术挑战巨头
DeepSeek,来自中国的人工智能初创公司,近日因发布其推理大模型DeepSeek-R1后,凭借其“高性能、低成本”的特性迅速在海外开发者社区中引起轰动,尤其是在硅谷,它的低训练成本震撼了整个行业。

据相关资料显示,作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务中的表现能够与OpenAI的GPT-4模型媲美。更令人惊讶的是,DeepSeek透露,R1的预训练费用仅为557.6万美元,且在2048块英伟达H800 GPU集群上(为中国市场定制的低配版GPU)运行55天完成,训练成本不到OpenAI GPT-4模型的十分之一。 DeepSeek表示,R1在后训练阶段大规模釆用了强化学习技术,即使使用的标注数据极少,也大幅提升了模型的推理能力。

较低的训练成本使得DeepSeek的使用成本也较低,这使其在市场上具备了强大的竞争力。这一优势引发了业内的广泛关注。受此影响,Meta成立了四个专门研究小组,试图了解DeepSeek是如何降低训练和运行成本的。 OpenAI、Meta以及其他顶级人工智能团队的开发人员也在仔细研究DeepSeek模型,试图揭开其比某些美国制造的模型更加经济高效的秘密。

更为值得注意的是,DeepSeek的R1模型在MIT许可证下完全开源,允许免费用于商业和学术领域,这种做法与OpenAI等竞争对手的昂贵订阅模式形成了鲜明对比。 DeepSeek通过将监督微调/SFT与强化学习/RL相结合,釆用多阶段训练管道,以提升高阶推理能力。这种创新的做法引起了美国研究人员的高度关注,并展示了中国在人工智能领域与硅谷竞争的潜力。

从当前的成就来看,DeepSeek无疑值得全球业界的惊叹
一方面,DeepSeek展示了中国在大模型领域的强大能力,甚至有潜力追赶并超越全球最先进的技术。另一方面,DeepSeek得益于开源研究和项目,比如PyTorch和Meta的Llama。其次,技术创新可以从意想不到的地方涌现。 DeepSeek源自量化私募公司幻方量化。所谓量化私募,是将投资理念转化为数学模型,通过计算机处理大量历史股票数据并筛选投资标的。

在DeepSeek发布后,Meta首席执行官马克·扎克伯格/Mark Zuckerberg宣布,Meta将在2025年投入超过600亿美元加大对AI的投资,进一步推动开源模型的发展。扎克伯格一直是开源模式的积极倡导者,他在今年9月表示,他的目标是打造一个下一代的开放平台,并让这一平台在未来的科技行业中占据主导地位。

随着这些技术的发展与普及,开源不仅推动了软件行业的创新,还为全球开发者提供了一个共享知识、协作创新的平台。通过开放源代码,开源项目能够迅速迭代并集结全球开发者的智慧,形成强大的生态系统,进一步促进了技术进步。

开源大模型:或成未来商业生态
开源世界的飞速发展正在打破软件行业的垄断格局,引发了全球范围内的技术革新。开源本质上意味着人工智能AI可以替代传统人力,高效优质的团队和劳动力也可通过AI技术得以替代。

尽管开源已成为当前大模型发展的主流趋势,但也面临诸多挑战
开源大模型的商业模式仍处于不确定阶段,如何在保持开放的同时实现可持续的商业发展,成为了开源厂商亟待解决的问题。尽管已有成功案例,但开源大模型的商业化依然充满挑战。在竞争日益激烈的市场中,如何提升大模型的知名度和用户接受度,从而促使用户从免费使用转向付费服务,是开源厂商面临的核心问题。同时,如何防止竞争对手基于相同的代码库创建自己的产品或服务,也是开源大模型需要应对的难题。

此外,开源人工智能具有明显的优势,但安全性、滥用及道德问题依旧是焦点。开源模型有可能被用于恶意目的,如何平衡开放性与潜在风险,成为了行业讨论的重要议题。 LeCun在倡导开放AI研究的同时,强调了釆取适当安全措施的重要性,并认为开源可以推动人工智能的进步,确保“好的人工智能”领先于“坏的人工智能”。

在全球AI技术快速发展的背景下,DeepSeek的成功不仅展示了中国AI初创公司的崛起,也突显了开源大模型的巨大潜力。与OpenAI等公司依赖封闭生态的策略不同,DeepSeek选择将其技术开源,推动了全球开发者的参与和创新。这一举措让开源模式的优势得到了进一步验证,尤其是在技术共享和协作创新方面,极大提升了AI的普及速度。

但有专家认为,开源与闭源并非非此即彼的选择,而是需要综合考虑的策略。对于拥有足够资源和决心的企业来说,完全可以在开源中展示技术实力、获取反馈和数据,从而为后续的商业化变现奠定基础。而闭源模型则可以封装技术优势,直接实现产品化和商业化。开源和闭源并非像手机操作系统的iOS与安卓那样只能二选一,开源是为了建立信誉和吸引用户,同时为商业化做准备。

在现代大模型的开发中,开源提供了更高的透明度,鼓励全球开发者共同参与,使得技术能够更快地迭代和完善。而闭源模式则通过专有技术的封锁,确保了公司对核心技术的控制力。在这个过程中,开源与闭源并不是互相排斥的选择,而是可以结合使用的策略。在这个大模型时代,科技公司正面临生态演变的重大考量,开源与闭源的博弈仍在继续,未来将呈现哪些新的特点和方向,值得我们持续关注。

投资不仅仅是为了创造财富,更是一种洞察宏观经济的态度,见证社会演变与科技发展。我们一起,从大变局中看清发展趋势,希望从不确定中找到确定。

狂呼金融研究所聚焦于新的社会发展形势下,金融与经济对当今世界日益凸显的影响。以全面、理性的投资视角,洞察分析每一个趋势与机会,为广大投资者创造更高质量、更独特的金融投资观点。

狂呼,比一部分人更快、更准地看清市场,让大众洞察金融经济的核心。

联系我们// 相关文章

免责声明:本网站提供的信息仅供一般信息目的,并不应被视为投资建议。

返回博客
1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4