DeepSeek的R1模型凸顯優勢,開源模型或成人工智能開發新選擇?

DeepSeek的R1模型凸显优势,开源模型或成人工智能开发新选择?

發布日期:

商業 Business 狂呼金融 Convo Finance 科技 Tech


要点:
DeepSeek的崛起凸显了开源技术的优势,推动了全球AI技术的创新与进步,促使更多企业重新审视其人工智能开发模式。

近日,中国AI初创公司DeepSeek/深度求索在发布其最新的DeepSeek-R1模型后,因低开发成本与出色的性能迅速引起了硅谷的关注和市场广泛关注,甚至引发美股市场的震荡。 Meta首席人工智能科学家Yann LeCun在LinkedIn上表示,部分人看到DeepSeek的表现后误解为“中国AI正在超越美国”,他认为这种解读是不准确的,正确的理解应该是“开源模型正在超越专有模型”。他强调,DeepSeek的成功展示了开源模型的力量,特别是在Meta的PyTorch和Llama等开源工具的帮助下,他们能够基于已有的研究和技术进行创新,并将其成果开源,造福全球开发者。

在DeepSeek的崛起之际,开源/Open Source技术的优势逐渐显现,它不仅让全球开发者能够共同推进技术创新,还推动了AI领域的快速进步。在DeepSeek等开源驱动的公司推动下,开源的魅力和潜力变得愈发明显,成为全球人工智能领域的重要推动力量。

开源的发展历史:不仅是开放源代码这么简单

在现代软件开发领域,开源/Open Source与闭源/Closed Source是两种主要的开发模式,它们在开发方法、代码开放程度、社区参与以及商业模式等方面有显著差异。

开源软件是指其源代码对外开放,任何人都可以查看、修改和分发这些代码。开源的核心理念是共享与协作、开放源代码,允许公众访问、使用、修改和分发模型的源代码,促使全球开发者在此基础上进行创新与协作。著名的开源软件如Linux操作系统、Apache HTTP Server和Python等编程语言的实现版本,都是在这种开放的环境下发展壮大的。

而开源的理念可以追溯到计算机技术的初期,那个时候软件和硬件紧密结合,用户往往需要自行编写或修改软件来解决特定问题。

1955年,IBM启动了“IBM用户组分享”,希望让更多人能够深入研究操作系统。到了20世纪70年代中期,随着计算机技术的迅猛发展,软件逐渐成为商品,开始脱离硬件单独出售,这一转变限制了软件的共享文化。为此,Richard Stallman于1983年发起了GNU项目,并在1985年成立了自由软件基金会/FSF,推动自由软件的发展。

1998年,Eric Raymond和Bruce Perens成立了开源促进会/Open Source Initiative简称OSI,并制定了“开源定义”/Open Source Definition,正式为开源软件设定标准。开源促进会明确规定,开源软件不仅需要公开源代码,还要允许用户自由使用、修改和分发,同时,开源项目必须遵循某种开源许可证,如GPL、Apache、BSD和MIT等。

从技术角度来看,大模型涉及许多复杂的技术问题,单靠一家企业的力量难以解决。开源大模型鼓励全球开发者社区参与和贡献,集体智慧的力量能够加速技术的迭代和创新,像GitHub上的多个AI项目便验证了这一点。

其次,开源模式的最大优势之一是透明性,开发者可以对代码进行审查和优化,从而提高软件的安全性与稳定性。开源还鼓励全球开发者的参与,通过社区的贡献与反馈,推动软件的快速迭代与创新。同时,低成本的试错也帮助开源大模型迅速触及潜在用户,降低了企业在认知和决策上的难度,推动了创新的加速。

与此相对,闭源软件是指源代码不公开,只有开发者或公司内部人员可以访问和修改。闭源软件通常由商业公司开发和销售,比如Microsoft Windows操作系统和Adobe Photoshop图像处理软件等。闭源软件的主要优势在于开发公司对源代码的完全控制,能够确保软件质量的一致性。同时,闭源软件通过销售许可证和提供技术支持等服务,获得稳定的收入来源,支持持续的研发和创新。

事实上,大模型的技术浪潮,某种程度上也是由开源开启,谷歌开源了Transformer,才有了后来OpenAI引爆行业的ChatGPT。不少专家认为,开源人工智能可以促进合作,加速创新,并让尖端技术的获取变得更加民主化。通过共享模型和代码库,全球的研究人员和开发者可以在前人的基础上进行创新,从而推动快速进步和多样化的应用开发。也支持这一理念。

OpenAI最初也是一家开源人工智能公司,但近年来已逐渐转向闭源模式,研发人工智能专有模型。虽然这种方法可以带来显著的突破,但也可能导致重复劳动和技术传播速度的减缓。而且,专有模型往往给小型组织或研究人员带来了进入的门槛,可能会抑制创新。与之相比,DeepSeek的R1模型和Meta的Llama模型都属于开源,通过受益于开放研究和开源,推动了技术的快速发展。

DeepSeek突破:低成本开源技术挑战巨头

DeepSeek,来自中国的人工智能初创公司,近日因发布其推理大模型DeepSeek-R1后,凭借其“高性能、低成本”的特性迅速在海外开发者社区中引起轰动,尤其是在硅谷,它的低训练成本震撼了整个行业。

据相关资料显示,作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务中的表现能够与OpenAI的GPT-4模型媲美。更令人惊讶的是,DeepSeek透露,R1的预训练费用仅为557.6万美元,且在2048块英伟达H800 GPU集群上(为中国市场定制的低配版GPU)运行55天完成,训练成本不到OpenAI GPT-4模型的十分之一。 DeepSeek表示,R1在后训练阶段大规模釆用了强化学习技术,即使使用的标注数据极少,也大幅提升了模型的推理能力。

较低的训练成本使得DeepSeek的使用成本也较低,这使其在市场上具备了强大的竞争力。这一优势引发了业内的广泛关注。受此影响,Meta成立了四个专门研究小组,试图了解DeepSeek是如何降低训练和运行成本的。 OpenAI、Meta以及其他顶级人工智能团队的开发人员也在仔细研究DeepSeek模型,试图揭开其比某些美国制造的模型更加经济高效的秘密。

更为值得注意的是,DeepSeek的R1模型在MIT许可证下完全开源,允许免费用于商业和学术领域,这种做法与OpenAI等竞争对手的昂贵订阅模式形成了鲜明对比。 DeepSeek通过将监督微调/SFT与强化学习/RL相结合,釆用多阶段训练管道,以提升高阶推理能力。这种创新的做法引起了美国研究人员的高度关注,并展示了中国在人工智能领域与硅谷竞争的潜力。

从当前的成就来看,DeepSeek无疑值得全球业界的惊叹

一方面,DeepSeek展示了中国在大模型领域的强大能力,甚至有潜力追赶并超越全球最先进的技术。另一方面,DeepSeek得益于开源研究和项目,比如PyTorch和Meta的Llama。其次,技术创新可以从意想不到的地方涌现。 DeepSeek源自量化私募公司幻方量化。所谓量化私募,是将投资理念转化为数学模型,通过计算机处理大量历史股票数据并筛选投资标的。

在DeepSeek发布后,Meta首席执行官马克·扎克伯格/Mark Zuckerberg宣布,Meta将在2025年投入超过600亿美元加大对AI的投资,进一步推动开源模型的发展。扎克伯格一直是开源模式的积极倡导者,他在今年9月表示,他的目标是打造一个下一代的开放平台,并让这一平台在未来的科技行业中占据主导地位。

随着这些技术的发展与普及,开源不仅推动了软件行业的创新,还为全球开发者提供了一个共享知识、协作创新的平台。通过开放源代码,开源项目能够迅速迭代并集结全球开发者的智慧,形成强大的生态系统,进一步促进了技术进步。

开源大模型:或成未来商业生态

开源世界的飞速发展正在打破软件行业的垄断格局,引发了全球范围内的技术革新。开源本质上意味着人工智能AI可以替代传统人力,高效优质的团队和劳动力也可通过AI技术得以替代。

尽管开源已成为当前大模型发展的主流趋势,但也面临诸多挑战

开源大模型的商业模式仍处于不确定阶段,如何在保持开放的同时实现可持续的商业发展,成为了开源厂商亟待解决的问题。尽管已有成功案例,但开源大模型的商业化依然充满挑战。在竞争日益激烈的市场中,如何提升大模型的知名度和用户接受度,从而促使用户从免费使用转向付费服务,是开源厂商面临的核心问题。同时,如何防止竞争对手基于相同的代码库创建自己的产品或服务,也是开源大模型需要应对的难题。

此外,开源人工智能具有明显的优势,但安全性、滥用及道德问题依旧是焦点。开源模型有可能被用于恶意目的,如何平衡开放性与潜在风险,成为了行业讨论的重要议题。 LeCun在倡导开放AI研究的同时,强调了釆取适当安全措施的重要性,并认为开源可以推动人工智能的进步,确保“好的人工智能”领先于“坏的人工智能”。

在全球AI技术快速发展的背景下,DeepSeek的成功不仅展示了中国AI初创公司的崛起,也突显了开源大模型的巨大潜力。与OpenAI等公司依赖封闭生态的策略不同,DeepSeek选择将其技术开源,推动了全球开发者的参与和创新。这一举措让开源模式的优势得到了进一步验证,尤其是在技术共享和协作创新方面,极大提升了AI的普及速度。

但有专家认为,开源与闭源并非非此即彼的选择,而是需要综合考虑的策略。对于拥有足够资源和决心的企业来说,完全可以在开源中展示技术实力、获取反馈和数据,从而为后续的商业化变现奠定基础。而闭源模型则可以封装技术优势,直接实现产品化和商业化。开源和闭源并非像手机操作系统的iOS与安卓那样只能二选一,开源是为了建立信誉和吸引用户,同时为商业化做准备。

在现代大模型的开发中,开源提供了更高的透明度,鼓励全球开发者共同参与,使得技术能够更快地迭代和完善。而闭源模式则通过专有技术的封锁,确保了公司对核心技术的控制力。在这个过程中,开源与闭源并不是互相排斥的选择,而是可以结合使用的策略。在这个大模型时代,科技公司正面临生态演变的重大考量,开源与闭源的博弈仍在继续,未来将呈现哪些新的特点和方向,值得我们持续关注。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • 庫存創新高、房價齊跌,加拿大樓市陷入“沉寂期”

    库存创新高、房价齐跌,加拿大楼市陷入“沉寂期”

    有专家表示,“虽然销售已趋于稳定,但库存增长速度似乎正开始放缓。”目前大部分市场仍维持在买卖平衡区间,价格亦保持横槃整理的态势。牛津经济研究院的最新分析则显得更为审慎,“尽管市场短期内出现喘息机会,但整体低迷仍可能延续至年底,甚至更久。”

    库存创新高、房价齐跌,加拿大楼市陷入“沉寂期”

    有专家表示,“虽然销售已趋于稳定,但库存增长速度似乎正开始放缓。”目前大部分市场仍维持在买卖平衡区间,价格亦保持横槃整理的态势。牛津经济研究院的最新分析则显得更为审慎,“尽管市场短期内出现喘息机会,但整体低迷仍可能延续至年底,甚至更久。”

  • 獨家對話夸克:「大模型+高考」,AI 落地千萬級用戶的一次漂亮實驗 | 播客Podcast

    独家对话夸克:「大模型+高考」,AI 落地千万级用户的一次漂亮实验| 播客Podcast

    在刚过去的高考月,夸克的高考志愿大模型共产生了1000 万份高考志愿深度研究报告——在我拿到的一份样本里,多达几十页、上百行的志愿栏里,清晰地呈现了结合每位考生的个性化需求而由AI推荐的志愿填报排序、录取概率、专业介绍等信息。

    独家对话夸克:「大模型+高考」,AI 落地千万级用户的一次漂亮实验| 播客Podcast

    在刚过去的高考月,夸克的高考志愿大模型共产生了1000 万份高考志愿深度研究报告——在我拿到的一份样本里,多达几十页、上百行的志愿栏里,清晰地呈现了结合每位考生的个性化需求而由AI推荐的志愿填报排序、录取概率、专业介绍等信息。

  • Waymo將在費城進行測試,引領自動駕駛邁向高密度城市挑戰

    Waymo将在费城进行测试,引领自动驾驶迈向高密度城市挑战

    Waymo表示,预计今秋将在宾夕法尼亚州最大城市正式展开路测,初步阶段的测试车辆将以人工驾驶模式行驶在市中心和高速公路等复杂区域。公众将在未来几个月内,于北中心区、东威克、大学城及特拉华河沿岸等多个街区,陆续看到其自动驾驶测试车辆的身影。

    Waymo将在费城进行测试,引领自动驾驶迈向高密度城市挑战

    Waymo表示,预计今秋将在宾夕法尼亚州最大城市正式展开路测,初步阶段的测试车辆将以人工驾驶模式行驶在市中心和高速公路等复杂区域。公众将在未来几个月内,于北中心区、东威克、大学城及特拉华河沿岸等多个街区,陆续看到其自动驾驶测试车辆的身影。

  • 為什麼特朗普持續要求聯準會降息?

    为什么特朗普持续要求联准会降息?

    联准会主席鲍威尔近期多次表示,如果不是因为特朗普政府实施的广泛关税政策带来的不确定性,联准会今年可能已经开始降息。联准会正在密切观察关税对通膨的影响,因为进口商品成本的增加可能会推高物价。

    为什么特朗普持续要求联准会降息?

    联准会主席鲍威尔近期多次表示,如果不是因为特朗普政府实施的广泛关税政策带来的不确定性,联准会今年可能已经开始降息。联准会正在密切观察关税对通膨的影响,因为进口商品成本的增加可能会推高物价。

  • 和AIGCode創辦人聊聊明星計畫、首個端到端agent、和AI Coding的新戰場 | 播客Podcast

    和AIGCode创办人聊聊明星计画、首个端到端agent、和AI Coding的新战场| 播客...

    主打「AI 程式设计师」的创业公司Devin 在还没有产品推出、只有宣传影片的情况下,就以20 亿美金的估值筹集了1.75 亿美元。年底,Cursor 爆火,四个月内估值涨了6.5 倍,9个月做到7000万美金的ARR,彻底将AI Coding 赛道点燃。

    和AIGCode创办人聊聊明星计画、首个端到端agent、和AI Coding的新战场| 播客...

    主打「AI 程式设计师」的创业公司Devin 在还没有产品推出、只有宣传影片的情况下,就以20 亿美金的估值筹集了1.75 亿美元。年底,Cursor 爆火,四个月内估值涨了6.5 倍,9个月做到7000万美金的ARR,彻底将AI Coding 赛道点燃。

  • 美股市場應對挑戰,布局未來三大核心機遇

    美股市场应对挑战,布局未来三大核心机遇

    2025年上半年,投资市场历经波动。政策变动一度使标普500指数下挫近20%,但随后在贸易紧张局势缓解与强劲经济数据的带动下,标普500于6月底前创下历史新高。展望仍充满变数的下半年,专家建议聚焦三大核心主题与对应的投资机会,以掌握趋势、迎接挑战。

    美股市场应对挑战,布局未来三大核心机遇

    2025年上半年,投资市场历经波动。政策变动一度使标普500指数下挫近20%,但随后在贸易紧张局势缓解与强劲经济数据的带动下,标普500于6月底前创下历史新高。展望仍充满变数的下半年,专家建议聚焦三大核心主题与对应的投资机会,以掌握趋势、迎接挑战。

  • AI科學家Ilya Sutskever演講:當AI無所不能,人類該如何定義自己?

    AI科学家Ilya Sutskever演讲:当AI无所不能,人类该如何定义自己?

    AI将能完成所有人类能完成的任务:不仅是部分任务,而是全部。无论是谁掌握的技能,AI理论上都能学会。其信念来源于这样一个推理,人类智能源于大脑这一生物计算机,而数字计算机则有潜力复制这些功能。因此,AI的“全能”未来,并非幻想,而是具有逻辑基础的推演。

    AI科学家Ilya Sutskever演讲:当AI无所不能,人类该如何定义自己?

    AI将能完成所有人类能完成的任务:不仅是部分任务,而是全部。无论是谁掌握的技能,AI理论上都能学会。其信念来源于这样一个推理,人类智能源于大脑这一生物计算机,而数字计算机则有潜力复制这些功能。因此,AI的“全能”未来,并非幻想,而是具有逻辑基础的推演。

  • 加拿大液化天然氣崛起,開啟直銷亞洲市場新戰略

    加拿大液化天然气崛起,开启直销亚洲市场新战略

    加拿大液化天然气公司于本周正式向亚洲出口液化天然气,代表加拿大首座大型液化设施正式启用。该计画由壳牌与多家亚洲能源企业共同出资,总投资超过400亿加元,也是加拿大西海岸规划中的首个LNG出口专案,将使加拿大天然气首次得以绕开美国市场,直销亚洲。

    加拿大液化天然气崛起,开启直销亚洲市场新战略

    加拿大液化天然气公司于本周正式向亚洲出口液化天然气,代表加拿大首座大型液化设施正式启用。该计画由壳牌与多家亚洲能源企业共同出资,总投资超过400亿加元,也是加拿大西海岸规划中的首个LNG出口专案,将使加拿大天然气首次得以绕开美国市场,直销亚洲。

1 / 8
1 / 4
  • 打破線性人生,在不確定中尋找多元化的人生出路

    打破线性人生,在不确定中寻找多元化的人生出路

    近年来,全球经济与地缘格局发生剧烈变化,从疫情冲击、通胀压力,到产业结构重塑,无一不深刻影响着普通人的生活节奏与发展路径。原本被视为“稳定之路”的人生规划:考学、毕业、就业、升职、买房,如今变得越来越不确定。

    打破线性人生,在不确定中寻找多元化的人生出路

    近年来,全球经济与地缘格局发生剧烈变化,从疫情冲击、通胀压力,到产业结构重塑,无一不深刻影响着普通人的生活节奏与发展路径。原本被视为“稳定之路”的人生规划:考学、毕业、就业、升职、买房,如今变得越来越不确定。

  • 從名校精英到殺手,Luigi Mangione槍擊案背后揭示的美國醫療體系

    从名校精英到杀手,Luigi Mangione枪击案背后揭示的美国医疗体系

    Luigi Mangione用极端方式撕开了美国医疗体系深藏的裂痕,也逼迫社会不得不重新审视,何为正义?何为悲剧。当医疗保障变成逐利机器,当患者在病痛中苦苦挣扎却换来拒绝与冷眼,社会的不满和愤怒便会潜滋暗长,最终以最不可控的方式爆发。

    从名校精英到杀手,Luigi Mangione枪击案背后揭示的美国医疗体系

    Luigi Mangione用极端方式撕开了美国医疗体系深藏的裂痕,也逼迫社会不得不重新审视,何为正义?何为悲剧。当医疗保障变成逐利机器,当患者在病痛中苦苦挣扎却换来拒绝与冷眼,社会的不满和愤怒便会潜滋暗长,最终以最不可控的方式爆发。

  • 中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    “我的前女友叫劉佳”、“前女友叫劉佳”、“劉佳是我前女友”.。以上這些男士的前女友竟然都叫“劉佳”,而更離奇的是,這些男士還都是同一棟樓的業主,他們都表示自己是前女友“劉佳”介紹來買房的。這一切看似巧合,實則隱藏着不為人知的騙局。

    中國惠州房產中介貸款騙局,為愛買房“殺豬槃”騙局?

    “我的前女友叫劉佳”、“前女友叫劉佳”、“劉佳是我前女友”.。以上這些男士的前女友竟然都叫“劉佳”,而更離奇的是,這些男士還都是同一棟樓的業主,他們都表示自己是前女友“劉佳”介紹來買房的。這一切看似巧合,實則隱藏着不為人知的騙局。

  • 美國性勒索與網路犯罪:青少年如何避免成為下一個受害者?

    美国性勒索与网路犯罪:青少年如何避免成为下一个受害者?

    在数字化时代,网络犯罪的形式愈加多样且隐蔽,其中“性勒索”/sextortion已成为一个日益严重的问题。这类网络犯罪不仅涉及个人隐私的泄露,还会对受害者的心理健康和社会生活造成深远影响。 “性勒索”/Sextortion犯罪在现代技术的推动下,呈现出爆发式增长。

    美国性勒索与网路犯罪:青少年如何避免成为下一个受害者?

    在数字化时代,网络犯罪的形式愈加多样且隐蔽,其中“性勒索”/sextortion已成为一个日益严重的问题。这类网络犯罪不仅涉及个人隐私的泄露,还会对受害者的心理健康和社会生活造成深远影响。 “性勒索”/Sextortion犯罪在现代技术的推动下,呈现出爆发式增长。

1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4