【香港中通社8月11日电】【香港中通社记者黎金良2025年初,中国人工智能(AI)公司深度求索(DeepSeek)推出其大模型DeepSeek-R1,一夜之间席卷全球科技市场。半年过去,DeepSeek的热度急速下降,是否只是昙花一现?
回顾DeepSeek「横空出世」之初,其应用程式短短数日内登顶美国苹果AppStore榜首,让美国矽谷为之震颤。DeepSeek-R1最令人震撼的是其「低成本、高效率」的技术路线。相较于OpenAI投入数十亿美元训练GPT-4,DeepSeek仅以560万美元的开发成本,在多项基准测试中达到甚至超越GPT-4的性能。这一突破直接挑战了AI产业长期依赖的「规模定律」──即模型性能与算力投入呈指数级正相关的假设。
分析认为,DeepSeek的成功关键在于其创新的混合专家模型架构、动态稀疏训练技术,以及优化的数据清洗方法。这些技术让DeepSeek在资源受限的情况下,仍能实现高效推理,并大幅降低运算成本。这不仅打破了「AI必须依赖巨额算力」的迷思,更为全球AI开发者提供了一条新的技术路径。
DeepSeek的成功迫使矽谷重新思考AI的发展方向。过去,OpenAI、谷歌等巨头依赖大规模数据中心与顶级晶片,但DeepSeek证明,更聪明的工程设计可以大幅降低AI的开发门槛。
DeepSeek的崛起一度冲击英伟达股价,使其市值单日蒸发6000亿美元,但半年后,英伟达市值已反弹并创新高。然而,DeepSeek的低成本模式仍促使企业重新评估AI基础设施投资,部份公司开始探索更节能的AI晶片方案。
英国广播公司(BBC)10日发文称,DeepSeek这款突破性应用如今虽然淡出新闻头条,不再是美国科技圈热议的话题,但它并未消失。文章提出灵魂一问:DeepSeek震撼市场之后,是否改变了整个AI产业?
文章认为,DeepSeek的问世是中美AI竞争的转折点。
值得注意的是,自今年初DeepSeek发布高性能开源大模型以来,阿里巴巴、腾讯、百度、华为等中国科技巨头在AI技术研发、行业应用及生态布局上均迎来爆发期,并显著加码AI投资和布局。阿里、百度等今年以来更频频升级大型语言模型版本,据报华为8月12日将发布AI推理领域突破性技术成果。报道指,这项成果或能降低中国AI推理对高频宽记忆体技术的依赖,提升、完善中国AI大模型推理性能和生态关键部份。DeepSeek虽然淡出了公众的视线,但其技术正在接入各种应用平台,进入应用层面。
在上月访华并首次参加中国国际供应链促进博览会的英伟达首席执行官黄仁勋,更点名大赞中国AI模型属「世界级」,例如DeepSeek、阿里巴巴、腾讯、百度等开发的AI模型,中国的开源AI已成为全球进步的催化剂。他感叹「中国供应链是一个奇迹」,而AI正在革新供应链。◇