国产模型的“弯道超车”
DeepSeek的走红并非是其性能完全超越OpenAI,而是来自于低成本优势和开源生态带来的颠覆性体验,使其迅速“破圈”,成为全球热门AI模型。在过去的半年内,延续DeepSeek的破圈逻辑,国产模型似乎也瞄准了类似的路径。
低成本突围,用更少的算力追赶OpenAI的性能。
前不久,阿里千问3登顶全球最强开源模型,也在一定程度上完成了国产模型的破圈。成就这次现象的关键除了模型快速上线通义App之外,还有就是自身的高性能与低成本特性,其性能在超越OpenAI-o1与DeepSeek-R1的同时,部署成本大幅降低,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
尽管在性能上,国产模型很难跟OpenAI拉开太大的差距,但是在部署成本上的持续优化,从另一个角度真正意义上完成了对OpenAI的追赶。几乎是同一时间,星火X1也完成升级,整体效果对标OpenAI-o1与DeepSeek-R1。而在算力成本上,星火X1不仅是业界唯一基于全国产算力训练的深度推理模型,还成功实现了只需4张华为910B芯片即可完成部署,把国产模型的低成本特性再度“打爆”。