标签： DeepSeek

中国开源模型占全球AI使用量的30%，千问和DeepSeek领跑

中国开源LLM的全球份额从2024年末的1.2%低位起步，今年短短数月内已攀升至近30%。

R2是DeepSeek广受欢迎的R1推理模型的继任者，原计划于5月发布，目标是提升编码和在英语以外语言中的推理能力，今年早些时候曾报道。

我有点后悔没有给这篇文章起一个不同的标题——它其实不是关于在自己的电脑上运行模型。而是关于为个人使用运行模型，假设你拥有所有GPU（即批处理/吞吐量权衡）。

从今天的角度来看，DeepSeek 可能还处于探索阶段，与业界的开源模型保持一致，并进行理论研究。不过，从论文中的细节来看，一年后划时代的 R1 诞生的条件已基本具备。