标签: DeepSeek

中国开源模型占全球AI使用量的30%,千问和DeepSeek领跑

中国开源模型占全球AI使用量的30%,千问和DeepSeek领跑

中国开源LLM的全球份额从2024年末的1.2%低位起步,今年短短数月内已攀升至近30%。

外媒推测 DeepSeek R2 发布计划受阻,因 CEO 梁文峰对性能不满

外媒推测 DeepSeek R2 发布计划受阻,因 CEO 梁文峰对性能不满

R2是DeepSeek广受欢迎的R1推理模型的继任者,原计划于5月发布,目标是提升编码和在英语以外语言中的推理能力, 今年早些时候曾报道。

为什么DeepSeek在规模化部署时成本低廉,但在本地运行时却成本高昂?

为什么DeepSeek在规模化部署时成本低廉,但在本地运行时却成本高昂?

我有点后悔没有给这篇文章起一个不同的标题——它其实不是关于在自己的电脑上运行模型。而是关于为个人使用运行模型,假设你拥有所有GPU(即批处理/吞吐量权衡)。

从 DeepSeek LLM 到 DeepSeek R1 – DeepSeek LLM

从 DeepSeek LLM 到 DeepSeek R1 – DeepSeek LLM

从今天的角度来看,DeepSeek 可能还处于探索阶段,与业界的开源模型保持一致,并进行理论研究。不过,从论文中的细节来看,一年后划时代的 R1 诞生的条件已基本具备。