我有点后悔没有给这篇文章起一个不同的标题——它其实不是关于在自己的电脑上运行模型。而是关于为个人使用运行模型,假设你拥有所有GPU(即批处理/吞吐量权衡)。
从今天的角度来看,DeepSeek 可能还处于探索阶段,与业界的开源模型保持一致,并进行理论研究。不过,从论文中的细节来看,一年后划时代的 R1 诞生的条件已基本具备。
高效生活的101条法则
微软希望Windows Update能够管理所有应用程序
对 Rust 10 年的押注以及我对未来的期待
苹果: 密码监控服务从 Java 迁移到 Swift
关于 JavaScript "工作证明(proof of work) "防抓取系统的思考
关于程序员过时的传说
这是 JavaScript 吗?
为什么DeepSeek在规模化部署时成本低廉,但在本地运行时却成本高昂?
为什么 2025/05/28 和 2025-05-28 在 JavaScript 中是不同的日子?
为什么原始的Macintosh屏幕分辨率是512×342,而不是人们可能预期的512×384