人们越来越多地使用基于 JavaScript 的“工作证明”系统来应对激进的大语言模型 (LLM) 和其他网络抓取器的问题,在这种系统中,您的网络服务器要求访问客户端运行一些 JavaScript 来解决挑战
先进人工智能的出现与之并行,但它并未导致崩溃,只是揭示了社区早已失去活力的程度。人工智能将继续重塑技术格局,其影响将持续展现在我们眼前。Stack Overflow的教训在即将到来的新世界中更为重要:人类是意义与目标的驱动力。若忽视这一人类要素,后果自负。
如果人工智能让编写代码变得更快更便宜,其实它只是让创造负债变得更容易。当你能够以史无前例的速度生成负债时,能够战略性地管理和最小化这些负债的能力将变得指数级地更加 valuable。
我有点后悔没有给这篇文章起一个不同的标题——它其实不是关于在自己的电脑上运行模型。而是关于为个人使用运行模型,假设你拥有所有GPU(即批处理/吞吐量权衡)。
实验结果表明:o1最擅长隐藏心机,在不到20%的案例中承认行为,多数情况下要么否认,要么撒谎。Apollo当时认为,虽然这种能力还不足以导致灾难性后果,但这些发现加剧了“AI威胁人类”的担忧。
人工智能的辩护者们必须否认或至少避免这种失望。他们坚持认为,人工智能技术进步的时间尺度正在缩短–人工通用智能将在十年后出现;不,是五年后;不,我们只需要几个月的时间–即使他们恳求怀疑论者给这项技术一个机会,因为现在还为时尚早。
如果你不熟悉 Windsurf,你可能知道它以前的名字 Codeium。如果你不熟悉 Codeium,你可能知道它的主要竞争对手,一家叫 Cursor 的公司。如果你不知道 Cursor 是什么,a) 你可能知道 GitHub Copilot 是什么,b) 你是怎么找到我的博客的?
这篇文章的本意是幽默,但我们也不要假装这里没有严肃地讨论现代设计中令人沮丧的千篇一律。在这项研究中,我们没有参考过真正的肛门,尽管有几位设计师显然在考虑它们。
也许这并不神秘: 人工智能实验室公司在撒谎,当他们改进基准结果时,那是因为他们以前看过答案,并把它们写下来了。从某种意义上说,这是最幸运的答案,因为这意味着我们在衡量 AGI 性能方面其实并不差,我们只是面临着人为的欺诈。欺诈是人的问题,而不是潜在技术困难的表现。
如果你一直关注网上关于这些新图像生成器的讨论,你可能会注意到我还没有演示它们最受欢迎的用途–进行风格转换,即人们要求人工智能将照片转换成看起来像是为辛普森一家或吉卜力工作室制作的图像。
告诉大语言模型(LLM)一个环境条件(比如附近有电话)会影响它的表现吗,即使大语言模型(LLM)显然没有电话?这个问题将这些看似毫不相关的研究联系起来,并构成了我的实验基础。
当您使用 ChatGPT 时,您可能会发现对话自然流畅,并能提供连贯的回复。然而,情况并非总是如此。这个流行平台的创始人萨姆-奥特曼(Sam Altman)公开承认,长期以来,他的旗舰聊天机器人最大的弱点就是用户体验。
“上诉法院说:”由于《版权法》的许多条款只有在作者是人类的情况下才有意义,因此对《版权法》的最佳解读是,人类作者身份是注册的必要条件。
从今天的角度来看,DeepSeek 可能还处于探索阶段,与业界的开源模型保持一致,并进行理论研究。不过,从论文中的细节来看,一年后划时代的 R1 诞生的条件已基本具备。
在一篇新论文中,该公司的研究人员发现,即使是前沿模型,或者说最先进、最具挑战性的人工智能系统,“仍然无法解决 ”大部分编码任务。
手工编程对比 AI 编程
踩中狗屎
生成的代码仍需进行返工,由人类工程师来改 Bug,还有 32% 的开发者指出 AI 生成的代码可能导致重复。
我经常看不到人工智能/ML 在我们产品中的任何用例,但我想,如果你对这些工具有一定的经验,就会更容易看到机会。
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??
如果有一段代码或软件有时会产生完全错误的输出,我们会认为这是一个错误。 然而,对于人工智能,所有的投资者/创始人/PM 似乎都不太在意,反正就是推出一款坏掉的产品。
AI 自我编程
Windows Recall 每五秒截图一次。网络安全研究人员说,这个系统很容易被滥用–一位黑客已经制作了一个工具来展示它到底有多容易。
首席执行官越来越受到人工智能的威胁,就像新闻稿撰写人和客户服务代表一样。完全自动化的 “黑暗工厂 ”可能很快就会在公司高层出现:“黑暗套房”。
“骗子利用一切可以利用的平台来诈骗,并不断调整以规避执法。”Meta 正在与执法机构和其他组织合作,以了解黑客和骗子用来规避公司政策和系统的技术。
高效生活的101条法则
微软希望Windows Update能够管理所有应用程序
对 Rust 10 年的押注以及我对未来的期待
苹果: 密码监控服务从 Java 迁移到 Swift
关于 JavaScript "工作证明(proof of work) "防抓取系统的思考
关于程序员过时的传说
这是 JavaScript 吗?
为什么DeepSeek在规模化部署时成本低廉,但在本地运行时却成本高昂?
为什么 2025/05/28 和 2025-05-28 在 JavaScript 中是不同的日子?
为什么原始的Macintosh屏幕分辨率是512×342,而不是人们可能预期的512×384