人工智能如何征服美国经济:可视图表解答
人工智能是百年一遇的最大科技建设项目。以下是其具体表现。
美国经济已分裂为两部分。一方面是蓬勃发展的人工智能经济,另一方面是疲软的消费经济。
这一趋势在经济统计数据中显而易见。上季度,人工智能领域的支出增长速度超过了消费支出的增长速度。如果没有人工智能,美国经济增长将十分微弱。
你可以在股市中看到这一点。在过去两年中,约60%的股市增长来自人工智能相关公司,如微软、英伟达和Meta。若没有人工智能热潮,股市回报率将惨不忍睹。
你可以在商业数据中看到这一点。根据Stripe的数据,自称“人工智能公司”的企业在该平台上的营收增长占据主导地位,且远超其他任何群体。
没有人能肯定地说,人工智能热潮是下一场工业革命的证据,还是下一个大泡沫。我们唯一知道的是,它正在发生。我们可以停止讨论“如果人工智能在未来某个日期主导经济会发生什么?”不,人工智能经济已经到来,就在当下。我们正生活在其中,无论好坏。

那么,人工智能热潮究竟是什么?它是如何发生的?用于构建人工智能的资金从何而来?谁在使用这项技术?它是否让人们更加高效?今天,我将尝试以图表形式梳理一个常见问题解答,为这个问题提供可视化指南:
人工智能热潮的规模有多大?
人工智能有几个简单的组成部分:计算机芯片、数据中心中的服务器机架、大量电力,以及保持一切正常运行而不至于过热的网络和冷却系统。
这硬件极其昂贵。在过去六个月中,投资人工智能最多的四家公司——Meta、Google、Microsoft和Amazon——在芯片、数据中心等方面花费了1000亿至2000亿美元。“最有价值的科技公司正以创纪录的速度进行采购和建设,”《华尔街日报》的克里斯托弗·米姆斯(Christopher Mims)写道。

你能将这些数字置于历史背景中吗?
这是自20世纪60年代(计算机时代开始)或19世纪80年代(铁路时代鼎盛时期)以来最大的科技基础设施项目。
今年1月,摩根大通的迈克尔·塞姆巴莱斯特计算指出,领先的人工智能芯片制造商英伟达正以最快速度抢占市场资本支出的最高份额,这一比例自1969年IBM收入峰值以来从未出现过。经济作家保罗·凯德罗夫斯基计算指出,人工智能资本支出占GDP的比重已超过互联网泡沫时期,并正接近自镀金时代铁路建设热潮以来未曾见过的水平。


这些钱都来自哪里?
当今人工智能基础设施的蓬勃发展,得益于当今领先科技公司所获得的非凡且前所未有的利润。正如Cembalest所解释的 在我的播客中解释的那样,当今领先的科技公司在过去几年中变得如此盈利,以至于它们在总“自由现金流” (即收入减去运营支出和基础设施成本)在过去几年中已达到前所未有的水平,远超二战结束以来的任何时期。这些公司的现有商业模式——无论是Meta的广告业务还是Google的搜索广告业务——都足够强大,能够产生巨额利润,用于投资下一代技术。“它们正在产生前所未有的自由现金流,”Cembalest告诉我。“它们赚取了海量资金,这就是为什么它们能够每年投入数百亿美元的资本支出用于人工智能相关研发和基础设施建设。”

那么,这是否解释了为什么股市表现得如此异常?
我认为是的。目前金融界正就一个有趣的问题展开讨论:为什么股市似乎对特朗普的关税措施和经济增长放缓置之不理。我认为,这个问题最清晰的答案是以下几点的结合:(a) 部分投资者仍认为特朗普会放弃关税政策;(b) 他们认为关税的最终影响不会太大;以及 (c) 关税对数字经济影响有限,而人工智能相关股票正主导市场回报,而其他板块则整体表现平平。
如法国兴业银行的这张图表所示所示,标普500指数中排名前十的公司在过去六年中对净利润增长的贡献如此之大,以至于将标普10与标普490进行比较可能更有意义。如果你是投资于其他490只股票的投资组合经理,过去六年的股权回报并不令人印象深刻,因为这些公司集体未能实现利润增长。

好吧,公司正在花费前所未有的巨额资金。他们能收回这些投资吗?
目前还不能。正如《华尔街日报》的格雷格·伊普所写所写,人工智能热潮的“令人不安”的一面是,所有这些在芯片和数据中心上的支出正在“耗尽美国企业的现金”。OpenAI和Anthropic正面临巨额亏损,而大型科技公司仍依赖传统商业模式来实现最高利润率。若这些企业支出远超未来可能收回的收益,这将表明我们正处于一场历史性的基础设施泡沫之中。
至于乐观前景:支付公司Stripe已观察到人工智能初创企业的收入增长速度超过了任何前一代技术。**“**人工智能公司达到收入里程碑的速度比前几代初创企业更快,”该公司在最近的一份报告中宣布。“Stripe平台上前100家人工智能公司实现年化收入达100万美元的 median 周期仅为11.5个月——比增长最快的SaaS公司提前了四个月。”

谁在使用这项技术?
据一项统计,像ChatGPT和Gemini这样的生成式人工智能工具的采用速度,比我们有可靠数据的几乎任何技术都快。圣路易斯联邦储备银行估计生成式人工智能的采用速度大约是互联网的两倍。

在最近关于生成式人工智能的最大规模调查之一——2025年论文《生成式人工智能对劳动力市场的影响》 ——经济学家估计,信息服务行业(即软件公司)和管理岗位中已有超过50%的员工在工作中使用该技术。相比之下,传统行业(如采矿或渔业)的企业中使用该技术的人员非常少。人工智能在大学毕业生中的普及程度也远高于从未上过大学的人群。


工人是否认为人工智能正在提高他们的生产力?
是的。证明新的人工智能模型能够提高生产力的标志性研究来自那些从事重复性工作的大型企业,例如呼叫中心。但我们正收到更多员工的自我报告,称人工智能正在帮助他们节省大量时间。一个令人惊讶的例子是教育领域。根据盖洛普最近的一项调查,大约60%的小学教师表示,他们曾使用人工智能来备课、复习教学材料、制作练习题或处理行政工作。大多数使用人工智能的教师表示,它改善了他们的工作,而那些经常使用的人工智能的教师表示,它每周为他们节省6小时——或每学年节省6周。在一种非常乐观的解读中,这相当于说人工智能每年为小学教师提供了一个半月的带薪假期。

或许最令人振奋的迹象表明人工智能将帮助人们在工作中提升效率,来自非营利性人工智能研究机构METR。该机构发现,人工智能代理能够完成的任务长度每7个月就会翻一番。2021年,人工智能能够自动化完成一次简单的谷歌搜索:10秒钟。两年后,ChatGPT在互联网上查找事实所需的时间,相当于普通人需要约4分钟。如今,部分模型已能完成耗时普通开发者50分钟的编码任务。“根据这一趋势外推,预计在不到十年的时间内,我们将看到能够独立完成大量目前需要人类耗时数天或数周的软件任务的人工智能代理,”研究人员表示。

那么,这就是全部了吗:人工智能将引发一场经济范围内的生产力革命?
别急。事实上,许多工人可能会严重高估人工智能提升他们生产力的程度。
METR还开展了一项深入研究,要求有经验的开发者使用一款流行的AI助手进行编程。完成任务后,开发者声称使用AI使他们的生产力提高了20%。但研究中的独立评估人员实际上得出结论:使用人工智能的效果恰恰相反——它使任务完成时间增加了约20%。我不想过多猜测这项研究在长期内意味着什么。但目前,我认为这对于那些声称ChatGPT即将取代数千万个初级白领岗位的乐观预测而言,是一个必要的警示。

再告诉我一个关于人工智能如何改变世界的好笑故事
《科学》杂志上的一篇新论文发现,自大型语言模型兴起以来,学术写作发生了巨大变化。2024年,“delves”一词的出现频率较历史平均值高出2700%,据一项统计显示。分析表明,2024年约1/7的摘要经过了人工智能处理。

>如果没有人工智能,美国经济增长将十分微弱。
这里的假设是,如果没有人工智能,这些资本将不会被部署到任何地方。这听起来似乎不太现实。文章接着写道:
>在过去两年中,约60%的股市增长来自与人工智能相关的公司,如微软、英伟达和Meta。
这一说法自2020年以来一直普遍成立,远在ChatGPT引发当前热潮之前。我们曾有“七大巨头”,更早前还有FAANG集团。美国股市已长期高度集中于少数几个小集团。
>从商业数据中可以看出这一点。根据Stripe的数据,自称“人工智能公司”的企业在该平台上的收入增长占据主导地位,且远超其他任何集团的增长率。
当前“初创企业”与“人工智能公司”的维恩图几乎是两个同心圆。同样,过去四十年中的任何时候都可以做出以下陈述:
>根据[数据来源], 自称“初创公司”的企业在平台上的收入增长占据主导地位,且远超其他任何群体的增长率。
我认为更可能的假设是,你本应预期市场会更加多元化。如果我们真的处于一种情况,即理性的、合理的选择是有效地忽略98%的公司,这并不说明我们的经济状况良好(几乎接近某种技术国家)。你会遇到奇怪的效应,比如“为什么投资其他公司”导致“为什么创立一家公司,它最终会被忽略”,这导致了更多的整合和更少的活力。
但初创企业正蓬勃发展。这并不意味着活力下降。这表明通过利用技术进步可以获得丰厚回报,而传统经济并未抓住这些机会。蓬勃发展的科技初创企业部门无疑是活力的关键。
> 但初创企业蓬勃发展
我只是个有自己看法的人。我在初创企业工作了20年。初创企业被称为令人兴奋、蓬勃发展或值得投资,是因为其中极少数成功,而更少的部分试图与成熟企业竞争。资本被注入大量小型企业——无论当前流行技术或市场机会如何。它们通常无法持久。从统计数据来看,如果你是6年前的人工智能初创企业,你早已消失,只带走了你能拼凑起来的残余。初创企业蓬勃发展是因为它们依赖于宏大的梦想,而极少数企业能找到性格、能力和市场需求的完美结合,从而存活十年。这算是蓬勃发展还是挣扎求生?不要将赌博的速度与机会的规模混为一谈。
这个指标显然存在问题,但YC的S25批次中,120/134家是人工智能相关的[0])。90%或许比98%好,但还是有点令人担忧。所以,这取决于你对“蓬勃发展”的定义,但如果多样性是其中一个因素,那么至少YC正在证明你错了。
[0]: https://www.ycombinator.com/companies?batch=Summer%202025(搜索“AI”可得到120)
如果在轮子发明后你还在使用雪橇,那你就犯了错误。如果在计算机发展后你还在用铅笔和纸张进行创新,那你就犯了严重的错误。2010年还在发送传真就没有任何优点。
科技界必须认识到这一点。我们都是厄普顿·辛克莱所言“当一个人的薪水取决于他是否理解某件事时,要让他理解那件事是困难的”的受害者。
很多科技产品本身就是糟糕的。机枪是糟糕的。核弹是糟糕的。社交媒体是糟糕的。电视是糟糕的。汽车是糟糕的。C++是糟糕的。
> 如果在计算机发展之后,你还在用铅笔和纸张进行创新,那你犯了一个严重的错误。
这是一个很好的例子。研究表明,与打字相比,在纸上写作有助于记忆和分析。研究表明,与在屏幕上阅读相比,在纸上阅读有助于记忆和理解。
> 2010年还在发送传真没有任何优点。
你可以发送一份带有真实签名的文件。这可能看起来不是什么大事,但“湿墨水”条款阻止了许多民主议程(选民登记等),而这些条款的善意理由(通常是选民压制)是,没有签名的文件太容易伪造。
但是,传真机不好吗?它们是否导致了更加庞大的官僚机构?我们早已超越了“新技术=好”这一默认真理的阶段。
人工智能初创公司正获得大量资金。“蓬勃发展”从这个角度看有些牵强,除非资金获取本身就是成功标准。
与此同时,我听说几乎所有与人工智能无关的初创公司都发现融资难度加大。
如果“蓬勃发展”意味着“迅速走向被大型公司收购”,那么这种多样性不过是虚幻的。
就连收购人才的途径也在终结,大型公司现在直接招聘人才。我认为这将拖累初创企业投资:为什么我要投资我的资本,只是为了给一些人工智能工程师打造一个一次性简历工具,而最终我甚至无法获得全部回报?
我同意,但似乎这种活力几乎仅限于数字科技领域。我希望科技能将这种活力更好地扩展到传统行业,为这些领域带来一些生产力提升或颠覆。
传统行业如零售、汽车、媒体、通信等领域已经经历了大量颠覆。
问题的一部分在于,剩下的行业要通过技术实现动态化相当困难,因为各种原因导致市场规模无法实现爆炸式增长。例如,如果你想颠覆航空业,一架飞机的研发成本就需要数十亿美元,而航空公司还需要投入数十亿美元的资本支出购买飞机。
真是可惜。客机行业确实需要一些“快速行动、打破常规”的初创企业活力来进行改革!
我并不是说应该这样做,只是举个例子。
不过我确实希望美国航空市场能有更多活力,三大航空公司的合并可能是个错误。
我可不希望我的客机“快速行动,打破常规”,谢谢。
但我明白你的意思
我认为Supernaut的评论是讽刺。
你理解得没错!
> 但初创企业正蓬勃发展。
你基于什么做出这一论断?有数据支持吗?
1. 如果无法获得回报,人们不会承担风险并投入资本。
2. 如果人们认为能获得异常高的回报,他们会比平时投入更多资金。
3. 无论其他资金本应投资于何处,它都会流向能获得最高回报的地方,而这与美国人工智能投资的比率很可能不同——大型科技公司十年间一直在回购股票,因为它们没有更多的研发资金可投(根据股东的说法)。
因此,尽管美国若没有人工智能可能不会完全没有投资,但投资规模与当前持平的可能性更低。
> 投资规模与当前持平的可能性更低。
我对此表示怀疑。投资者不会坐拥资金任其因通胀贬值。
另一方面,你可以声称非人工智能公司不会引发新的泡沫,因此可用于再投资的回报会减少,这可能是真的,但这种说法有点循环论证。
正确——这就是为什么你会把它投资于国债,因为国债在约25年来首次实现了正的实际回报——或者,如我之前提到的,如果你看到更好的投资机会,就把钱投到其他地方。
当你看看收益率的表现时,这是一个更具说服力的论点。人工智能正在吸走市场中的资金。
从宏观角度看,既然没有人能击败国债,那么国债从哪里获得资金?
是从愿意借钱给他们的人那里?还是说你指的是国债从哪里找到生产?
当然会印钞 🙂
遗憾的是,这正是政府毫不掩饰地渴望的。我们可能正处于经济衰退中,而特朗普想加速它,让美国陷入萧条,掠夺美国并带走资金。
> 1. 如果人们无法获得回报,他们就不会承担风险并投入资本。
> 2. 如果人们认为他们可以获得异常高的回报,他们会比平时投入更多资金。
这似乎是支持开征财富税以限制在没有不合理高回报情况下自然囤积财富的有力论据。
我们1000%需要各种财富税。这些财富已被囤积数十年,我认为当婴儿潮一代去世时,这些钱不会传给下一代。应征收遗产税、超高收入税,以及可能的股票税。政府却想削减食品券和医疗保健资金,同时给强盗资本家数万亿美元的税收减免。必须有所妥协。
遗憾的是,我认为财富税最终会让所有人变穷。顶级0.01%人群持有的财富大多以股权/投资形式存在于各行业。对这些资产征税将直接抽走经济中的资本。不过我认为对房地产持有征税是个好主意(类似乔治主义)。
在这场博弈中,两大主要玩家的商业模式正面临考验。
谷歌正面临一个重大风险,即其搜索广告业务可能会彻底消失。如果人们开始使用人工智能来查找信息或获取推荐,那么他们就不会再使用谷歌。为什么摄影师还要每月花$200在广告上,如果他们的客户都来自OpenAI呢?尤其是当OpenAI正在利用自然搜索结果的时候。Meta也面临同样的问题,如果用户的注意力不在Instagram上,那么广告收入就会流向其他地方。
因此,如果他们有资金且能获得资金,他们会投资以保护自己的业务——全部投入。
微软和风险投资公司(VC)则在做相反的事情,他们投资的目的是抢夺谷歌和Meta目前拥有的用户注意力,但他们也在跟随谷歌和Meta向市场发出的“我感到害怕”的信号。
目前,每一家面向消费者的AI公司(除了Anthropic和苹果)都在将广告整合到他们的产品中,或者正在探索如何这样做,包括OpenAI。
因此,我并不认为谷歌的广告业务处于危险之中,而是它正在转型。
为什么“不太可能”这些美国公司不会进行美国投资?
大型美国软件公司拥有充足的现金,他们会投资于市场潮流,从而将资金引入美国经济。
不——传统上他们会通过股票回购将资金返还给股东,因为他们没有好的投资机会。
或者,像苹果公司那样,他们只是囤积现金,等待更好的投资机会。
苹果进行了大规模的股票回购。
公司需要保持现金储备占支出比例的健康水平。
苹果只是拥有巨大的收入和支出。
这不仅仅是苹果,它们都囤积了巨额现金。
> 1. 如果无法获得回报,人们不会承担风险并投入资本。
这似乎与我观察到的现代风险投资行为不符。令人惊讶的是,如此巨额的资金会被投入到那些充其量只是遥不可及的项目中。
当你把风险投资视为一个主要由无聊项目组成的投资组合中的1%时,这似乎更有道理(从投资者的角度来看)。
>1. 如果无法获得回报,人们就不会承担风险并投入资本。
抱歉,你说什么?这种情况自2008年以来一直发生,而且频率越来越高。
> > 没有人工智能,美国经济增长将微乎其微。
> 这里的假设是,没有人工智能,这些资本就不会被部署到任何地方。这听起来并不现实。
这才是真正令人担忧的地方,也许所有这些资本本可以投资于实际经济增长,而不是助长这个迟早会破裂的投机泡沫,从而带走任何增长的幻象。
如果我的人生经历教会了我什么,那就是总会有另一个泡沫。《创新者的窘境》提到,泡沫本身并非坏事,因为有用的技术往往在泡沫中诞生,只是市场混乱,许多人最终陷入泡沫。这就像“乱枪打鸟”的市场增长策略。与进化类似,大多数突变无用,但所有突变都有可能带来变革。
我认为他们的评论意味着我们可以为小学生提供免费午餐或实施普惠托儿服务。这些都是真正有用的事情,能够释放巨大的经济价值,但结果我却被赋予了一台“说谎机器”,并被要求让它变得有生产力。
或者所有这些资金可能都在追逐其他投机性技术。也可能只是躺在美国国债中以5%的收益率等待有前景的投资机会。谁知道平行宇宙中发生了什么?目前,感觉 everyone 都在疯狂投放美元,寄希望于人工智能真的成为一个大产业,以证明这一切经济活动的合理性。这让我想起了电影《别人的钱》中丹尼·德维托饰演的角色在公司总裁发表了一番慷慨激昂的演讲,劝说投资者继续投资后的台词:
“阿门。阿门。阿门。请原谅我。我对当地习俗不熟悉。在我家乡,听到祈祷后总是说‘阿门’。因为你刚才听到的就是祈祷。”
此时此刻,大家都在祈祷人工智能最终能带来净收益,而非破裂并使世界陷入长达5年以上的衰退。
> 或者它可能一直投资于美国国债,获得5%的收益
细节:如果这种情况发生,我认为国债收益率会急剧下降。
我同意,在美国历史上任何时期,总有5到10家公司引领经济进步。
这非常常见,几乎每个国家都会发生这种情况。
但他们的资本支出(CAPEX)会小得多,因为如果你看看目前大型科技公司的资本支出,其中大部分都来自英伟达(NVIDIA)的GPU。
如果出现泡沫,当泡沫破裂时,所有英伟达硬件的折旧将彻底摧毁所有云计算公司或自建数据中心的公司的资产负债表和利润,比如Meta和X.ai。
而NVIDIA甚至不生产这些GPU!它们全部产自中国海岸附近的一个小岛,而7家美国巨头公司则在这些GPU之间进行交易,并为此支付巨额资金。
将AI公司与其他公司进行增长比较也不公平,因为AI是一项新兴技术。为什么共享出行应用会出现爆炸式增长,而它是一个成熟的细分市场,已有 established 竞争对手?
我认为人们所期待的爆炸式增长在于制造业。例如:美国螺丝、螺栓、铆钉、模具、PCB、组装等。
资金正被转移到其他地方。
英特尔作为能直接服务于人工智能热潮的芯片制造商,未能部署其2纳米或1.8纳米晶圆厂,反而将其注销。下一代晶圆厂也面临失败。因此,尽管人工智能获得了大量资金,但似乎并未流向正确领域。
他们不会明白。东亚的政治经济环境更适合先进制造业。美国希望获得东亚的制造业,却不要其政治体系。有时这有其合理性——出口导向型经济也有其弊端!
台湾并非某个偏远小岛,只生产低技术含量产品。
美国失去了大规模制造业(螺丝、铆钉、拉链等),如今我们正在失去世界顶级制造业(英特尔与台积电的竞争)。
如果我们无法制造,那么我们很可能无法赢得下一场战争。这就是政治在起作用。工业化国家之间最后一次重大战争表明,技术和制造业是成功的关键。现在我认为美国不需要独自制造一切,但它需要一个合理的计划来确保供应链中的每个关键组件。
在二战中,这几乎都归结于滚珠轴承。未来难以预测,但下次可能是芯片。
也许我们放弃最廉价的螺丝或钉子。但我们需要在某些产品上保持精英地位。
> 台湾不是某个偏远小岛,只生产低技能产品。
绝对不是!我不是这个意思。
> 如果我们无法制造,那么我们很可能无法赢得下一场战争。
如果你认为战争迫在眉睫(这是一个大胆的断言!),那么我们唯一的希望就是与在这里设立工厂的专门盟友合作(例如台湾、日本、韩国)。试图复活英特尔的垂直整合商业模式来与台积电的承包商模式竞争,在我看来是一个错误。
我认为这是对美国经济制造能力的严重简化和错误评估。
美国完全掌控芯片制造过程中的关键环节,以及生产具有竞争力的芯片所需的知识产权,而光刻机则由一个会遵守美国制裁的亲密盟友控制。
实际的战机、军舰和导弹当然仍在美国制造。现代战争中,使用中国制造的无人机和电池等装备只能走这么远。他们无法在没有美国和西欧供应商的情况下制造出具有商业竞争力的航空喷气发动机。
美国/北美自由贸易协定(NAFTA)在许多“螺丝和铆钉”类别中拥有大量现有的制造能力。例如,美国有许多汽车零部件和装配公司。该行业规模虽不如以往,但仍具重要性。美国是除中国外最大的制造业出口国。
确实。刚才孩子的治疗师告诉我们,他们要搬离当前学区,因为附近要建一家化工厂。比起污染,更让人无法接受的是,任何实体产品工厂都被视为迪士尼化郊区及其白领居民眼中的“瘟疫”。
>我认为人们渴望的爆炸式增长在于制造业。例如:美国螺丝、螺栓、铆钉、模具、PCB、组装等。
而实现这种爆炸性增长的唯一途径是机器人技术。这就是我们正在步入的后后工业革命——制造业不再与知识型经济分离,而是成为其一部分,具体表现为知识型经济在物理世界中的输出形式。
资金正在流向其他领域。
资金正在流向正确的方向——人工智能。在大语言模型(LLM)之后,NVDA 和谷歌等公司正在采取下一步行动——建立基础世界模型和机器人技术。
英特尔是一家能够直接服务于人工智能热潮的芯片制造商。
英特尔是管理层的摇钱树——就像20年前的太阳微系统公司一样。别指望了。
>英特尔……未能部署其2纳米或1.8纳米晶圆厂,反而将其注销。因此,尽管人工智能获得了大量资金,但似乎并未流向正确的地方。
资金流向了 NVDA,而不是英特尔。似乎正是流向了正确的地方。
你不需要大语言模型(LLM)来操作拾放机、车床或 PCB 生产线。
编辑:https://youtu.be/SRu02F6AOmg?si=LZHZhbuB1ITjVdkw
美国在大型语言模型(LLMs)上花费了数万亿美元,而中国在过去的二十年里大量生产了上述芯片射击机和拾放机。
你的大型语言模型甚至无法处理或与 15 年前的技术竞争。
现在美国也有拾放机和其他此类设备。但我们的速度较慢,数量也不多。尽管美国有更好的软件,但我们的设置成本却高得多 (jlcpcb的订单因订单量巨大而预先布线并使用预制库。美国订单较少,因此需要人工设置每条生产线)。
>此处的假设是,若没有AI,这些资本根本不会被部署到任何地方。这直觉上听起来并不现实
很长一段时间以来,FAANG的资本支出一直很低。这些公司显然是在针对 AI 做出具体回应。我认为不现实地期望它们会无缘无故提高资本支出。
>这一说法自 2020 年以来一直大致成立,远在 ChatGPT 引发当前热潮之前
这可能取决于你对“远在之前”的定义,但 ChatGPT 的发布时间大致处于现在与 2020 年之间。
至于初创公司与人工智能公司的区别,你读过Stripe关于此主题的白皮书吗?他们详细阐述了人工智能公司确实属于不同类型。https://stripe.com/en-br/lp/indexingai
研究税收优惠的取消可以解释为什么他们把所有资源都投入到这个项目中。
他们也将劳动力视为可替代的成本,就像大多数不再创新的会计公司一样。他们忘记了,如果你不雇佣人,不支付薪水,你就没有销售需求,而随着资金集中在少数人手中的程度加深,这种情况会变得更糟。大多数人工智能公司都依赖于银行的极端杠杆融资,而这些银行正在印钞,这与2020年存款要求降至0%的情况相吻合, effectively 消除了分钞银行体系。
>这里的假设是,如果没有人工智能,这些资本将不会被部署到任何地方。
在这种经济衰退行为下,这种假设或许并非完全不切实际。如果没有这场所有人都想趁机牟利的投机热潮,我实在想不出这些资金还能流向何处,除了被囤积在资产中。尤其考虑到目前有大量资金涌入人工智能领域,但人工智能尚未实现盈利。
就是这样,这是特殊时期,人工智能热潮可能在掩盖一些问题。我个人从年初开始就完全撤出了美国企业,但我能理解想要搭上这趟顺风车的诱惑。
我认为资金正在追逐一个已基本成熟市场的增长。在这种情况下,科技是唯一希望,因此资金流向了那里。
“这里的假设是,如果没有人工智能,这些资本根本不会被部署到任何地方。”
问题是,这些资本是否可以被部署到更具生产力的地方。如果这些资金只是被用来投资房地产投资信托基金(REITs)购买单户住宅,你会更满意吗?
这取决于“更具生产力”对他们意味着什么。例如,如果退出得足够早,金字塔骗局是非常“生产力”的。
资本本应、或许本应被用于股票回购和分红。在美国,投资本就不会发生,而对于一个贸易逆差的发达国家来说,这是意料之中的事。
德里克·汤普森并不适合这种工作。他更适合他一贯的平庸、可预测、中间派、不冷不热的评论,针对那些陈旧的政治和社会话题。
我认为这是整篇文章中最有趣的部分——“标普500指数中前十大公司过去六年对净利润增长的支配作用如此之大,以至于将标普10与标普490进行比较可能更有意义”——这让我联想到以下内容: https://insight-public.sgmarkets.com/quant-motion-pictures/o…
有人能解释一下这两个指数之间发生了什么吗?我对文章中其他论点并不信服,希望得到一个不单纯依赖“人工智能”作为解释的分析。
这是一个非常复杂的现象,没有单一的驱动因素。通常的罪魁祸首是不确定性,而这种不确定性本身可能有无数的根源(例如,关税每几周就变化一次,或由于政府补贴导致通胀率上升)。
在不确定性更高的情境下,小型企业无法像大型企业那样承担风险。过去两年,大型企业投资的AI技术已开始带来回报。但由于不确定性,中小型企业未能从中获益。
但这只是其中一种可能的解释!
> 过去两年,人工智能(AI)——这些大型企业投资的重大风险领域——已开始带来回报
哈哈。现在它正在带来回报,因为别无选择。但终有一天,企业和投资者将希望收回这些数百亿美元的投资。而目前唯一获利的是英伟达,以及通过销售更多Azure服务间接获利的微软。
一旦明确意识到,为学生作弊的家庭作业行业不会成为万亿美元产业,且英伟达在某年X的销量不再超过X-1年,人们很快就会意识到过去两年是一个巨大的泡沫。
这是一个非常不切实际的观点!如果你说得对,你可能会赚到很多钱!
不,正如你我所知——我做不到。因为这是定性观点,而非定量分析。我需要精确知道_何时_自己会证明正确。
而我无法确定,因为每周仅有约60分钟思考此事,且优质的定量市场分析实在困难。
所以,虽然说“哇,我打赌你做空赚了很多钱!”听起来像是个不错的回应,但我知道我做不到,这也很肤浅。因为我不在乎我是12个月、24个月还是60个月后才证明自己是正确的。顺便说一句,12个月前我以为自己会在12个月内证明自己是正确的。哎呀。好在我没有尝试在这种风险收益比极端不平衡的领域“赚钱”——上行空间是赌注的100%,下行空间理论上是无限的。
如果你在考虑期权交易或全仓押注某笔交易,你的逻辑是正确的,但对股票而言并不完全适用。微软(MSFT)和英伟达(NVDA)的借贷利率——即使对散户投资者而言——也低于1%的年利率。因此,如果你认为自己的观点正确,可以持有这些股票的空头头寸多年。这些公司的市值已经反映了对人工智能数据中心的巨额资本支出。只要你采用合理的再平衡策略,并且认为它们当前对人工智能的投资不会带来回报,你就能赚钱。
需要注意的是,这种观点确实存在——目前已有少数大型对冲基金和卖方机构对这些公司持负面头寸/观点。
然而,事实是,愿意押注这种观点的人远少于持相反观点的人。因此,谨慎表达这种观点是合理的。
你最终可能是对的,但这种押注并未(或不会)带来回报这一点绝非显而易见。
如果股票在此期间上涨,难道不会被强制平仓吗?
它们占标普500指数的40%,因此成为其增长的主要驱动力合乎逻辑。
它们都是科技公司,在疫情期间表现极为出色。
它们也具备增长潜力,而像宝洁或沃尔玛这样的公司可能已经饱和了其市场
> 它们都是科技公司,在疫情期间表现非常出色。
只有8家是科技公司。伯克希尔和摩根大通不是。特斯拉是否是科技公司还是汽车公司也值得商榷。
伯克希尔持有约$600亿的苹果股票,并通过其电力公用事业部门伯克希尔哈撒韦能源公司涉足人工智能领域。
> 伯克希尔持有约$600亿的苹果股票,并通过其电力公用事业部门伯克希尔哈撒韦能源公司涉足人工智能领域。
苹果占伯克希尔持股的22%。其最大投资对象依次为美国运通、美国银行、可口可乐和雪佛龙。
他们不是科技公司。
伯克希尔通过苹果公司和伯克希尔哈撒韦能源公司对人工智能有显著的投资。因此,尽管他们不是科技公司,但他们对人工智能热潮的投资比其他任何非科技公司都多。
以下内容可能值得关注…看看标准普尔500指数前10名在过去几十年中的变化[1].
在任何时候,人们都认为这些前十名公司是不可阻挡的。在90年代和21世纪初,通用电气(GE)被视为不可阻挡,商界充斥着杰克·韦尔奇的追随者。然而,如今我们却身处此境。
五年前,我想我们很多人认为苹果、谷歌和微软是不可阻挡的。但五年到十年后,我敢打赌,我们会在前十名中看到新的标志。NVDA已经跻身其中。苹果会继续保持主导地位,还是会像索尼一样衰落?互联网的商业模式是否正在发生变化,以至于谷歌无法及时做出反应?OpenAI会上市(或其他基础模型玩家)吗?
我不知道未来会怎样,但我可以肯定它会与现在不同。
[1] https://www.visualcapitalist.com/ranked-the-largest-sp-500-c…
标普指数中总有一些子集比其他部分重要得多,就像标普指数比罗素指数重要得多一样。
通常,你可能需要关注标普25指数而不是标普10指数。
赢家通吃现在在整个全球经济层面都成立。
大型企业的首要目标(/已演变为)是维持市场主导地位,但这并不总是意味着企业运营良好且利润丰厚,这取决于内部和外部因素。或许由于关税和不确定性,利润本应下降,但大型企业却保持了利润稳定。
> 或许由于关税和不确定性,利润本应下降,但大型企业却保持了利润稳定。
如果你指的是特朗普的关税,它们现在才开始生效,因此经济影响将在未来数月乃至数年内显现。
人们购买数字商品的空间更大。购买实物商品的空间则小得多。人们不会为了吃更多麦当劳而扩大胃口,但一个人对数据、软件或人工智能代币的需求是没有上限的。
幂律解释了分布,但这种分布在近年来变得越来越极端,这可能与市场结构、宏观经济条件、技术经济等因素有关。
有趣的是,标普500指数中排名后490家的公司利润并未因人工智能技术而增长,尽管这些技术据称是以折扣价出售给它们的,因为人工智能供应商正在亏损。
除了英伟达,标普10家的利润也没有增长。只是市场对它们的估值过于乐观。
我认为这是股市中极度危险的局面。人工智能泡沫破裂的痛苦将超过互联网泡沫破裂。需注意,“人工智能泡沫破裂”并不意味着认为人工智能“无用”——互联网并非无用,互联网泡沫破裂仍旧发生。即使推动泡沫的乐观假设最终成真,市场仍可能因过早泡沫化而崩盘。
我们仍处于“抢占市场”阶段,企业正通过慷慨的人工智能计划吸引用户。
一旦用户对人工智能产生依赖,并将其视为完成任何任务的不可或缺的工具,这些企业将开始收取使用这些模型的真实成本。
如果今天的$20计划实际上只是$70计划的 introductory rate,这并不令人意外。
我会感到惊讶,因为(免费)开源软件正在不断缩小差距,对价格施加下行压力。
真正价值在于基础设施。本地运行成本极高,因为需要100%配置资源且门槛极高。因此人们倾向于使用云服务。如果模型本身没有差异化,那么关键在于如何组合模型、容量和可用性,以及“GPT封装”等技术。
我认为这对大型供应商不会构成太大问题,就像开源软件从未成为微软的担忧一样。人工智能市场涵盖了整个人口,而不仅仅是那小部分知道“VRAM”是什么意思并愿意在硬件上花费数千美元的人群。
你也可以以低成本托管开源模型;例如通过OpenRouter、AWS Bedrock等。你不需要自己运行它。
> 就像开源软件从未成为微软的担忧一样。
那么这是一个大问题吗?(尽管不是致命打击)
现代微软凭借Azure、Office360等服务,并未受到开源软件的太大威胁。尤其是Azure,开源软件是其绝佳的补充,他们希望全球能尽可能多地开发开源软件。人工智能模型也是如此。他们会对人工智能托管和服务收取费用,且由于已深度集成到企业中,费用会更高。他们会将这些服务与现有盈利业务捆绑,然后直接提价。无需销售,只需在原本就存在的账单中增加费用。
表述是“有史以来”,但即便在现代,你看到的也只是他们的成功案例。
难道像Kubernetes或Android的开源版本这样的技术不应该引起关注吗?似乎有很多大型企业可能会将他们排名第四的闭源API转变为排名第一的开源生态系统。
他们无疑对开源软件感到非常威胁——如今,许多软件基础设施都是基于开源软件构建的。而在2000年代,情况并非如此。当时是微软、MSS、COM、Windows服务器等技术主导一切。微软基本上是被开源软件所拯救,只是由于他们曾经如此庞大,即使被削弱了几分,仍然保持着巨大的影响力。
即使在今天,Azure和AWS也并非真的更便宜或更好——对于大多数情况而言,它们的成本更高,且不如基于开源基础设施的解决方案灵活。对于那些在软件开发方面取得成功的公司而言,Azure更像是绊脚石和遗憾。许多公司尽管明知迁移过程会带来巨大痛苦,仍选择放弃云服务——这与过去放弃微软基础设施的过程如出一辙。
希望随着时间的推移,我们能够看到足够的效率提升,以证明这是真的。与大语言模型(LLM)提供的免费模型相比,我可以在我的(昂贵的)本地硬件上运行的模型非常糟糕。我讨厌永远被我买不起的硬件束缚。
托肯生成扩散技术的突破大大降低了计算量。但尚无本地开源版本。
如果需要针对特定任务提升本地模型能力,可以通过蒸馏技术进行专业化训练。
目前进展还算顺利。
它们其实并不免费,有人必须承担计算成本。
我很好奇泡沫何时破裂。我个人认为这不会像互联网泡沫时代那样。
这些好处对普通人来说并没有那么广泛。也许我错了,但我并不认为人工智能炒作是美国就业的基石,所以不会突然出现就业岗位枯竭的情况。大型公司仍然手头宽裕,不是吗?
如果/当热潮消退时,我认为它会悄无声息地消退。
这更像是19世纪80年代的铁路业。众多公司生产大同小异的产品,争夺高度夸大的理论需求。在所有喧嚣之后,最终会迎来崩盘和理性化。如今的铁路业变得枯燥、受监管且实用主义。许多铁路公司仍由国家拥有,且常常亏损。
我认为人工智能具有与互联网一样巨大的变革潜力。但我认为大语言模型(LLMs)并不是实现这一变革的正确途径。
自动驾驶汽车和智能机器人才是真正的金矿。但我们似乎仍然没有找到正确的架构或方法。
我之所以这么说,是因为尽管人们对人工智能的兴趣和投入资源都在迅速增长,但自动驾驶汽车的发展却完全停滞不前。
个人认为,我们需要在强化学习、计算机视觉(目前仍主要停留在前馈卷积神经网络阶段)和少样本学习领域实现重大突破。Transformer模型虽是重大飞跃,但仅凭它还不够。
我并非认为现状无法改变。我只是基于当前行业格局,设想若因消费者兴趣缺失导致资金断裂,可能引发的后果。
总体而言,我不同意经济对人工智能的过度依赖,正如其并未对加密货币过度依赖。若资金枯竭,我预计不会引发全行业裁员潮。
如果资金枯竭,依赖投机性资产生存的初创企业将陷入困境,标普指数的估值也会下跌。但这实际上对核心经济影响不大。
我认为我们正处于一个巨大的AI泡沫中,但这个泡沫对普通消费者影响不大,因此并不危险或令人担忧。
至于我对真正有用的人工智能自动化所需条件的预测……我怀疑当前的泡沫会在我们解决这个问题之前破裂。
自动驾驶汽车是否停滞不前?Waymo似乎仍在稳步推进。
对普通人来说,其好处并不那么广泛
我认为你可能低估了每天使用大语言模型(LLM)的非技术人员的人数。
> 除了 NVIDIA 之外,标准普尔 10 指数的利润也没有增长。
这不正确。你是不是想说别的?
我们永远无法知道没有AI会发生什么。
1. 利润本可能下降。
2. 计划可能是 upfront 投资大量资金用于裁员和AI整合,这些投资_应该_在未来带来回报。
3. 未来是否会实现尚不确定,且难以判断,因为它可能在经济衰退同时发生时带来回报,从而抵消影响。
这几乎就像事情并非那么简单。
预测未来始终困难。
但我一生中见过最能与人工智能(AI)当前发展相媲美的现象,包括其炒作热潮、超越炒作的实际价值、空洞的项目与扎实的项目等,便是互联网的崛起。
基于此,我认为我们正处于1999-2000年的时代。如果这种判断成立,这对未来意味着什么?
嗯,这里有一个根本区别:互联网之所以爆发式增长,是因为它使人们能够更轻松地相互连接:文化上、经济上、政治上。
人工智能更多的是在取代人类,而不是连接人类。在许多情况下,这在经济上是有价值的,但在其他情况下,我认为它只是将人类的联系转移到另一个场合。我不会对线下聚会小组的复兴感到惊讶,例如。
因此,如果关于人工智能的预测涉及它取代人类文化活动(例如,认为YouTube将被人工智能视频取代,而真实的人将失去工作),那么我持悲观态度。人们会找到其他方式来相互连接。
企业对人工智能取代人类过于乐观。
对于非常简单的工作,比如在呼叫中心工作?当然可以。
但绝大多数工作都不是人工智能可以取代的。任何需要任何程度的上下文敏感人类决策的工作,例如。
人工智能无法兑现当前的炒作,它终将崩溃。唯一的问题是崩溃的程度——是悄无声息还是轰然倒塌?
作为客户,没有什么比人工智能客服中心更让我恼火的了。如果我不得不打电话,那是因为我的账户出现问题,需要与人工客服沟通解决。
我搬到了另一个州,Xfinity仍在为我取消服务后的下个月收费。我打电话过去,按了5(或其他数字)选择账单选项。“看起来您的有线调制解调器已断开连接。重启调制解调器通常能解决大多数问题。您现在想尝试吗?”不。“大多数问题都可以通过重启调制解调器解决,您现在想尝试吗?” 不,我的问题是关于账单的,而且我的调制解调器断开连接是因为我已经取消了服务!他们又问了三次(总共五次)才让我继续。出于我现在已经忘记的原因,我不得不多次回电,重新经历整个过程。
有一种人对你说的话置若罔闻,而这些称呼都没有什么好听的。人工智能,本质上就是一个没有同情心的混蛋。
(结果发现他们的数据库每月只能更新一次,或者类似的情况,尽管没有人能帮我,但当他们的数据库最终更新时,他们给我退了款。当地人想帮忙,但因为我的新州属于不同地区,而地区之间无法互通,所以无法帮忙。)
> 对于非常简单的工作,比如在呼叫中心工作?当然可以。
Klarna想说几句。
> 任何需要任何程度的上下文敏感人类决策的工作,例如。
这描述了呼叫中心工作的大部分内容。
还有一个区别是互联网正常工作。
以一种典型的颠覆性方式,互联网提供了一项现有服务(信息交换),但其方式在许多方面远不如现有渠道(报纸、图书馆、电话)令人愉悦。请记住,早期互联网主要以文本形式存在,分辨率极低,缺乏认证,不稳定,成本高昂,且对大多数人而言过于技术化。
我们今天能够拥有视网膜显示屏、实时视频和安全支付处理等美好事物,唯一的原因是原始互联网在没有这些功能的情况下已经提供了足够的价值。
在我对这个网站关于人工智能的首次(或许也是唯一一次)评论中,我确实认为,30或40年后,我们可能会以类似早期互联网的方式看待这一波生成式人工智能。
与他人建立联系,我认为将迎来一股强烈的需求浪潮。我深有体会,与我交谈的许多人也感同身受。一个奇怪的轶事是,过去三年我一直与儿子在健身房锻炼,非常有规律。每个人都只是做自己的事,几乎全是单独锻炼,只有少数几对搭档。我年纪大了,还记得以前在健身房锻炼时会是更社交化的场合,但时代变了。
我们在这里见过一些常客,已经有好几年了。我们几乎没有与他们互动过。突然间,在过去的一周里,通过一次偶然的互动,其中两人分别与我们交谈,并最终自我介绍。此外,我看到越来越多的人开始交谈。
我认为我们已经达到了“独自锻炼”的饱和点, pendulum 可能会向另一个方向摆动。
但我真的尽量避免参与许多“预测人工智能未来”的讨论,因为我们根本不知道它将走向何方。我读过成千上万本科幻小说、非虚构作品和未来学著作,各种可能性都存在,而没有人,我是说没有人,能以任何确定性预测未来会发生什么。
人工智能还带来了一种互联网时代不曾存在的经济拖累:例如低质量内容的泛滥和人工智能驱动的诈骗行为。互联网并未立即让传统的商业模式变得困难,而是逐渐用更高效的替代方案取代了它们。人工智能已经让谷歌搜索和产品评论等服务变得糟糕。在许多方面,人工智能正在逆转互联网带来的部分成果,却没有提供替代方案。
这是Gartner技术成熟度曲线的经典重演。这次泡沫破裂的规模将远超互联网泡沫时代。此外,“启蒙阶段”也未必能超越编程助手的范畴。当前形式的通用人工智能(GenAI)永远无法可靠地完成所谓“代理型”任务。
这场泡沫似乎结合了前两次巨大泡沫的糟糕之处:互联网泡沫的炒作加上房地产泡沫,通过大量债务和证券打包来大规模建设数据中心。
嗯。部分同意,部分不同意。
这些技术目前在学术领域(而非实用领域)的性能水平,大致相当于一名实习生或应届毕业生的水平,且可运行于高端消费级硬件。学习曲线表明,在可预见的未来,进一步提升质量的机会有限……不过这里的“可预见未来”指的是“18个月”。
我完全同意这是泡沫。许多公司定价时假设它们能占据大部分市场;显然它们不可能都占据大部分市场,而且由于这些模型可运行于高端消费级硬件,存在合理可能性是它们中没有一家能抢占市场份额,因为开源模型成本为零,而推理硬件本就是用户已有的设备,因此所有计算都在本地完成。
除此之外,我同意你关于以下观点:
> 当前形式的生成式人工智能永远无法可靠地完成所谓的“代理”任务,例如日常生活的决策。
我之所以同意,是因为并非所有人都希望(或能从)一个“书本知识丰富但缺乏实践经验的实习生”中受益,而且并非所有经济任务都依赖于书本知识。这一系列AI技术进步并未突然让所有汽车制造商一致认为这是阻碍L5级自动驾驶的唯一障碍,例如。
但对于能够利用这些技术的人来说,这些模型已经非常有用(就像所有动力工具一样,使用不当会很危险),而不仅仅是编程助手。
> 当前形式的生成式人工智能永远无法可靠地完成所谓的“代理”任务。
不,但当前形式的生成式人工智能极其有用,已将生产力提升到更高水平。即使没有100%可靠的“代理”任务执行和通用人工智能,这已是下一级别的技术,尤其对非技术人员而言。
一个非常简单的问题:
人们如何信任大语言模型(LLMs)的输出结果?在我了解的领域中,有时答案令人印象深刻,有时则完全错误(出现幻觉)。当答案正确时,我总是觉得我本可以直接用谷歌搜索这个问题,一些答案的变体深藏在某些论坛、堆栈交换或reddit的一些页面中。
然而,在我不熟悉的领域,我完全不知道该如何信任答案。
有几种情况:
2. 在某些情况下,90% 的准确率比现状更好。看看亚马逊的产品描述,尤其是从亚洲销往美国的产品。它们的准确率可能更接近 50% 或 70%。大语言模型(LLM)的“错误率较低”实际上是一种改进,虽然你可能会认为产品描述应该完全正确,但市场已经不同意你的看法了。
我认为,对我而言,大语言模型(LLMs)的主要好处是作为我进入一个我一无所知的领域的切入点。例如,如果我正在构建一种我从未构建过的新系统,那么我就会缺少许多相关信息——比如解决这个问题的最常见方法是什么,我应该阅读哪些学术研究,常见术语/范例/等是什么。对于这类事情,大语言模型(LLMs)非常有用,因为它们只需大致正确即可发挥作用,而且它们还可以提供足够的原始资源链接,让你验证它们的说法。如果我使用的是从未使用过的新库,或者类似的东西,情况也是类似的。对于我已经非常熟悉的事情,我很少使用大语言模型(LLMs)。
这对我来说真的很奇怪…
当然你不信任这个答案。
这并不意味着你不能利用它。
对我来说,除了编程之外,LLMs的另一个关键应用场景是作为一个更强大的搜索引擎。
你可以提出一个非常详细和具体的问题,这种问题用谷歌搜索会非常困难,而o3或其他高端模型会对这个问题有深入的了解。
作为一个有思考能力的人,你可以决定如何利用这些信息。你可以将其作为深入文献研究的起点,从第一性原理出发分析其论点,随后通过谷歌搜索其提到的关键术语……
有一类搜索是我在谷歌上永远不会做的,因为如果要做好这些搜索可能需要半天时间,而用这种方式只需十五分钟就能完成。
例如
我翻阅了我的ChatGPT历史记录,挑选了一些既适合分享又能很好地说明使用场景的例子:
> 供应链中存在一些经典挑战,如牛鞭效应。为什么现代供应链似乎如此具有韧性?这种效应似乎不再发生,至少在大宗商品中不再明显。
> 当美国对日本使用核武器时,日本是否知道那是什么?也就是说,他们是否在原则上理解了基于核链式反应的武器的可能性?
> 截至2025年7月,自全球金融危机以来,股票市场展现出惊人的韧性。即使是COVID-19,也只是股票价格的暂时性问题。股票市场表现强劲的主要宏观经济原因是什么?
> 如果我预订了同一航空公司的两段连续航班(也请回答同一航空联盟的情况),是否可以将行李托运至最终目的地?
> 网站地址为[redacted]的业务主要对应的NAICS代码是什么?
我可能不会费心在谷歌上搜索这些内容,因为这太繁琐了。
以航空公司为例,目标是直接获取各航空公司官方规定的相关链接,o3确实成功实现了这一点(还包括一些IATA规定)。
对于第一或第二个问题,目标是列出相关人员/理论的名称,以便你知道如果想深入研究该从何处着手。
这是事实。
但我见过一些工具(即 Gemini Pro 使用的工具)能做到令人印象深刻的事情。我对它的建模方式是这样的:大语言模型(LLM)和人一样,也有可能产生错误的输出。通常,一群人和一些实验/研究会得出一个“较少错误”的答案。大语言模型(LLM)也可以做到这一点,在某种程度上,Gemini Pro 和 o3 以及它们的代理“眼睛”和“手臂”正在做到这一点。随着硬件和计算成本的下降(如果真的下降的话,这是一个很大的“如果”),即使大语言模型(LLM)本身保持在目前的水平,通过能够部署更多的计算,这些工具也会变得更好。
下面是一个例子:有一种工作我们还没有完全弄清楚如何让大语言模型(LLMs)来完成:创建框架并坚持使用它们,例如以一致的方式创建和构建代码库。但理论上讲,如果能够让 10 个大语言模型(LLMs)实例“讨论”代码中的函数是否符合商定的惯例,那么这个问题就解决了。
还有一些改进的途径需要更多的计算资源。具体来说,目前我们使用的是“一次性”模型……你训练它们,然后多次使用它们。但模型的结构和权重并未根据其动作的输出进行重新训练。在每个模型实例的基础上这样做,也需要在可承受的价格范围内拥有足够的计算资源。目前,在每个模型基础上进行这种操作已经可行,唯一的限制是法律条款、保密协议和监管规定。
我客观地提出这些观点。我不喜欢这种发展趋势;我认为这将使我们进入一个充满挑战的世界,其中大多数事情对人类来说将变得更加困难。但我不想(被迫)以乐观的眼光看待这个世界。
我们非常信任陌生人能够做好他们的工作,让社会正常运转。他们的错误率是多少呢?这一切都取决于大语言模型(LLMs) 的记录、感知和经验。有点像自动驾驶汽车。
陌生人有经济动力去表现。AI没有。目前有哪些AI程序能够自主调整行为以提升自身盈利能力?大多数(如果不是全部)当前公开模型只是基于从网络上抓取的旧数据训练的聊天机器人。哇,我们创建了一个基于2010年代维基百科和Reddit内容的经济体系,这些内容通过能够生成语法正确句子和逻辑连贯段落的机器人相互链接。这难道不棒吗?我不知道,大约10年前,在谷歌自我毁灭之前,我能轻松找到任何主题的信息,并用我基于人类经验的智慧判断其真实性,这比当今任何人工智能都更可靠。
首先,人工智能甚至无法计数。让谷歌的人工智能画一个戴着草帽的女人。大多数情况下,这个女人戴着一顶画得很好的帽子,手里还拿着另一顶。为什么?她经常有三个手臂。为什么?特斯拉的自动驾驶视觉系统无法区分天空和一辆浅色卡车在交通中转弯,导致佛罗里达州发生致命事故。
要成为智能,它需要能够思考并正确评估其思考的正确性。而不仅仅是重复旧的网络抓取内容。
这真的非常可悲。
请给我举一个例子,说明黑匣子大语言模型(LLM)人工智能能够产生有效训练的人类或基于规则的系统无法做到的利润。
即使人工智能能够取代人类完成某些任务,对于劳动力参与率已经很低的消费型经济来说,这也不是一件好事。
在第一次工业革命期间,人类劳动力稀缺,因此机器能够经济地替代和增强劳动力,并提高生活水平。在当今时代,劳动力并不稀缺,因此自动化是一个在寻找问题的解决方案,如果它导致失业而没有普遍的基本收入来支持消费,那么它本身就是一个问题。如果你的经济生产过多而没有人购买,那么经济收缩就会随之而来。如今年轻人已难以购房。与其投资聊天机器人,我们的经济或许应更多雇佣建筑行业和生产岗位的劳动力,让他们通过收入支持消费,包括购买房屋或汽车等耐用品。然而,由于对人工智能的恐慌和炒作,投资者正将资金投向科幻幻想领域,当这些投资未能实现预期回报时,经济收缩将随之而来。
我的观点是,人类也会犯错,但我们信任他们,并非因为我们检查他们所说或所做的一切,而是因为社会结构如此设定。
我不确定你是否了解最新情况,但大多数具备工具调用功能的人工智能都能进行数学运算。图像生成技术自去年以来已不再产生奇怪的内容。Waymo的事故率比人类司机低82%以上[1].
RL 正在修改其行为以提高自己的盈利能力,而训练这些模型的公司会在资金枯竭时优化收入。
我确实感到自己会在经济上被取代。作为一个专注于前端开发的开发人员,如今的大语言模型(LLMs) 已经远远超过了我。我不知道未来会走向何方,但我讨厌人们为了谋生而做卑微的工作。
[1]: https://www.theverge.com/news/658952/waymo-injury-prevention…
> 我的意思是人类也会犯错,而我们信任他们,
我们信任他们是因为他们内在和外在的动机都不允许他们犯错
人工智能没有动机
当真正重要的时候,专业人士有保险,当他们犯错时会赔付。
我认为这就是我们未来的发展方向,人们将通过工作来承担AI的责任。
我通过不重视AI的输出结果,而是重视其工作流程来解决这个问题。
将其视为一个聪明但笨拙的助手,它会为你完成任务而不会抱怨——但其工作需要被双重检查。
你头脑中的内部验证模型实际上非常有效,并非随机。它了解世界是如何运作的,并潜意识地应用了多年来学到的许多嗅探测试。
当然,大语言模型(LLMs)提供的许多答案可能并不准确——但你能够识别出这些答案的不准确之处,是因为你的验证能力(使用各种启发式方法)也很强。
你从向别人寻求建议中学习吗?你从阅读 Reddit 上的评论中学习吗?你仍然不会完全信任它们,因为你有嗅觉测试。
> 你仍然不会完全信任它们,因为你有嗅觉测试
在我看来,大语言模型(LLMs) 产生了太多的噪音,质量也太不稳定,嗅觉测试并没有多大价值。
问题在于内容已经死亡。你无法再在谷歌上找到答案,因为每个网站都是AI生成的,并且布满了广告。
YouTube视频也好不到哪里去。为了达到10分钟的广告时长,会添加大量无意义的内容。
互联网已经成为一个死气沉沉的地方。
问题不在于内容是AI生成的,问题在于内容是为最大化广告收入(或其他形式的收入)而生成,而非最大化真相和实用性。这种情况自互联网商业化以来就一直存在。谷歌在很大程度上就是为了解决这个问题而创建的,但这始终是一场持续的斗争。
问题不在于人工智能,而在于认为广告和公关市场是组织信息的有用工具,而非像维基百科或StackOverflow那样的模糊无政府主义自组织集体。
我完全不相信人工智能不会遵循这一趋势
我不同意这一点。噪音并不高,而且被大大夸大了。当然,如果你深入研究利基主题,你会遇到这种情况。
是的,像我从事嵌入式开发十多年后剩下的技术问题这类小众话题。大多是“能否找到这种过时线缆格式的PDF文件”之类的问题。过去谷歌能做到,但现在我得到的只是数百个重复结果,只告诉我协议的存在,却没有其他信息。
对我来说最有趣的事情之一是,有大量关于人工智能的证言基本上都是“一旦我帮助人工智能克服了我知道它难以处理的问题,当它遇到我不知道的问题时,哇,它知道和能做的事情真是令人惊叹!”这与其说是盖尔曼遗忘症,不如说是盖尔曼鞭打效应。
如果你是一个主题专家,就像从事这项工作的人应该具备的素质一样,那么你会认识到这个问题。
否则,就用常识、快速谷歌搜索或让另一个大语言模型(LLM)来评估它吧。
> 特别是对于非技术人员而言。
使用大语言模型(LLMs)为其他人撰写报告,而其他人又使用大语言模型(LLMs)阅读这些报告?这可能会缓解一些痛点,但会产生大量无用的噪音。
考虑到他们已经制造了无用的噪音,现在他们可以更快地制造噪音了。
但一旦你走出技术圈和无意义的工作,就会发现有很多高质量的使用,就像有很多低质量的使用一样。我遇到过从律师、医生到建筑师、会计师等各行各业的人,他们都在工作中积极使用某种形式的生成式人工智能。
是的,它会犯错,是的,它会产生幻觉,但它能处理掉很多琐碎的工作,让人们专注于解决实际问题。
> 我遇到过从律师、医生到建筑师、会计师等各行各业的人,他们都在工作中积极使用某种形式的 GenAI。
我迫不及待地想要看到因依赖大语言模型(LLM)而导致的第一个重大医疗错误。
我很好奇为什么在我公司看不到这种情况。人们仍在以同样的速度交付产品,客户提出越来越多的 bug,需要规划规模的问题未被考虑(更多 bug),仍未编写任何测试。我看到的生成的代码就像一次性垃圾,对我们的系统或整个代码库没有任何上下文。
我完全同意将会出现崩盘,这必然会发生。当前的评估和投资基于对社会具有毁灭性影响的假设。但随着每次令人失望的、渐进的而非进化的模型生成,世界意识到这些假设是错误的可能性就会增加。
我该如何处理我的ETF?现在卖出,还是等待不可避免的崩盘?采取现代长期投资风格:“只要投资你未来10年不需要的钱就行,兄弟”?
这真的让我夜不能寐。
如果你确信将会发生重大崩盘,我建议将资金转移到黄金、债券或其他更安全的资产中。崩盘后可以再次投资。
我不知道为什么布法罗野牛队(Buffalo Bills)在过去几年里出售了大量股份,坐拥巨额现金,但我可以猜到原因。
就业市场一片惨淡,人们没有钱购买商品,信用卡债务激增。当人们无法购买商品时,这对经济不利。即使人工智能是革命性的,我们也需要人们花钱来维持经济运行,而随着更多人工智能取代工作岗位,这种情况就不会发生。
如果人工智能无法实现,市场将会崩溃,而那些维持市场增长的公司将抹去所有增长。
无论我如何看待,我都看不到一个繁荣的市场。
上周我测试了ChatGPT的代理模式,让它为我规划一周的餐食,并把所有食材添加到在线购物车中。它几乎完美地完成了任务,唯一的问题是它在添加最后几样食材前就耗尽了时间,这似乎并不是一个无法解决的问题。
1999年的互联网速度和安全性都不足以支持商业、银行业务或企业运营。
确实,这需要一个演变过程,但并没有断裂。在某个时刻,事情发展到足以让像蒂姆·奥莱利这样的人说我们现在有了“Web 2.0”,但这只是像我们这样的人在这里逐步改进,使事情变得更好、更可靠的小步骤。
“预测未来很难,尤其是关于未来的事情”——约吉·贝拉(?)
但让我们假设我们能做到这一点。
如果我们正处于1999年的时刻,那么我们可能正处于类似Gartner技术成熟度曲线的阶段。我假设我们正处于第一个高峰。
这意味着“幻灭的低谷”将随之而来。
这是炒作周期中的一个阶段,在最初的过度期望峰值之后,随着技术未能兑现早期承诺,人们对它的兴趣逐渐减弱。
我也经历过互联网泡沫,人工智能在许多方面感觉_一模一样_。
人工智能是真实的,就像互联网是真实的一样,但当前的环境非常泡沫化,很可能崩盘。
确实感觉一模一样。当时有许多公司根本没有盈利的希望(甚至与早期互联网无关),但只要在公司名称中加上.com,就会突然涌入大量炒作和资金。
现在人工智能也是如此。资本终将枯竭,目前没有一家公司盈利,而且是否能在消费者愿意或能够支付的价格下实现盈利也值得怀疑。
模型将变得像商品一样普遍,仅仅是“人工智能公司”并不能形成护城河,但所有大公司都在被投资,仿佛它们将垄断整个市场,或者甚至市场是否存在都成问题。
投资者最终会感到焦虑,并开始期待回报,就像.com时代一样。一旦所有人都意识到通用人工智能(AGI)不会实现,并且意识到运营一个每月收费$200的聊天机器人无法达到预期回报,游戏就结束了。
我亲身经历过互联网泡沫,两者有太多相似之处。大量资金正在追逐一个短期内无法实现的梦想。
最近的似曾相识的现象包括这样的文章:
“20多岁的人正涌向旧金山的人工智能热潮”和
“旧金山到处都是科技广告牌。你能破解它们吗?”
如果我记得没错,2000年泡沫破裂后,人们纷纷逃离硅谷,将租来的宝马车遗弃在旧金山国际机场。101号公路上没有交通拥堵。我不知道这次是否会重演。
近三年前,我在工作单位的员工+小组发表演讲,告诉他们人工智能让人联想到1995年的互联网时代。这种感觉至今未变,我认为我们现在正处于90年代末的阶段。然而,我们需要谨慎对待,因为尽管这种变革在世界格局上与过去相似,但在许多层面却截然不同。首先,当今世界比90年代更加科技化。此外,如今活着并做出决策的人,几乎都在90年代活着并做出决策。这就是为什么我们看到这种疯狂的“全押”心态——几乎可以肯定会出现新的谷歌/脸书/苹果/亚马逊,或者至少这是资本所相信的。
我讨厌、讨厌、讨厌Gartner的“技术成熟度曲线”理论,这不过是句愚蠢的陈词滥调,认为事物会被过度炒作。相反,我将其视为一场“寒武纪大爆发”——全球各地的人们都在试图为这项新技术寻找应用场景。其中绝大多数将失败,但许多会成功,几年后我们将迎来一个截然不同的世界。其中将伴随崩盘与热潮,但(希望)总体上会带来积极变革。
也可能像《终结者》《使女的故事》或《1984》那样。90年代与现在的主要区别在于,世界对技术的负面影响有了更深入的了解,因此不再有90年代那种对技术的狂热追捧,这让我感到沮丧。
这意味着你应该继续持有投资,并做好退出市场的准备。
参见“人工智能数据中心的支出如此庞大,以至于其占GDP增长的比重超过了零售业——这可能导致美国经济崩溃”[1] 美国正经历一场人工智能热潮,而其他经济领域则陷入衰退。
历史上,经典案例是19世纪中叶的铁路热潮[2]。这一热潮始于1830年的利物浦与曼彻斯特铁路[3]。此时工业革命已进入成熟阶段。此前虽有铁路,但利物浦与曼彻斯特铁路凭借双轨、车站、信号系统、车票、时刻表及性能良好的蒸汽机车,真正实现了商业化运营,且盈利可观。随后,许多其他公司开始建造和过度建造铁路,成功程度各不相同。参见1847年恐慌。
当时建造优质铁路还为时过早。钢铁的批量生产尚未实现。早期铁路主要由木材和铁制成,质量并不高。到了1880年至1900年间,所有铁路都被改造成钢制结构,变得更大、更好、更安全。
考虑早期互联网。20世纪80年代初,TCP/IP已在美国各地运行,但商业上并未引起太大关注,直到10到15年后才开始普及,直到21世纪初才真正普及,而直到2010年左右才摆脱泡沫模式。
[1] https://fortune.com/2025/08/06/data-center-artificial-intell…
[2] https://en.wikipedia.org/wiki/Railway_Mania
[3] https://youtu.be/pDEnsraYx3k?t=505
真正令人担忧的是,人工智能热潮中的所有价值都建立在这样一种信念上:这项技术处于“早期阶段”,并且会随着时间的推移而改进。然而,我们看到的恰恰相反。相反,所有竞争模型基本上都趋向于相同的基准性能数字,正如我们昨天看到的 gpt-5 惨败一样。这表明性能实际上已经达到顶峰,如果大语言模型(LLMs) 的进步与他们的训练数据成比例,那么这从直觉上来说是合理的。他们已经用尽了所有的数据。因此,我们现在看到的很可能基本上就是最好的结果,或者至少是接近最好的结果。市场还没有准备好接受这一点。
> 我们看到的是相反的情况。相反,所有竞争模型基本上都趋同于相同的基准性能数字…
这个问题非常重要。对此有什么看法吗?也许大语言模型(LLMs)正在渐近地接近该技术的某些基本极限。
多年来,大语言模型(LLM)内部的情况并没有发生太大变化。更多数据和计算被投入到那个让一切运转的小内核中。核心算法周围增加了额外的噱头。但底层并没有太多进展。无法进入网络并提取可靠的“不知道”。这种架构的能力是否有上限?通过这条途径可能无法实现 AGI。
或许有人能找到突破这一极限的方法。该领域拥有过多的资金、过高的关注度和过多的人力。技术本身是有效的,尽管存在局限性。
资金并不能(必然)带来突破。这可能需要10年、100年甚至1000年,我们无法预知。此类技术风险通常并不那么突出。它通常更为分散,存在备用方案、退出机制,以及虽不理想但可行的替代方案。此次技术风险似乎正以极为庞大的规模迫近。
我认为人工智能对与劳动力和消费相关的经济领域影响不大。目前被人工智能取代的人员,很可能被重新雇佣来修复人工智能造成的错误。
但如果,或者当人工智能稍有进步时,我们将会看到更明显的影响。具备能力的AI将加速利润不再流向劳动力或社会保障的速度,而这次它们将有正当理由:"你们根本没有使用人类来铺设我自动驾驶卡车使用的道路。为什么我要为人类的医疗费用买单,更不用说为他们烦人的肉体福祉负责?你想关闭我们的数字CEO?你首先需要突破我们的数字律师防线和依赖ChatGPT的收买政客。”
好吧,如果你不使用人类,那么你就是在使用机器劳动力,这将在竞争环境中将价格压低至成本价,最终剥夺利润。利润来自于压低劳动力成本。
>没有人能肯定地说,人工智能的繁荣是下一场工业革命的证据,还是下一个大泡沫。
就像互联网繁荣一样,它两者都是。互联网时代的美好预测最终成真了。但它们没有成真得足够快,以避免互联网泡沫的破裂。人工智能也将如此。
我怀疑那里确实存在,但与预测不符。人工智能末日文章与领先模型性能增长放缓且仍然容易出错之间的紧张关系印证了这一点。更不用说大语言模型(LLM)明显达到的收敛极限了。这是模型似乎注定要无限接近但永远无法突破的界限。
在此情境下,“崩盘”将冲击实验室及其企业客户的估值(市盈率),以及依赖模型实现指数级成本/性能增长曲线的AI企业。此次调整将淘汰那些资本不足或业务范围狭窄的“劣质企业”,仅留下具备可持续商业模式和定价策略的优质企业。
这是我截至目前个人的预测。
>“Stripe平台上排名前100的人工智能公司,其年化收入在 median 11.5个月内达到$100万——比增长最快的SaaS公司提前了四个月。”
这张图表极其稀疏且令人困惑。为何不直接绘制两个行业中随机抽取的企业样本?
我很好奇在固定时间段后,SaaS和AI企业的年化收入分布形状。这样我就能判断是否合理地筛选前100名。也许AI在低年化收入值时衰减率较快,但在高值时衰减率较慢,与SaaS相比。考虑到AI的边际成本更高,因此进入门槛更大,这在我看来是合理的。如果情况确实如此,这张图表就是在挑三拣四。
我看到硬件和AI公司的收入在增长。
如果AI实现了其生产力承诺,客户的收入难道不应该也随之增长吗?
看来在这场淘金热中唯一发家致富的是卖铲子的人。一切照旧。
如果是自动化,也可能降低客户的成本。但这是一个非常复杂的问题。可能是人工智能领域缺乏足够的竞争,因此客户只能获得边际收益,而人工智能公司获得最大收益。也可能是客户的收入/利润会被延迟,因为实施需要时间,而且可能需要前期投资。
> 如果人工智能实现了其生产力承诺,客户的收入难道不应该增加吗?
不一定,参见杰文斯悖论。
将杰文斯悖论应用于此情景,收入仍应增加,前提是员工劳动的优化为公司创造了价值。(他们会增加更多)
杰文斯悖论涉及资源消耗和成本的增加,但产出和因此收入也应随之增长。
也许不是利润,但至少是收入。
最大的问题是企业中层管理人员无法真正利用生成式人工智能。
那食品和住房呢?为什么美国不能投资于食品和住房呢?
美国已经花了一个世纪的时间投资于食品。我们投资于食品如此之多,以至于现在不得不付钱给农民让他们不要种植东西,因为否则价格崩盘会引起问题。美国的食品非常便宜。
提醒自己每个美国孩子都必须证明自己的存在价值,否则就会饿死,这让人感到安心。
好吧,这太过分了。这完全不是事实。
美国的孩子不会饿死。无论是经济原因还是其他原因,都没有饥荒。
这是美国。我们会_乐意_让你的孩子从幼年开始就背负任意数额的债务,以便在学校用餐。
美国目前确实存在某种饥荒,4000万人正面临食物短缺问题。此外,健康食品的可负担性危机也存在,人们实际上摄入的热量是每日所需的两倍,而营养摄入量仅为每日所需的一半。今年已做出的多项政治决策将导致各种形式的作物损失(移民因害怕而不敢上班)和疾病爆发(RFK Jr.的生牛奶事件)。这些结果很可能影响食品价格。受此影响最严重的人群,早已因租金上涨而遭受贪婪通胀的重创。
词语有其特定含义,滥用词语会贬低其价值。
要么美国没有饥荒,要么我昨天在美国经历了饥荒,因为我们太忙了,晚餐吃得很晚,我饿了。
我同意你说的每一句话,除了使用“饥荒”这个词。
天啊……
这是什么意思,你想改变什么?
讽刺的是,目前这在HN上排名第二:https://news.ycombinator.com/item?id=44836219(“食品、住房和医疗保健成本是许多人面临的主要压力来源”)
公平地说,我接受纠正。
> 美国的食物非常便宜。
而这完全是另一个问题。便宜 ≠ 物美价廉。
“便宜”和“经济实惠”是否同义,取决于上下文。在某些用法中,它们存在微妙差异,而在其他情况下则完全相同。
在我使用该词的语境中,它们是同义的。
美国通过多种方式系统性地对新建住房征税并加以限制,这符合当地选民的意愿。退让要求、10万美元以上的接入成本、楼梯标准、密度限制、停车位最低要求及相关规定、社区意见征集、允许在符合所有规定的情况下拒绝新建住房、滥用环境法规(最终因阻碍密度而损害环境)、可负担住房要求(对每个新建住房区块征收税收以资助可负担住房单元)等措施,均阻碍了新建住房的建设。
因为投资住房意味着真正改变现状。有一种“不要只是做点什么,就站在那里!”的策略,旨在最大化舒适度并最小化努力,这种策略必须被克服。
拥有食物和住房会让人口过于舒适。他们希望每个人都保持一点紧张感。你不工作,你就吃不上饭。
美国有人饿肚子吗?为什么需要关注食品生产?我们有大量食品储备。
让他们吃蛋糕,对吧?
https://www.ers.usda.gov/topics/food-nutrition-assistance/fo…
或者让他们拒绝学习如何做蛋糕,对吧?
我发现这篇分析很有见地:
https://x.com/dampedspring/status/1953070287093731685
> 然而,这种增长速度很可能难以持续。资本支出的急剧增长可能已经过去,而近期增长率可能无法维持。最终需求持续疲软几乎肯定会影响未来投资,因为人工智能需求最终取决于企业收入和利润,而这些又与名义GDP挂钩。已实现和预期的资本支出仍处于高位,而超大规模企业的自由现金流和现金及现金等价物正在下降。
教师图表的结论与我的看法大相径庭。作者持乐观态度,因为约55%的教师使用AI辅助备课。然而,从图表来看,我对AI的采用持非常悲观的态度。大多数图表显示,绝大多数教师并未使用AI。这让我看到现实世界使用情况与投资金额之间存在巨大差距。
人工智能并未征服美国经济。征服美国经济的是少数几家大型企业。如果苹果公司推出一款名为iTurd的应用程序,谷歌开始提供gTurd服务,亚马逊开始向每个人家门口免费配送粪便,等等,那么我们就会讨论粪便如何征服了美国经济。经济已经与满足实际消费者需求脱节。供应商正在创造自己的需求。
记住,在大众媒体中解析“经济”一词的适当方式是将其解读为“富人的游艇资金”。
相关:
人工智能正在支撑美国经济
https://news.ycombinator.com/item?id=44802916
我注意到那篇文章只关注股权估值,而非实际经济产出和工人生产力。
我担心这将以糟糕的方式结束。
如果GPT5在某个新编造的任务上未能通过基准测试,今天可能就会崩盘。
我不明白为什么会“全部崩盘”——就像互联网泡沫一样,即使巨额估值消失,我认为这项技术已经对经济产生了巨大影响,并且将继续扩大其影响,即使我们永远无法实现AGI。
与互联网泡沫完全相同。我自2014年起从事深度学习研究,对该技术持乐观态度,但若GPT-5未能达到sama过去几年描绘的指数级增长曲线,下一轮规模化所需的数万亿美元资金将无法到位。
就像互联网泡沫一样,我们需要先淘汰大量以$1价格出售$0.50的“独角兽”公司,才能看到长期收益。
> 就像互联网泡沫一样。
那么,这只是投资者损失了一点资金而已吗?因为互联网在2000年后显然并没有衰退,甚至那些损失惨重但仍留在市场中的投资者,很可能也相对较快地收回了资金。在我看来,互联网泡沫破裂的教训是,我们应该继续留在市场中。
至于GPT-5是否处于指数增长曲线上——根据METR的数据,它远超该曲线: https://metr.org/blog/2025-03-19-measuring-ai-ability-to-com…
当曲线远在误差范围内时,我不会说“远高于”。如果他们报告的是中位数而不是平均值作为点估计值,我不知道图表会有什么不同。
我不认为 GPT-5 会有什么特别之处,似乎 OpenAI 未能保持领先地位,但即使是大语言模型(LLMs)的当前水平,在我看来也足以证明其市场估值是合理的。当然,我可能会食言说OpenAI落后了,但我们拭目以待。
> 我不认为GPT-5会有什么特别之处
为什么?
因为GPT 3.5之后的所有版本都相当平庸?恐怕世界上没有人能在盲测中分辨出4.0、4.0、4.5和4.1之间的差异。
我绝对愿意和你进行一次4.0和4.5的盲测——改进是显著的。
虽然我确实想赚你的钱,但我们可以看看LMArena,它通过盲测得出基于ELO的评分,显示4.0的评分为1318,而4.5为1438——在任意提示下,4.5被评为更好的可能性超过两倍,而在编码和推理任务中,差异更为显著。
> 世界上恐怕没人能在盲测中分辨出4.0、4.0、4.5和4.1的差异。
但这不是4.6,而是5。
我能分辨出3和4的差异。
这就像《摇滚万万岁》里的论调,认为这将不仅仅是 incremental improvement。
据说本周发布的开源模型经过了 Meta 风格的基准测试,但其实际性能令人极其失望。
每当我使用“A.I.”时,我被迫使用“A.I.”,而我被迫使用它来处理的事情,由于“A.I.”的存在,反而变得更糟。
对于那些将“A.I.”泡沫与.com泡沫相提并论的人,他们忽略了这样一个事实:即使像我这样的大多数普通用户,使用14.4 kbps调制解调器登录时,也能立即获得一些新颖且有用的东西。而对于“A.I.”,我至少对自己而言,尚未发现任何有用的东西。
> METR还进行了一项深入研究,要求有经验的开发者使用一款流行的AI助手进行编码。完成任务后,开发者声称使用AI使他们的生产力提高了20%。但研究中的独立评估人员实际上得出结论:使用AI恰恰相反,它使任务完成时间增加了约20%。
这在某种程度上反映了我的经历……我完全可以理解在某些情况下,这种来回沟通的过程会耗费更多时间。
但我认为这里释放的不仅仅是效率。虽然开发者可能在更短时间内完成了粗略的最小可行产品(MVP),但在此过程中,他们通常会持续更新README、测试和其他基础设施。
有人可能会争论这是否是自掘坟墓——依赖于那些实际上并未真正测试应测试内容的测试,从而让关键漏洞在后期漏网。
> “他们正在产生前所未有的自由现金流,”Cembalest告诉我。“他们赚取了巨额利润,这就是为什么他们能够每年投入数百亿美元的资本支出用于人工智能相关研发和基础设施建设。”
我认为这应成为投资者警觉的信号:他们并未获得应得的利润,而是这些利润正被投入CEO的下一个重大赌注,以推动其股票期权收益。政府在此也难辞其咎,既提供了税收优惠,又缺乏规定利润必须以股息形式返还的法律(如果愿意,利润可以以新股形式回购,说这对投资者更好是荒谬的,因为替代方案实际上提供了更多选择)。
我所在的互联网圈子里常听到一个观点:人工智能是少数几个尚未被监管、以能力为导向的领域之一。聪明的人已被挤出实体经济,因此我们聚集在这里。
EXIT博客经常讨论这个话题。例如在这篇文章中,《庇护城市是特殊经济区——但不是为你准备的》:https://blog.exitgroup.us/p/sanctuary-cities-are-special-eco…
如果有人知道类似的有趣文章,请推荐给我
> 没有人能肯定地说,人工智能的兴起是下一场工业革命的证据,还是下一个重大泡沫。我们唯一知道的是,它正在发生。
事后看来,一切都会明朗,而未来的世代(如果还存在的话)会问:“为什么你们当时没有明白正在发生什么?”
我的回答:噪音。仅仅因为你能找到当时写下答案的人,并不意味着他们真的理解了答案,至少不像我们事后回望时那样理解。
未来的历史是偶然的。
这与科技就业市场相符:如果你不在顶尖企业或实验室工作,你的努力很可能在补贴OpenAI员工的$150万年薪。
> 人工智能有几个简单的组成部分:计算机芯片、数据中心中的服务器机架、大量电力,以及保持一切正常运行而不过热的网络和冷却系统。
那软件呢?数据呢?模型呢?
> 数据呢?
什么,你希望他们为消耗和重复使用的所有受版权保护的数据买单?他们负担不起!
对于一些小型人工智能初创公司来说,人工智能的账单每天高达数千美元,而对于大型公司来说,每天则在1万到10万美元之间。
因此,许多人认为OpenAI没有护城河——这是错误的。
护城河是抵御竞争的屏障。你所描述的并非护城河。
你所指的护城河是什么?(可负担性?)
科技行业在人工智能领域的大规模支出,难道不是预示着另一场泡沫即将破裂的可能信号吗?
我们之前已经见过这种情况,一而再,再而三。
用美元来衡量这些事情让我感到不舒服。使用通胀调整后的美元是常见做法,还是人们只是比较名义值?
请停止使用堆叠条形图,单独的线条(加上总计)会让读者更容易理解数据。
乍一看,这简直是哈布斯堡式的。
我看到的只有B-U-B-B-L-E
> 因为寡头们要求这样做
就这样,我为你总结了。
不明白为什么你被点赞了。这是事实,而且实际上回答了文章标题提出的问题,而文章本身甚至没有探讨这个问题,更不用说回答了。
他们提到了采用率,与互联网相比。考虑一下进入的障碍。在我们都厌倦了收到AOL光盘之前,“上网”的前景是极其昂贵且有时繁琐的。
更多人订阅/使用$20/月的服务,而不是拥有/管理最先进的机器?!别这样 /s
> 更多人订阅/使用$20/月的服务,而不是拥有/管理最先进的机器?!别这样 /s
问题是,$20/月的服务在没有更好硬件或更优化模型的情况下无法盈利。即使是$200/月的计划也无法为OpenAI带来利润。这些公司仍处于“以亏损价格销售以抢占市场份额”的阶段。
我们甚至不知道“人工智能公司”这种模式是否可行——仅仅开发模型并出售访问权限。模型终将变成商品,若硬件成本下降,开源模型将占据优势。
当OpenAI、Anthropic等公司无法在不收取消费者无法承担的费用情况下盈利时,会发生什么?
流行 🙂 至少对某些人来说是这样。大亨们往往会留下残余
十亿美元的Clippy。
万亿,对吧?