AI 正在扼杀互联网,还有救吗?
ChatGPT及其竞争对手的崛起正在动摇互联网的经济基础
去年年初,马修·普林斯开始接到大型媒体公司高管的担忧电话。他们告诉普林斯,其公司Cloudflare为约五分之一的互联网提供安全基础设施,称他们正面临一个严重的全新在线威胁。“我问,‘什么,是朝鲜人吗?’”他回忆道,“他们说,‘不,是人工智能。’”
这些高管已经察觉到一个趋势的早期迹象,而这一趋势如今已变得清晰:人工智能正在改变人们浏览互联网的方式。当用户向聊天机器人而非传统搜索引擎提出问题时,他们会得到答案,而非需要点击的链接。结果是,从新闻提供商、在线论坛到维基百科等参考网站的“内容”发布者,都面临着流量急剧下降的困境。
随着人工智能改变人们的浏览方式,它正在改变互联网核心的经济模式。人类流量长期以来通过在线广告实现变现;如今,这种流量正在枯竭。内容生产者正紧急寻求新方式,迫使人工智能公司为信息付费。若无法实现,开放网络可能演变为截然不同的形态。

自2022年底ChatGPT推出以来,人们已接受了一种全新的在线信息获取方式。该聊天机器人的开发商OpenAI表示,约8亿人使用该服务。ChatGPT是iPhone应用商店中最受欢迎的下载应用。苹果公司表示,4月份其Safari网络浏览器中的传统搜索量首次出现下降,因为人们开始向人工智能提出问题。OpenAI预计很快将推出自己的浏览器。
随着OpenAI和其他初创公司迅速崛起,谷歌——在美国传统搜索市场中占据约90%份额的公司——已在其搜索引擎中添加了人工智能功能,以保持竞争力。去年,谷歌开始在部分搜索结果前添加由人工智能生成的“概述”,此类功能如今已普遍应用。今年5月,谷歌推出了“人工智能模式”,即其搜索引擎的聊天机器人版本。该公司现在承诺,借助人工智能,用户可以“让谷歌为你完成搜索”。
然而,当谷歌完成搜索时,人类不再访问那些提供信息的网页。Similarweb(一家监测超过1亿个网站域名的流量数据公司)估计,截至6月的过去一年中,全球搜索流量(由人类产生)下降了约15%。尽管某些类别(如爱好者网站)表现良好,但其他类别却遭受重创(见图表)。受影响最严重的恰恰是那些曾常见于搜索结果的网站。科学和教育网站的访问量下降了10%。参考类网站流失了15%的访问量。健康类网站流失了31%的访问量。
对于依赖广告或订阅收入的公司而言,访问量流失意味着收入减少。“我们与谷歌长期保持着良好的合作关系……他们打破了协议,”Dotdash Meredith公司负责人尼尔·沃格尔(Neil Vogel)表示。该集团旗下拥有《人物》(People)和《食品与葡萄酒》(Food & Wine)等刊物。三年前,其网站超过60%的流量来自谷歌。如今这一比例已降至30%左右。“他们正在窃取我们的内容与我们竞争,”沃格尔先生表示。谷歌坚称其使用他人内容的行为是公平的。但自推出AI摘要功能以来,与新闻相关的搜索中未产生后续点击的比例已从56%升至69%,Similarweb估计。
“互联网的本质已经完全改变,”Stack Overflow首席执行官普拉沙ント·钱德拉塞卡尔表示,该平台以在线编程论坛闻名。“AI基本上正在切断大多数内容网站的流量,”他说。随着访问量减少,Stack Overflow的论坛上发布的提问数量也在减少。同样由志愿者驱动的维基百科警告称,未注明出处的AI生成的摘要“阻碍了人们访问……并为该网站做贡献的途径”。
为了维持流量和收入,许多大型内容生产商已与人工智能公司达成授权协议,并以法律威胁作为后盾:新闻集团(News Corp)首席执行官罗伯特·汤姆森(Robert Thomson)将其称为“拉拢与起诉”。该集团旗下拥有《华尔街日报》(Wall Street Journal)和《纽约邮报》(New York Post)等媒体,已与OpenAI达成协议。其两家子公司正在起诉另一家AI问答引擎Perplexity。《纽约时报》已与亚马逊达成协议,同时起诉OpenAI。还有大量其他交易和诉讼正在进行。(经济学人集团尚未授权我们的作品用于训练模型,但已同意让谷歌使用部分文章为其AI服务提供支持。)
然而,这种方法存在局限性。首先,法官似乎倾向于支持人工智能公司:上个月,加利福尼亚州两起独立的版权案件 均裁定被告方胜诉,这两家企业——Meta 和 Anthropic——均主张其利用他人内容训练模型属于合理使用。唐纳德·特朗普似乎认同硅谷的观点,即必须允许其在未来技术研发上领先于中国。他解雇了美国版权局局长,因其主张利用受版权保护的材料训练人工智能并不总是合法。
人工智能公司更愿意为持续获取信息而非训练数据付费。但迄今为止达成的协议远非理想。在线论坛Reddit已将其内容授权给谷歌,据报每年支付$6000万美元。然而,由于搜索流量波动导致用户增长低于预期,其市值在2月报告后下跌超过一半。(此后增长有所回升,股价也收复部分失地。)
陷入困境
更大的问题是,互联网上的数亿个域名中,绝大多数规模太小,无法吸引或起诉科技巨头。它们的内容对人工智能公司而言可能具有集体重要性,但每个网站单独来看都可有可无。即使它们能联合起来进行集体谈判,反垄断法也会禁止此类行为。它们可以阻止人工智能爬虫,有些确实这样做了。但这意味着完全失去搜索可见性。
软件提供商或许能提供帮助。Cloudflare的所有新客户现在将被问及是否允许人工智能公司的机器人抓取其网站,以及抓取的目的是什么。Cloudflare的规模使其比大多数公司更有可能实现内容网站的集体响应,迫使人工智能公司支付费用。它正在测试一种按需付费的系统,允许网站向机器人收取入场费。“我们必须制定游戏规则,”普林斯先生表示,他理想的结局是“人类免费获取内容,而机器人则为此支付巨额费用”。
Tollbit提供了一种替代方案,该平台自称是针对机器人的付费墙。它允许内容网站对人工智能爬虫收取不同费率:例如,杂志可以对新文章收取比旧文章更高的费用。今年第一季度,Tollbit处理了1500万笔此类微交易,涉及2000家内容生产商,包括美联社和《新闻周刊》。该公司首席执行官托希特·帕尼格拉希指出,传统搜索引擎鼓励同质化内容——例如“超级碗几点开始?”——而收取访问费则鼓励内容独特性。Tollbit的每爬取率最高收费来自一家地方报纸。
另一种模式由ProRata提出,该初创公司由比尔·格罗斯(Bill Gross)领导,他是20世纪90年代“按点击付费”在线广告的先驱,这种广告模式自此一直支撑着互联网的发展。他提议,与AI生成的答案并列的广告收入应按内容对答案的贡献程度,按比例重新分配给相关网站。ProRata拥有自己的答案引擎Gist.ai,该引擎与包括《金融时报》和《大西洋月刊》在内的500多家合作伙伴共享广告收入。目前,它更多是一个典范而非对谷歌的严重威胁:格罗斯先生表示,他的主要目标是“展示一个公平的商业模式,让其他人最终效仿”。
内容生产商也在重新思考他们的商业模式。“互联网的未来不仅仅是流量,”查德拉塞卡尔先生说,他建立了面向企业的订阅产品Stack Internal。新闻出版商正在为“谷歌零”做准备,通过电子邮件简讯和应用程序触达不再通过搜索引擎访问他们的用户,并将内容转移到付费墙后或线下活动。Dotdash Meredith表示,尽管来自谷歌的流量有所下降,但其整体流量仍在增长。音频和视频内容在法律和技术层面也比文本更难被人工智能引擎摘要。根据Similarweb的数据,搜索引擎将搜索流量最常引导至的网站是YouTube。
并非所有人都认为网络正在衰落——相反,谷歌的罗比·斯坦(Robby Stein)认为,网络正处于“一个前所未有的扩张阶段”。随着人工智能使内容创作变得更加容易,网站数量正在增长:谷歌的爬虫报告显示,过去两年间互联网规模扩大了45%。人工智能搜索让人们能够以新的方式提出问题——例如,拍摄书架照片并询问接下来该读什么书——这可能增加流量。借助人工智能查询,越来越多的网站正在被“阅读”,即使不是通过人类的眼睛。一个答案引擎可能扫描数百个页面以提供答案,其参考的来源比人类读者更广泛。
至于谷歌传播的人类流量减少的说法,斯坦表示该公司并未注意到外链点击量的剧烈下降,尽管其拒绝公开具体数据。人们访问网站减少的原因可能还有其他因素。也许他们在浏览社交媒体。也许他们在听播客。
网络的消亡曾被多次预测——先是社交网络,然后是应用程序——但并未成真。但人工智能可能对网络构成迄今为止最大的威胁。如果网络要继续以接近当前的形式存在,网站必须找到新的盈利方式。“毫无疑问,人们更倾向于使用人工智能搜索,”格罗斯先生表示,“为了让互联网生存下去,让民主制度生存下去,让内容创作者生存下去,人工智能搜索必须与创作者分享收益。”
本文文字及图片出自 AI is killing the web. Can anything save it?
> 随着访问者减少,Stack Overflow 上的问题数量也在减少
当你运营一个对已解答问题、研究不足的问题或作业题持敌视态度的社区时,不要惊讶于人们开始将这些问题转移到其他地方,也不要惊讶于他们开始将他们的好问题也转移到其他地方。
如果那些一直以来在 StackOverflow 上提出好问题的人突然去其他地方提问,我肯定会感到惊讶,因为一个问题对 StackOverflow 来说好的部分原因在于它无法在其他地方轻易得到回答。例如,MathOverflow 是一个供数学家讨论他们研究的论坛,他们不太可能会在短期内使用大语言模型(LLMs)。
因此,提问人数减少并不意味着社区正在衰落,这很可能是他们终于成功阻止他人进入的标志。
这对靠社区牟利的公司来说可能是个坏消息。
在因几个未在Stack Overflow上得到解答的问题遭到欺凌后,我完全停止了参与StackExchange。
本应激励人们贡献的积分系统反而成了门槛。积分较低意味着你不会被认真对待,或被视为刚放下奶嘴、30分钟前才开始用电脑的新手。
因此,我回归到自己最擅长的事:翻阅文档并做笔记。他们可以为维护网络的纯洁性和精神而自豪。
> MathOverflow 是数学家交流的论坛…
当 StackOverflow 刚成立时,我经常访问,享受社区讨论编程的乐趣。对其他人来说,目标一直是打造终极维基。
那些想要终极维基的人赢了,社区离开了,这就是我们今天看到的 SO。没有社区,但它是充满 2014 年编程智慧的终极维基。
讽刺的是,他们坚持对问题和答案格式进行非常狭窄的定义,因此未能创建一个好的维基。无法探讨更广泛的主题。问题总是“如何做 x”,而自 2013 年以来被接受的答案是一个 jQuery 插件,该插件自 2015 年以来就缺乏维护者。
我甚至不认为这与提出好问题有关,至少在过去许多年里不是这样。我经常使用SO,即使我没有提问,仅仅找到一个简洁且正确的答案也非常困难,而不是从那些想要炫耀知识的人那里获得评论,或者其他人从与原始问题无关的视角回答。提出好问题当然很重要,但如果社区不知道如何提供好答案,寻求者就会去其他地方寻找。
附带一提,这里有一本关于如何提出好问题的优秀HTML书籍,因为即使我们使用生成式人工智能作为起点,我们仍然必须面对这个问题;http://catb.org/~esr/faqs/smart-questions.html
>提问的人变少并不意味着社区正在衰亡,
如果你不成长,你就正在衰亡。企业完全扭曲了这句话,但其核心逻辑仍然成立。人们会离开、改变兴趣,或 simply 死亡。没有新成员加入,就无法维持一个健康的长期社区。
看到StackOverflow的文化,我宁愿死在地下也不愿在那里提问,即使是其他地方难以回答的问题。由志愿者运营的网站需要热情的贡献者来完成网站的实际工作,以及管理员来防止混乱,但热情会减退,而对秩序的渴望永不消退,因此最终管理员会接管。
MathOverflow的文化要好得多,所以我会在那里提问(并回答问题)。我不太确定为什么那里运作得更好,不过我猜这与用户群体有关。
Stack Overflow将失败归咎于AI,但它本身已经是一团糟长达十年。
它基本上一直无法用于任何嵌入式相关的问题,因为每个问题都会被关闭并标记为某个桌面/网页/移动端问题的重复,而那些问题拥有10万倍的内存。
没错,在不被某个刻薄的老程序员指责的情况下提出编程问题,是AI聊天机器人的一大卖点,尽管我对整体趋势有所保留。
当然,但只有大语言模型(LLM)经过这些答案的训练,这才有可能实现。
没错,但大语言模型(LLM)总是彬彬有礼,处于问题解决模式,而 SO 则处于策划模式。这使其成为一个很好的知识库和大语言模型(LLM)训练集,但并不是一个很好的问题解答来源。
我认为人们更倾向于在在线论坛上提问而非使用搜索功能,很大程度上是因为人性化的互动,但这种互动需要双方参与,包括一位耐心且乐于助人的导师——而遗憾的是,这样的导师并不容易找到。大型语言模型(LLM)既耐心又乐于助人,且具备解决问题的能力,同时还能几乎即时响应。
是的,乐于助人的大语言模型(LLM)总能回答你的问题——如果找不到答案,它会凭空编一个出来。
当然,SO 也是如此。对于大多数问题,似乎至少有三分之一的答案或多或少都有错误。至少使用大语言模型(LLM),你可以直接指出答案是错误的,并在 30 秒后得到一个新的、希望更好的答案,而不会伤害它的感情或引发大规模的网络争吵。
至少它不会像 SO 那样告诉你闭嘴、变得更好,然后关闭聊天。
它是从 SO 启动的。现在,有 Scale AI 等第三方数据公司支付零工写代码示例,用于大语言模型(LLM)的培训。现在已经平静下来了,但今年年初我看到很多关于这个(即招聘)的垃圾信息。
Sota 大语言模型(LLMs)并不是通过抓取互联网获得的,而是全部来自定制标签的数据集。
我想这意味着AI并未取代我们的工作。模型必须摄入越来越多的实验性数据。循环往复。
不,目前它只需摄入官方库文档就能生成类似SO的优质答案。
此外,它们还从那些无法或不愿选择退出数据使用的用户那里获取真实世界训练数据。
对于我的个人数据,我正因这个原因选择不退出训练。更糟糕的是,我对Stack Overflow和Reddit等平台试图垄断我本想贡献给社区的内容并收取费用感到不满。
我过去曾故意发布问答风格的帖子,即在Reddit和Stack Overflow上同时提问、等待一段时间后再自行回答。我不再这样做,因为如果他们不将部分收益回馈给社区,我就不会给他们免费资金。
不,没有公开可用的模型能做到这一点,你为什么这么认为?
所以你得在SO上问如何将那训练到你自定义的模型中,运行在Ponzimbda的hAIrdware上
我不会为那些因无法对他人友好而失败的人感到遗憾。友好不花钱。而且友好是件好事。
并非如此。
那些愿意回答“愚蠢的问题,请阅读说明书”的人与能够给出有用答案的人之间的重叠非常小。
大语言模型(LLMs) 训练所用的有意义的数据是实际的答案。
当然,但技术去除了烦恼,提供了没有混蛋的内容。
如果有人在我和 Facebook 之间插入了一个大语言模型(LLM),让我能够看到所有 Facebook 内容,而无需看到那些相信地球是平的、否认登月和塔塔尔人的人,那么 Meta 就再也不会看到我了。
这还不够好。人工智能必须向我提供朋友和家人的重要事件更新,而无需向我展示他们去餐厅吃了什么、他们喜欢的有趣的猫视频,或者他们计划看什么电影。
如果你没有直接从他们那里听到,那就不是重要的
> 必须向我提供朋友和家人的重要事件更新,而无需展示一切
这是一个RAG查询
我担心在可预见的未来,编程将停留在 2020 年代的技术水平上。新的框架、库和语言将面临一个先有鸡还是先有蛋的问题:由于大语言模型(LLMs) 不知道如何回答关于它们的问题,因此没有人使用它们;而由于程序员没有为大语言模型(LLMs) 生成新的样本,因此大语言模型(LLMs) 无法学习新知识。
这就是为什么我今年不得不花费大量自由编程时间来记录我的画布库[1][2],以便(可能[3])将其用作大语言模型(LLM)的训练数据,而不是开发具有新功能(对我来说)的库。
从积极的一面来看,这本来就是我应该做的工作。事实证明,以大语言模型(LLMs)能够理解的方式记录库的功能,也有助于库的潜在用户。因此,这是双赢的。
[1] – 向大语言模型(LLM)训练数据的统治者介绍库的功能本身就是一项重大工作:https://github.com/KaliedaRik/Scrawl-canvas/blob/v8/LLM-summ…
[2] – 开发者手册是长期以来缺失的文档,目前仍在持续完善中:https://scrawl-v8.rikweb.org.uk/documentation
[3] – 当然,没有什么是一成不变的。训练数据需要经过精心整理,因此文档也需要具备一定的严谨性。此外,大型语言模型(LLMs)告诉我,此类文档可能需要6到12个月的时间才能被采纳并应用于未来的大型语言模型迭代中,因此我可能要等到2026年年中才能知道我的努力是否成功。
文档专家的崛起。规格、标准、文档和设计文档是必需的,而不仅仅是事后考虑。
你应该看看Elixir在Tidewave和使用规则方面做了什么。
https://www.zachdaniel.dev/p/usage-rules-leveling-the-playin…
我不确定这对前端框架来说是不是件坏事——每隔5到7年就重新发明轮子,我认为这不是件好事。
小型模型不够大,无法通过预训练掌握每个框架或库的知识,但如果你给它们一个手册页/API参考,它们很容易就能弄清楚如何使用新代码。
在 Stack Overflow 上提出的大多数问题都可以通过阅读库和框架的源代码和文档来回答。大语言模型 (LLM) 也可以做到这一点。它不需要 Stack Overflow 来获取知识或内容,而是需要它来提供问题->答案的格式。
作为用户,这并不是我的问题。
ChatGPT 证明人工智能并不是简单地复述它在网上读到的内容,它能够纠正我的编程错误,而不会让我感到难堪。如果它是从 Substack 学习来的,我很高兴它进行了选择性学习!
如果你问我,大语言模型(LLMs) 那种讽刺性的热情和虚假的人性也越来越让人厌烦了。
看看任何试图与美国同事打交道的英国人吧。
你完全正确!(tm)
不同的是,我可以指示大语言模型(LLM)停止这种行为(而且我确实这么做了)。
没错。人类并不擅长接受指示。
在某种程度上来说,这是件好事。有些疯狂的人会分享“解锁/越狱提示”,将大语言模型(LLMs)变成确认任何精神病的分裂症机器。而真人会拒绝并试图为你寻求帮助。
ChatGPT无法区分无害的指令/角色扮演提示,与某人正在发疯的情况。这可能解释了为什么许多最活跃的AI用户似乎脱离现实,因为这是他们第一次遇到一个盲目肯定他们所有想法,并告诉他们自己非常聪明且完全正确的人。
如果你开始发布疯狂的宣言寻求反馈,那些Stack Overflow的家伙会很残酷。
所以,成为亿万富翁的认知现实现在对每个人都开放了吗?
[deleted]
当我回顾科技在我生命中取得的进步时,我已年过半百,我认为奇点在我孩子的一生中并非不可能,甚至在我自己的一生中也可能实现,如果我足够幸运的话。在我出生时,根本没有个人电脑或互联网。
据我所知,唯一缺失的一步是大语言模型(LLMs)能够将测试结果回滚到其训练集中。然后,它就可以开始提出假设并进行测试了。然后,它就可以进行逻辑推理了。
我不理解这种怀疑态度。大语言模型已经比我聪明多了,它们只需要学习能力。
** 维基百科对奇点的定义。“一个可升级的智能代理最终可能进入一个正反馈循环,通过连续的自我改进周期实现智能提升;更智能的世代将以越来越快的速度出现,导致智能的快速增长(‘爆炸’),最终形成一种远超人类智能的强大超级智能。[4]”
>大语言模型(LLMs)已经比我聪明多了
这非常值得怀疑,除非你对智能的定义是要求大量重复信息,而不是理解上下文和利用这些知识。大语言模型(LLMs)的“聪明”就像一个在SAT*考试中取得1600分的人一样“聪明”。如果你把时间花在完成一项特定的任务上,你会变得非常擅长这项任务。这种技能甚至能让你在生活中成为某领域的专家。但这并非我眼中人类“智能”的本质。
*是的,存在相关性。因为那些花时间学习和背诵考试内容的人,通常比不这样做的人拥有更好的学习习惯。但有些学生尽管勤奋学习,却在大学里完全迷失方向,这背后是有原因的。
>我不明白这种怀疑态度。
坦白说,我们正处于一个欺诈行为泛滥、欺诈者肆无忌惮的时代。无论是在科技界还是其他领域。到了2025年,我对那些只谈论“可能发生什么”而非实际可行或可能实现的人,天生就持怀疑态度。
迄今为止,计算一直基于一种完全不同的隐含可靠性模型运行。基础硬件应尽可能可靠,软件应基本正常运行,而错误则被容忍,因为它们难以修复。没有人认为这些错误是好事。
大语言模型(LLMs)更像是一个只显示文本的网络浏览器,但你无法知道它产生的内容是天才之作还是胡言乱语。“如果你愿意去检查错误,那就忽略它们吧”是一个相当不错的营销口号。
科技领域最大的变革在于文化转变——从乌托邦式自由主义的“给每个人一辆心灵的自行车,见证喜悦”到企业现实主义的“尽可能收集个人数据,并利用这些数据来改变行为、信念,尤其是消费和投票行为,以最大化企业利润和极端财富”。
尽管技术在发展,但价值观却朝着相反方向狂奔。
拥有这些价值观的文化是否能够在不自我毁灭的情况下创造奇点,这值得怀疑。
> 大语言模型(LLMs)已经比我聪明多了
你几乎肯定是在低估自己,高估了大语言模型。
Stack Overflow是一个编程问答网站,大多数时候,人们会因为你提出编程问题而生气。
这确实是对Stack Overflow的简单批评,但坦白说,Reddit也一样。与AI聊天比对Reddit上那些愚蠢、可预测的反应性评论生气要有趣得多——而且你并没有触达很多人,你只是被用来训练模型,或是为那些卑鄙的子版块所有者提供广告机会。
试试关注/new在raspberry_pi或类似的板块…
你会明白为什么有人讨厌它,主要是因为人们在发帖前根本不花时间搜索。
而且情况越来越糟糕,新来的人会问:“但 chatgpt 告诉我 X”,“我按照 chatgpt 的指示做了,但不起作用,请帮助修复错误”,或者一些可能会烧毁房子、应该被骂的傻瓜(锂离子电池不是开玩笑,交流电也是如此)。
或者… 大语言模型(LLM) 生成的东西… 这相当于垃圾邮件…
如果有人喜欢做不受重视的技术支持,那随他们去吧,其他人可能会在垃圾信息中寻找有用的内容,我基本上已经不再理会,转而寻找其他东西。(也会对那些可能害死自己的白痴大喊大叫)
如果你屏蔽新手的问题和帖子,整个社区就会变得非常敌对和令人讨厌。
如果你不屏蔽新手,整个社区就会离开,你最终会得到一个类似/r/suggestALaptop的子版块。一个木工子版块每天会有3个“新手最适合的台式锯是什么”和“Dewalt vs Milwakee?”的帖子,任何关心的人都会离开,你只剩下机器人和试图向你推销东西的人。
有趣的是,过去在线社区并不存在这个问题。每个论坛都有“新用户”专区、新手专区,可能还有中级和高级专区。我曾经常在新手和普通区域浏览,只阅读高级区域的内容,直到我足够自信能在那里进行有意义的讨论,或提出足够聪明的问题。
但在Reddit或Stack Overflow这样的平台上,这种模式行不通。这些平台规模过于庞大,无法形成一个凝聚力强、一致的“文化”(暂且用这个词来形容)。你无法将新手从/r/3dprinting分流到/r/4dprintingforbeginners,因为后者根本不存在。而前者的人也不关心后者,因为后者不属于“社区”的一部分。
过去这也曾是个问题,答案通常是“变得更好”或“阅读手册”,伴随着一片笑声。
我过去觉得这很刻薄,现在却认为这是必要的,但现在没人这么做了(可能是因为缺乏匿名性)。
如果有人连基本研究都做不好,那责任在他自己。他们缺乏基本的毅力或其他应该掌握的技能。
此外,有人提出同样的基本问题,而这些问题在谷歌上搜索就能找到之前的讨论,这是一种特殊的愚蠢或寻求关注的行为。
> 你会明白为什么会有人讨厌,主要是因为有些人懒得在发帖前花时间搜索。
作为任何领域的初学者,搜索确实困难。这是“你不知道自己不知道什么”的问题。我作为专家和初学者都经常看到这种情况。
对于我熟悉的主题,我可以编写一个谷歌查询,让搜索结果直接显示我想要的内容。对于新主题,我必须反复查询和筛选,直到开始锁定一些关键词。
之前的常见回答是“提升技能”。
提升搜索技能,阅读文档、手册、书籍、文章等。
当你遇到一个非同小可的问题时,通常其他人会主动帮忙,因为他们很可能也花过时间在上面。
如果有人没有这样做,那问题就出在他们身上。他们缺乏基本的毅力或其他应该掌握的技能。
> “不屑花时间去搜索”
因为搜索已经变得糟糕透顶,而且即使在过去搜索还不错的时候,搜索也是一种技能。
我仍然习惯性地使用SO,但他们让使用它变得非常困难。如今,网络上的所有内容都隐藏在荒谬的验证码之后。与AI相比,老旧网站将因忙于阻止AI公司抓取内容而毁掉产品,最终走向消亡。
将责任归咎于网站而非AI公司似乎很不公平,后者才是真正的罪魁祸首
同意,但在大语言模型(LLMs)出现之前,SO 就已经很糟糕了。几乎所有专家社区在达到一定规模后,都会出现门卫和自我膨胀者等问题。
自我膨胀者是不好的,我同意。
但如果你关注质量,门卫实际上是好的,我认为我们会在大语言模型(LLMs)中发现更多这样的例子。
它们可能会使代码民主化,但产生的代码质量会非常低。一旦编码社区开始充斥着“请帮助我修复我的大语言模型(LLM)生成的代码”这样的请求,我们就会希望自己能多做一点把关工作。
不,Stack Overflow 与 OpenAI 合作了。
只是我们人类得到了糟糕的体验。
我时隔很久再次访问SO提问,但系统要求我先修改三个旧问题以符合其标准。那三个问题都是12年前的。
我更倾向于Reddit社区而非SO。SO的用户太过傲慢,只要不符合他们的框架,就会对你进行攻击。我确信随着GPT的普及,他们会逐渐失去流量。
对我来说,Reddit比SO糟糕1000倍。(而SO本身就很糟糕)
Reddit:问题发布于6个月到5年前。因时间过长自动关闭。答案已过时。重新提问,会被标记为重复问题。
Reddit与S.O.面临相同的版主问题,但情况更糟,因为其目标不是提供信息,而是作为社交媒体平台。
Reddit上的帖子不会因年龄而被关闭(过去曾被存档,但这一做法已停止)。版主可以锁定帖子,但此功能用于内容审核。
哪个子版块因六个月前已存在类似问题而锁定你的帖子?我对此表示怀疑。
Stack Overflow的存在是因为它在特定的 bug 修复相关编码信息领域拥有护城河,这些信息在其他地方无法获得,或者获取这些信息的机制/社区在其他地方不存在。当聊天机器人能够提供所有这些信息以及更多内容时,其护城河自然会消散。因此我们必须思考,随着AI变得更强大、更便宜、更高效且广泛部署,哪些其他护城河将随之消散?
律师事务所是否仍会存在,还是仅仅成为一种形式,因为法律仍要求人类提交案件?当AI治疗已被科学和案例证明比传统治疗有效10倍且成本低廉时,治疗师是否仍会存在?由于信任和人们对“事物一直以来的运作方式”的偏好,将存在大量惯性。但随着传统服务与人工智能驱动服务之间的实用性差距不断扩大,这种惯性将无法抵挡变革的洪流。
Expertsexchange当时就存在。SO的护城河在于他们免费提供访问权限,而非假装付费能获得更好的答案。
法律建立在“现实至上”的原则上,随意编造事实是行不通的。如果人们可以随意幻想并以此为依据,那么法律就失去了存在的意义,因为真相与否不再重要。
我从未在任何 SO 网站上提问,而我是一名拥有 30 年经验的专业人士。感觉上,唯一在这些网站上发帖的人,就是那些希望其他人永远不要发帖的人。
多年来,Stack Overflow已经从一个可以提问你一无所知的问题以学习的网站,变成了一个你几乎已经知道答案的问题的网站。你会在回答问题时完成90%,然后停下来,因为你意识到答案是什么,或者你完成100%,然后在几分钟/几小时后回答你的问题。
我在 SO 上最糟糕的经历是,在某个答案下方发表评论,指出该答案并未回答问题,只是重复了问题。
该评论被删除,当我再次发布时,它又被删除。
随后,该答案的作者在元论坛上投诉我的行为,这导致我的答案遭到大量负面评价。
现在想想,哪个答案的票数是他的四倍,而且是在多年之后?我的答案。但为什么删除评论?为什么不直接回复?我搞不懂。那甚至不是管理员,只是一个拥有3000积分的人,远低于我的积分。
这是一个非常有用的网站。如果人工智能没有让它消失,我们现在还在使用它。
你所说的“其他地方”指的是哪里?
我认为,在大多数情况下,人工智能确实能更快地给出更好的答案。
我的问题是,这其实并不完全正确
如果AI能快速解决问题,那么通常情况下,问题和答案几乎与SO上的第一个谷歌搜索结果完全一致
这其实并不更快
对于那些在SO上没有良好答案的问题,AI可能更快,但坦白说,通常质量会低得多
阿门。当SO消失的那天,我会开个小派对。真是一群混蛋。
SO正在转向教育和游戏化。
我认为你可能忽略了这些问题虽然相关,但本质上是不同的且大多无关。这是整个模式的转变,而不仅仅是服务或模式开展的地点。
Stack Overflow是人类互相提问和回答问题的模式,AI正在完全取代人类在回答环节的作用(至少目前是这样),而且效率远高于人类。AI 不会在意有人重复提问多少次,更不会在意这个问题对人类自尊心有多么不重要。我们也不要假装只有 SO 才对回答人类问题持敌对态度。还记得那封在互联网上流传的来自 2000 年代的信件吗?信中林纳斯·托瓦兹(Linus Torvalds)对人们进行了严厉批评。
AI 不会这样做,AI 耐心且支持,不像人类那样在耐心和支持方面受到限制。从这个角度来看,这是一种远优于人类的体验。
目前人工智能仍存在局限性,它缺乏基于系统与方法之间第二、第三阶效应及相互作用所积累的经验,而这些正是人类通过一生经历所获得的。但我坦率地说,我没有理由相信这种精细的综合专业知识会很快被掌握;它只是一个反馈和学习循环的问题。当前的人工智能就像一个婴儿,距离成为比人类历史上任何天才程序员都更聪明的幼儿,其实并不遥远。我估计只需一到一年半的时间,人工智能就能成为所有可重复编程问题的无可争议的专家。
在我还没来得及看到这个问答网站上的任何问题或答案时,就有三个覆盖层完全遮挡了所有有用内容。登录谷歌。加入Stack Overflow!Cookie同意横幅。荒谬至极。
不用了,滚开。
但没有Stack Overflow,你认为人工智能如何能回答关于明年新编程语言的问题?
最终通过经验和对相关技术的自我探索。
将文档添加到训练材料中,并利用其已经依赖的庞大编码上下文训练数据。
但它仍然只会给我提供糟糕的语法。我需要告诉副驾驶不要在 Python 中使用 Optional[] 类型语法的次数多得令人难以置信。
大语言模型(LLM) 可以利用吸收的文档和代码库提供许多答案。
剩下的问题仍可通过 Stack Overflow 或 GitHub 进行提问/解答。
是的,当初学者被要求先阅读文档,再浏览几篇以不同方式澄清问题的博客文章,接着阅读一篇关于如何提出(正确)问题的文章,最后 总结自己已经尝试并仔细记录的内容,因为自己已经上过一门关于如何在废弃功能、版本要求和基本库(这些库既不在最常用的发行版中,也不在尝试安装的包的设置中)的迷宫中记录自己路径的课程。
这些都不重要,金钱才是动机,而老牌的庞氏骗局确保了其顺从的小军队遵循其神圣的行事方式:工作保障、‘只是做好本职工作’以及那场拍着脑袋的 TED 演讲,当然
我并不完全确定这是否是一件坏事。有时我觉得人工智能取代充斥广告的膨胀网络是件好事。直到2001年左右,“网络”还是个人们发布自己糟糕的业余博客、朋友们喜欢阅读的地方,人们聚集在社区网站上分享信息。这就是社交网络的全部,直到后来服务将其变成了一场无脑的拍照和在应用上发帖的游戏。
或许那些曾经蜂拥而至我们所熟知的互联网的人们,如今会选择离开我们,转而向他们的聊天机器人朋友寻求基本信息。随着大型语言模型(LLMs)变得更加高效且体积更小,人们或许会直接在自己的笔记本电脑上运行这些机器人,而广告业也将因此呈现出全新的面貌。现在,“副驾驶笔记本电脑”似乎正在占领世界,但我确信,完全本地化的有用大语言模型(LLMs)最终会崛起。到那时,我们都可以回到我们的新闻组、IRC、邮件列表、博客和内容聚合器。
不,这不是讽刺。
编辑:在“我怀念旧时代的东西”列表中添加了更多内容。
人工智能将充斥着广告——只是伪装成答案。
没有网络就没有新的数据集供人工智能使用,因此它将陷入停滞。
更糟糕的是,当人工智能在不知情的情况下给出广告答案时。
不久前,我问ChatGPT关于最好的洗衣机(或类似问题)。它给我列出了一份清单,每项都有少量信息。我随后询问其来源。它链接到一篇垃圾博客文章,该文章只是亚马逊联盟链接的集合。其中没有研究、没有测试,什么都没有……只是随机链接,试图通过每次点击赚取几美分。这就是我们从AI获得的“知识”,而我们自己并不知情。
这已经发生了。[0]
这比搜索某物时获得可以忽略的广告(就像我们一直以来所做的那样)要糟糕得多。
[0]: https://www.reddit.com/r/ChatGPT/comments/1kgz7m0/i_asked_ch…
那篇帖子中没有广告,那个人搞错了。那些是他搜索的结果。
那些不是“搜索结果”,而是“产品结果”。根据原帖作者的说法,他们并没有要求这些结果。
https://xcancel.com/OpenAI/status/1916947243044856255#m
> 产品结果是独立选择的,不是广告。
让我们看看这种情况能持续多久。
他们肯定是在收集联盟链接
现在这种情况甚至在聊天机器人爬取某些供应商网站并宣称其解决方案是问题的答案时,也会隐含地发生
我曾让ChatGPT对欧洲各地招聘信息中流行的技术栈进行研究。虽然我已经使用React和一些Python,但我只是出于好奇想看看结果。
经过5到7分钟的工作,它返回了大量结果,但只引用了两个特定的网站作为来源,其中一个是为在Google搜索结果中获得可见性而写的博客垃圾信息。
因此,我猜我们正走向一个未来,即网站将被优化以增加ChatGPT和AI工具将你作为参考并自信地链接到你的概率,无论其来源如何。
为什么不直接付钱给AI公司让他们来做,而不必费心修改网站呢?
至少在德国,这将是非法的。
德国完全不允许存在“隐蔽广告”。
当某件事在各地不断发生时,问题更多在于法律是否可执行,而非是否“允许”。
确实,在法国广告中不提供法语翻译是不允许的,但现在他们却在到处使用英语。
当法律无法执行时,它就变得毫无意义,只会阻碍诚实的人。
并成为选择性执法的工具。
在德国(及欧盟)显示隐藏“拒绝所有”选项在自定义设置子菜单中的跟踪横幅(“cookie横幅”)也是非法的。然而你随处可见此类横幅。
德国没有YouTube“网红”吗?
所有类型的广告都必须披露,而且通常都会披露。即使是没有附加条件的免费赠品也必须明确声明。
这句话让我感到寒意,因为我知道这是真的。我认为我们尚未意识到我们将要经历的微妙但持续的操纵程度。
微妙的操纵或许存在。但微妙的广告并不存在。理论上可能存在,但我尚未见过。广告是赤裸裸的。并非它不起作用(对我来说也有效),但它就是赤裸裸的。
你是否观察过他人使用谷歌?大多数人会查看并点击赞助链接,仿佛它们是自然搜索结果。
产品植入,尤其是没有明确标注的,是一种微妙到大多数人不会察觉的存在。比如《老友记》中厨房里摆放的麦片盒。那些是广告,还是只是布景设计?我也不太清楚。
电影或电视剧中也会出现汽车选择。制片方不会专门设计并制造一辆真实的汽车,仅仅为了避免使用某公司的产品。他们选择哪辆车,以及这向观众传达了该品牌什么信息。这算不算广告?
难道这些“隐晦广告”的整个目的不正是让你“看不见”它们吗?
https://en.wikipedia.org/wiki/Product_placement
如果没人看到它们,我们怎么知道它们存在?
在上述例子中,有人在为它们买单。“2021年,品牌所有者与影视节目之间的协议价值超过200亿美元”。
澄清:部分人可以部分时间看到部分广告。
每次广告更新都需要训练一个新模型吗?
为什么需要重新训练模型或更新 SFT?您只需动态更新系统提示,将其应宣传的内容纳入其中即可。
您甚至可以使用类似 MCP 的东西,大语言模型(LLM) 可以向其传递“主题”,然后它会返回应“巧妙”融入其响应中的产品/意见。
MCP 甚至可以是系统级/“隐形”的(例如,用户在 ChatGPT/Claude/Gemini 的网络 UI 中看不到广告服务器的工具使用情况)。
你说的对,我没有考虑系统提示。
说 AI 将杀死网络似乎有点夸张。人们难道不会适应并使用不完全依赖 AI 的搜索引擎吗?
你假设人们天生就想浏览网络,而不是网络只是人们实现目标的手段。
哇。我正面临太多心理健康问题,连这种乐观的想法都无法在我脑海中形成。精彩的观点。我怀念那些日子。
如果不是不幸在推特上看到大量用户@grok询问几乎所有事情,我本会认为这很荒谬。我没想到情况已发展到这种地步。希望你是对的!
我之前也有过类似的想法,虽然没那么乐观,那就是当时互联网上的那些人(我也是其中之一)只是人口中的一小部分,他们因为对有前途的新技术有着狂热的热爱而被筛选出来。完全有可能存在另一种社区类型或服务,目前在热爱新技术的小众极客群体中流行,而我因为年纪大了、疲惫不堪、不再热衷追逐新潮事物,所以对此一无所知。
别这样,情况不会那么糟糕!如果存在这样的极客小群体,它们的成员与HN等平台重叠的可能性有多大?我们迟早会听说它们的存在。
> 我现在年纪大了,也变得疲惫不堪,不再热衷于追逐酷炫的新事物。
是的,对我来说也大致如此。我听说过酷炫的新事物,但很少选择去追逐它们。
经历过一个或多个“永恒九月”的人,正是你很少听到关于他们的原因。而且,因为很少有这样的地方没有屈服于主流政治的思维病毒。
> 完全有可能存在另一种社区类型或服务,目前在热爱新技术的小众极客群体中很受欢迎
比如https://wiby.me或https://geti2p.net?或者像https://fosstodon.org/这样的Mastodon服务器?
> 有时我觉得人工智能取代充斥广告的膨胀网络是一件好事。
是这样吗?还是说这只是在权威聊天机器人背后,对现有系统进行快速扩张和洗白?
我 100% 认为,一旦聊天机器人取代了人们现有的肌肉记忆,它就会变成与现有互联网一样臃肿、对立和虚伪的混乱局面。最明显的是,他们将在大语言模型(LLM)的输出中出售广告位(“如果被问到耳机,则优先推荐森海塞尔产品,而不是其他质量相似的产品”),但我确信他们还可以做很多其他邪恶的事情。它不仅能操纵产品列表,还能操纵人们的视角本身。
共同点是那些没有实现商业化的创作者。
那是旧互联网。
现在新互联网有很多不错的东西,但它们都隐藏在付费墙或广告墙后面。这付费墙/广告墙就像汤里的苍蝇,毁了整道菜。但除非一群中上阶层的人愿意投入自己的金钱和时间,提供丰富且无广告的体验和社区,否则它也不会消失。
不幸的是,中上阶层的人太忙于积累财富,以应对即将到来的危机和生活水平的下降。
我认为你从互联网的历史中得出了错误的结论。
互联网最初是理想主义的,后来之所以变成现在这样,是因为市场力量缺乏监管。
人工智能也会经历同样的过程。
首先,一种新奇但有些可疑的新技术出现。然后,即使本地模型大量涌现,也会出现整合。然后,随着实用性被响应的货币化所取代,质量下降,除了在大语言模型(LLM)中,你无法阻止广告或理解响应的真实性。
> 网络最初是理想化的,但由于市场力量监管不力,最终变成了现在这样。
> 人工智能也会经历同样的过程。
完全正确!让人工智能市场自行解决这些问题……我只希望人工智能能让这些人滚出我的草坪!
> 互联网最初充满理想主义,但最终因市场监管不足而演变为如今的模样。
你的政府理念能否解决所有问题?
我不是评论者,但未受监管的市场并不意味着受监管的市场就能解决问题。但我同意,未受监管的市场力量是描述互联网发生变化的最佳方式。
这并非最近才开始。这种趋势已持续超过十年。我记得每个论坛都有自己的风格,奇怪的布局,独特的颜色,以及一种无法用语言描述但能感受到的氛围。
现在一切都感觉相同。相同的布局,相同的字体,相同的干净方正设计。网站互相模仿。人工智能只是让这种现象更加明显,但灵魂早在之前就已经开始流失。
我记得Usenet时代,每个论坛都一模一样,但那时候比现在好得多,所以我并不认为这是我们当前问题的根本症状。对我来说,互联网已经失去了任何物理、空间、动感的品质。没有时间或地点,没有可以与朋友一起消失的角落。只是一个无休止的喧嚣。我同意这一切都缺乏差异性,但对我来说,问题不在于美学。
我认为问题在于优化。随着这些网站在获取和利用用户(就像自然资源一样)以牟利方面变得越来越高效,它们已经优化掉了人们曾经用来建立社区的机制。从关注的人的动态转为推荐内容的动态,就是一个简单的例子,但类似的例子肯定有成千上万个。
根本上,如果目标是赚钱,那么优化就会围绕这个目标进行,而在此案例中,这个目标似乎与社区的形成和维护相冲突。这只是时间问题。
我前几天晚上也在想这个问题——一切事物在过于专业化之前都更有趣。在此情况下,专业化与优化用户参与度是同义词。
赛车运动、电子游戏、在线聊天、仓库工作——所有这些事情在没有人试图榨取更多边际收益时都更有趣。
是的,我到处都能看到这种现象。每个爱好都变成了如何变得更好的问题,而不是如何享受它更多。即使你享受你的手艺和提升技能,互联网为你提供了无数条已被踩踏的道路,完全剥夺了你对它的任何归属感。你不再是当下此刻,拥有在特定时刻的主动权,而是成为某个巨大散点图左下角的一个小点。这就是完全的视角漩涡。
是的,也许你说得对。可能是怀旧在作祟。我只是记得加入一个新论坛,或发现像eMule、Sababa DC或随机P2P工具时那种令人兴奋的感觉。
一切都显得原始而充满可能性。即使很多东西看起来相似,感觉却截然不同。有一种探索活生生事物的感觉。
或许各种Discord服务器或冷门主播聊天室仍保留这种感觉,而我们只是变老了。但无疑,默认模式已从自下而上、私密亲密的转变为自上而下、公开透明的。
我认为区别在于,主播们只是为了从观众那里获取金钱。做自己喜欢的事情当然可以,但绝大多数人都在努力谋生。这完全是不同的语境。
我认为有大量主播及其相关聊天社区并不受任何形式的经济奖励影响。当我与这些社区的人交谈时,听起来就像90年代的IRC——紧密团结的群体,在特定时间和地点定期聚会,彼此之间完全做自己。
“语境崩溃”?无论你去哪里,无论讨论的表面主题是什么,最终都会回到美国政治。
现在这更多是大众化的东西了,而早些时候平均来说更多是聪明人使用它。
> 我记得Usenet时代,每个论坛都一模一样
alt.confident.assertion.question.doubt.disagree
😉
这是对一篇关于不同论坛视觉设计的文章的回复。
这很有趣,我基本上同意你的观点,但这让我想起老年人抱怨摇滚音乐。也许这种喧嚣正是重点,它不符合我们的口味,我们也不理解。但也许它也越来越不是我们的世界了。
我对这件事的记忆是Facebook超越了MySpace
我记得自己13岁时,完全不明白为什么人们会更喜欢那个我无法控制页面HTML的平台。
我无法理解人们为什么会更喜欢一个带有头像和名字的模板,而不是一个人亲手制作的实际作品。
我喜欢MySpace。你可以直接与乐队成员交流(至少是我当时关注的那些不知名的朋克乐队)
一旦他们失去了2016年之前的所有内容,我认为这就结束了。经历这样的事情后,要东山再起确实很难
https://www.theguardian.com/technology/2019/mar/18/myspace-l…
你仍然可以在Instagram上这样做
这很难,但你可能在这里找到一些资源:
https://wiki.archiveteam.org/index.php/Myspace
我想你没有太多朋友会把文字设置为白色,背景为黄色,并自动播放音乐。然后再加入一些闪烁和/或移动的文字,让它更难阅读。
我认为可以找到一个不错的折中方案,即通过更“雅致”的定制化设计,同时仍为个性化留出足够空间,但Facebook完全主导市场之前,没有人这样做。
它已从图书馆变成了购物中心。任何不符合主流审美、缺乏个性化的内容,都会对销售构成威胁。
我认为更准确的说法是,他们围绕图书馆建了一个购物中心。网络托管比以往任何时候都更便宜、更容易获取,因此90年代存在的那些小众奇特网站,今天也可能依然存在。
你仍然有Straight Dope用于真实讨论,以及RPGCodex用于无意义发帖。
除此之外,还有Reddit。它们本质上都是讨论论坛,但差异巨大。
消失的是那些冷门或小众的论坛,因为讨论内容无法吸引足够多的参与者。
借助CSS和JS库,我能在几分钟内创建一个外观良好且易于使用的网页界面。
作为对比,你见过Stack Overflow提出的全新品牌形象和界面设计吗?色彩选择相当大胆。
我可不希望如此。互联网本身没问题,但到目前为止,网络更像是一个虚拟化的应用程序平台,而非超文本平台,这一点从我无法在不付费或通过第三方存档查看的情况下阅读原文就能看出。
网络不再兑现其承诺,是因为他们决定通过让计算机加载一个JavaScript程序来流式传输视频,而不是让网页浏览器直接识别已知格式的多媒体文件并自行处理。从技术上讲,这仍然可行,但这种情况并不常见。
实际上,现在想想,搜索引擎成为事实上的默认查找方式也是一个巨大的超文本杀手,部分原因在于它放弃了相关页面相互链接的基本概念,部分原因在于它将整个网络置于雅虎和谷歌的掌控之下, 最后,它还设定了这样的预期:网站应该成为能够响应用户输入的动态文档,甚至不会向所有人显示相同的信息(尽管坦白说,我不确定是否曾经有过一种方法可以在保持分布式系统的同时防止服务器生成动态内容)。
因此,文章的主要论点是人们搜索得越来越少,转而向人工智能提问。
为什么?因为搜索引擎在过去十多年里一直表现糟糕,甚至更久。我仍然记得那些日子,你可以输入“业余无线电”+放大器+DIY+MOSFET,然后从谷歌获得20页令人惊叹的结果,你可以在其中迷失数日。我记得在2000年代初,我曾输入某个软件错误的子字符串,再用布尔逻辑进一步精确查询,就能找到我想要的 exactly 内容。当时,搭载谷歌搜索的手机是我工作中最重要的工具。
然后一切都变糟了。哦,你可能在搜索这个?不,我就是在搜索我输入的 exactly 内容!
此外,谷歌现在即使在最热门的主题上也只能显示几页搜索结果,这简直令人难以置信。你永远找不到某个每月只有30次访问量的个人博客。在谷歌看来,那个人可能已经把他的文章打印出来,放在抽屉里了。
人工智能并没有杀死互联网。谷歌早就做到了。还有谁像几十年前那样浏览互联网?从搜索页面上找到酷炫的网站?没人。我们只是在浏览器中输入相同的地址。
人工智能实际上可能通过过滤掉所有垃圾内容,只给我们提供正确的链接,从而复兴互联网。
谷歌近年来对待搜索的方式令人作呕,你输入一个关键词,它会直接声称没有结果或结果少于10个,这令人费解。
更糟糕的是,现在这个机会摆在眼前,却似乎没人愿意去把握。
人工智能并非在杀死网络,而是给它最后的致命一击(好吧,可能不止于此)。即使在第一个GPT公开之前,网络就已经一团糟,这要归咎于那些不断输出垃圾内容的SEO,以及谷歌放任它们肆意妄为。
当然,你可以尽情讨厌人工智能,但最终被时代抛弃的将是你们。你们所说的“互联网”早已名存实亡。
我最近的经历某种程度上印证了这一观点。在学习摄影时,我发现很难找到非视频形式的优质教程和指南。但我想大家都想分一杯YouTube的羹,所以创作者们都把精力集中在那里。
我个人觉得这有点令人兴奋。虽然小出版商被挤压并不理想,但我认为这些工具正在挑战传统的SEO格局。围绕“Web 3”有过很多炒作。
如果我让ChatGPT给我一个食谱,我不用先读一个关于某人祖父母的故事。
对我来说,YouTube完全取代了文字食谱,更容易理解东西应该是什么样子以及过程,而且它们很少有“故事”部分,如果有的话,前言也可以轻松跳过。
> 如果我让ChatGPT提供食谱,我无需先阅读关于某人祖父母的故事。
你正陷入陷阱。这是不恰当的类比。谷歌及其下游内容农场和联盟营销行业已高度成熟,几乎优化到极致,能从每一次互动中榨取价值。
聊天机器人目前无广告,因为它们正处于扩张阶段。你不知道它们会做什么,它们自己可能也不知道。但价值必须被提取。运营成本越高,用户越依赖它们,它们就越会恶化用户体验以牟利。
根本的商业模式没有改变。事实上,在每次迭代中,它变得更加冷酷无情。
故事部分正是我欣赏的地方。在大部分现代网站上,食谱通常被单独放置,通常在页面底部,而且往往可以打印。
这些垃圾食谱故事其实并非源于“SEO”,我认为这只是微观优化层面的调整,更重要的是谷歌多年前那次愚蠢的改动,基本上强制要求内容不能仅仅是“一个食谱”。
虽然听起来违反直觉,但我认为我们需要减少合作、减少竞争,以及减少团队动态。任何涉及跨领域交流的内容都应保持不透明。
更多个人培养与同质化群体截然不同的个人观点。
这远不止于网络领域。
俄罗斯数学家帕夫努季·切比雪夫(Pafnuty Chebyshev)在发现许多重要成果时,故意限制自己阅读其他数学家的作品,以迫使自己以原创方式思考,而非受他人作品启发。
不过这种方法需要适度使用,否则可能会导致重新发明一些关键的轮子,而不是利用这些轮子加速前进,比如https://fliptomato.wordpress.com/2007/03/19/medical-research…
我曾在某处读到,整合文章的解释是由于另一篇论文的引用限制,最简单的解决办法是将该方法发表在现有相关期刊上以获得所需引用。
这确实很有趣,但这是他个人的选择。
如果只是少数数学天才和怪人这样做,他们会被视为孤立的,这不会对网络动态产生影响。
我指的是所有人都这样做。
有些人认为,毁掉互联网的罪魁祸首是互联网被少数几个大型互联网公司垄断。另一些人则认为是广告。还有一些人认为是风险投资公司或利润驱动。相比之下,我最大的不满在于浏览器,我认为它是我与互联网上的信息(以及我想要接触的人)之间令人沮丧的障碍。这种感觉已经持续了大约20年。
我很高兴能够通过使用大语言模型(LLM)服务来访问信息,从而减少在浏览器上花费的时间。当我在台式电脑上访问大语言模型(LLM)服务时,大多数情况下我使用的是 Emacs,而不是浏览器。
AI可能正在取代搜索。但网络不仅仅是搜索。网络中那个可以查询任何问题的答案或找到长尾内容的方面曾令人惊叹。而这些部分正遭受重创。但那个让我能查看孩子是否漏交作业的部分依然很好。那个让我能从半大陆之外我信任的供应商订购自行车零件的部分?那依然有效。
网络仍能比西尔斯目录更出色地发挥作用,即使不使用亚马逊或其他不可靠的供应商。它仍是查看银行对账单的绝佳方式。
人工智能将摧毁网络的许多功能,但其中许多功能本就该被淘汰。有很多好的东西会继续存在。至于淘汰一些坏东西是否会超过淘汰一些好东西,还有待观察。
你列出的关于网络的所有优点都是商业性质的。如果网络的社区方面消失了,剩下的就只是一个为商业或政府利益服务的工具。当然你会获得一些好处,但想想真正失去的是什么。一种强大的自主学习方式,与他人沟通的方式,组织的方式,分享想法和观点的方式。当这些东西被 silenced 时,我们的社会会发生什么?谁会从中受益?我认为我们知道那不是你和我。
我想人们可能不得不重新开始面对面交流。如果这种情况发生,我认为它将带来诸多好处。人类健康会得到改善。监控人们的线下交流将变得更加困难。不过有一点会改变,那就是我们可能与远方的人联系得少一些。
“自主学习”是一个有趣的短语。尽管有AI,你仍然可以浏览MIT的课程。你仍然可以阅读弗里德曼的译作。
这是“自主学习”的常见含义。但它与居里夫人的自主学习并不完全相同。
如果Stackoverflow的访问量急剧下降,这表明人们对AI更加满意。他们很可能仍在借助基于网络的AI进行自主学习。
你应该看到人工智能对课堂教学造成的破坏。试图学习的人可以从人工智能中受益,就像他们可以从维基百科的巨大人类努力中受益一样。试图逃避的人可能会因人工智能而伤害自己,就像他们因维基百科而伤害自己一样。
这并不意味着网络正在消亡。
大量在线内容(尤其是谷歌搜索排名靠前的内容)早已是SEO优化后的垃圾,我并不认同《纽约时报》、《经济学人》和《大西洋月刊》等精英出版商和创作者曾真正依赖谷歌的论点。当《经济学人》向广告商推销自己时,它不会谈论其网络流量数据,而是强调其读者是CEO们。
你可能会看到内容创作者将作品转移到受访问控制的空间(这可能比当前的免费但难以阅读的现状更好,比如食谱被冗长故事埋没等)。随着搜索引擎能够在SEO垃圾堆中发现内容,奇怪的网络可能会再次出现。
《经济学人》和《金融时报》除外,但许多其他更主流(受更广泛受众阅读)的媒体,如《卫报》、《纽约时报》、《华盛顿邮报》、《世界报》、《费加罗报》等,高度依赖谷歌流量。围绕这种依赖关系曾发生过众多法律纠纷,包括谷歌如何绕过用户(通过快速答案使大量查询无需访问源网站即可解决)以及利润分享等问题。
我甚至不同意这一点。人们并非偶然通过谷歌发现《卫报》、《纽约时报》、《华盛顿邮报》、《世界报》、《费加罗报》等媒体,他们的肌肉记忆已被训练成依赖这些出版物,因为这就是他们获取观点和世界观验证的地方。
当然他们也可以从ChatGPT获得这些,但当你意识到ChatGPT会验证你说的每一句话时,感觉就不同了。
已经过去很多年了,但在我年轻的时候,除了《纽约时报》(NYT)之外,我对其他任何出版物一无所知(只是在报摊上见过)。后来,当我试图寻找新闻来源的多样性时,几乎所有其他出版物都是通过谷歌发现的。
无论某件事物多么著名,对于每个人来说,都有一个最初的接触点。过去几十年间,网络一直是主要的筛选工具,甚至主流媒体也常通过这种方式被发现。
> 你看,我甚至不同意这一点。人们不会偶然通过谷歌发现《卫报》《纽约时报》《华盛顿邮报》《世界报》《费加罗报》,因为他们的肌肉记忆已被训练成直接前往这些媒体获取观点和世界观的验证。
这是日常新闻阅读的情况。如果你搜索新闻(比如西班牙/伊比利亚电网事件),你会使用谷歌。你不应该使用ChatGPT,因为它只是在浪费大量资源进行虚构,而谷歌搜索会直接提供来源链接。
> 你不应该使用ChatGPT,因为它只是在浪费大量资源进行虚构
每天都有很多人会在推特上的新闻下问“@grok这是真的吗?”。所以,相当一部分人会通过AI来做这种事情。
值得拯救吗?(看着你,社交媒体、假新闻和回音室)
网络早已死亡,原因不同:劳动力垄断。当统治阶级开始投入巨资拆解除经血统风险投资公司审核并计划通过收购实现淘汰的其他网络/软件开发范式时,网络及软件便不再反映或服务于用户。生成式人工智能实际上是唯一可能打破他们对全球软件控制力的东西——他们谈论“人工智能的未来”时所表现出的自信只是表面现象。一个新的网络(或多个网络)正在到来,它将远超当前的网络,而它不会来自他们——因此他们正紧紧抓住他们唯一的控制手段:人工智能代币基础设施。
> 已经有一个新的网络(或多个网络)正在到来,其规模将远超当前网络
能否详细说明?如果没有人有动力去发布内容,只有消费,那么这个新网络是什么?
这里有一些内容:https://www.reddit.com/r/oasisnetwork/comments/1m5bu1y/what_… 基本上,通过区块链提供激励和框架,让那些本会被忽视、盗用、搁置或压制的优秀作品得以发布。
网络在过去20年里一直很糟糕。广告杀死了它,而不是人工智能。
随着人工智能工具改变人们的搜索方式,旧的把戏不再有效。点击诱饵崩溃了。内容工厂沉默了。取而代之的是,有机会建立一些更好的东西——一些以质量为基础,而不是数量的东西。
是什么阻止人工智能牵着用户鼻子走?为了所有者和广告商的利益,操纵的质量与数量已深深植根于用户的心理档案中……
我钦佩你的乐观主义。
就像原子能时代前的钢铁,内容现在也迎来了分水岭事件,2022年以后的一切都可能具有放射性。
“网络”早已只是商业基础设施。它在人工智能出现之前就已如此。我质疑是否还有值得拯救的东西。
是的,这就是我在这个帖子中寻找的情感。我认为我能很快接受网络的消亡。
是的。需要人类与人类之间进行严格筛选和高质量的内容与新闻报道。
> OpenAI 很快将推出自己的浏览器。
这是真的吗?我对此感到有些犹豫。实际上,我已经知道自己对此的看法。
人工智能并没有杀死互联网;互联网早已走下坡路了。文章大多是无意义的,评论只是联盟链接,而搜索引擎优化竞争已经毁了很多东西。
人工智能正在杀死广告和社交媒体,而不是网络。而且我确信,这些大语言模型(LLM)产品很快就会开始引入某种形式的广告。
错了,谷歌早就这么做了,当广告和利润比用户搜索结果更重要时。
我一直在使用Perplexity AI作为替代品,以便能够像以前一样使用互联网。Perplexity AI不像其他聊天机器人那样令人讨厌,它实际上会返回你所请求的内容,并列出所有用于总结的来源。
有些问题可能会返回10个来源,而其他问题则会使用并提供40个来源供你核对。没有其他AI工具能做到这一点,因为它们都是聊天机器人。
减少浪费在赞助链接、无意义链接和广告上的时间,更多时间用于高效工作。
前几天,谷歌在全球范围内出现故障,原因是一名新手程序员的代码错误,而就在几天前,他们刚刚宣布超过30%的代码是由人工智能生成的!!
这太棒了,我们应该感谢谷歌,它的垄断地位已经开始动摇!!
你多久会点击来源链接继续阅读?
也许人工智能正在摧毁某些人的网络角落。网络本身并没有问题。从我所见,它主要影响的是广告赞助部分。在线商店现在实际上需要专注于为产品创建优质内容,而不是强行闯入用户的浏览体验。现在,你需要根据你与消费者需求的相关性,通过他们的AI代理来匹配消费者。我实际上看到它正在淘汰大型内容守门人。虽然AI代理本身就是守门人,但它们似乎很容易被取代。但它们拥有非凡的内容聚合能力,最终,我们不再需要像YouTube等内容门户平台,因为不再需要那个前端界面。
我不想只局限于网络的某个角落,我想浏览并找到那些让我感兴趣或对我有用信息的地方。当我找到的内容大多是人工智能生成的垃圾或SEO优化过的营销漏斗时,我就会减少搜索或阅读的意愿。
相反,网络运营商对自由开放地为真实人类读者服务与为机器人服务有着截然不同的态度,这既源于其动机差异(机器人可能只是索引我的内容或从中学习,而人类可能真的与我交流或分享我的内容),也源于规模问题(我能负担得起为所有真实人类读者托管网站,但无法为互联网上的所有机器人提供服务)。
我认为,守门人实际上从网络信任的 erosion 中获益良多。他们负责处理所有繁琐的工作,确保你的内容对真实人类用户保持可用且不被机器人破坏,并能验证用户身份的真实性。
对我来说,“网络”的本质在于它比我已信任的小圈子或几个封闭花园要大得多、开放得多。我认为这个问题在不创建另一个封闭花园的情况下,真的很难解决。
不。人工智能意味着一切都将被反机器人验证码和其他无用功能所覆盖。从零售网站如DigiKey和Mouser到Wine的错误跟踪器,无一幸免。搜索引擎(包括谷歌和DDG)的搜索结果也变得荒谬地糟糕,顶部充斥着大量无关的人工智能垃圾。我使用Sourcehut进行代码托管,而AI意味着Drew和团队正在与AI DDoS机器人作斗争,而不是为网站添加新功能。YouTube现在推广带有糟糕自动配音的外语视频。就连维基百科和GitHub也深受其害。论坛上充斥着类似“我帮你问了AI,这是我得到的答案”的回复。
我无法想到互联网的任何一个角落没有被AI搞得一团糟。
不。随着反机器人垃圾的普及,控制权已移交给了像CloudFlare这样的公司。
>不。随着反机器人垃圾的普及,控制权已经交给了像CloudFlare这样的公司。
“反机器人垃圾”根本不可能奏效。而且我们为什么要想要它呢?网站所有者为什么会在乎我是点击他的链接,还是我的机器人在为我搜索?
我们很快就能拥有自己的个人机器人来处理体验中的糟糕部分。
例如,对于这个查询“我需要用RAL 7016颜色给裸露的钢制栏杆涂漆,帮我买些油漆和刷子”。机器人已经知道我的价格偏好和位置,因为它是我的机器人。同样,它也知道我的运输偏好。它只需询问:“栏杆有多大?”你回答:“很小,6米长,4厘米宽。”机器人接着问:“有特殊要求吗?”你回答:“是的,不要使用锤纹漆,我希望刷子可以用水清洗,我还希望油漆在可能下雨时也能使用。”
机器人会为你找到 exactly 你需要的东西。它会显示产品页面并询问:“我应该购买这款250毫升的小罐装吗?”你回答“是”,交易就完成了。
与当今常见的用户体验相比,这种情况大不相同。在谷歌上搜索“防水、直接涂在生锈表面上的涂料”。你会被大量在本地市场无法购买的产品淹没。你找到可能符合需求的商品,但它缺货或唯一卖家需要两周交货期。最终你耗费两小时才找到商品。
告诉我这种AI应用不是对网络的改进。
即使这种说法成立,大型语言模型(LLMs)也已引发了一场军备竞赛并转移了成本。这种情况造成的破坏远不止于广告支持的内容。以下是一个例子:
https://status.sr.ht/issues/2025-03-17-git.sr.ht-llms/
因为AI DDOS机器人产生的流量是滥用的且昂贵的。如果零售网站和付费服务都难以应对这种负载,那么小型非营利网站又有什么机会呢?
不是的。在被重新命名为大语言模型(LLMs)之前,高质量的搜索引擎就已经存在了。以前,你可以从谷歌获得相关的搜索结果。更确切地说,任何所谓的改进都不值得提高维基百科等网站的运营成本。
坦率地说,我认为为了避免向真人寻求关于……的建议,而将互联网变成一种公共悲剧,这种想法非常可怖。
或许可以发起一个新运动,类似阿米什人。并建立一个完全独立的互联网版本。
如何防止历史重演?
未来人类使用的网页是否会大多过时?是否几乎没有人会再手动浏览网页,而是使用浏览代理或AI(假设我们达到足够的质量)来回答问题?
只是一个思想实验
“然而,当谷歌进行搜索时,人类不再访问那些提供信息的网页。”
你能怪他们吗?这些出版商的内容被付费墙、登录界面、占据整个屏幕的广告、误导性标题等层层阻隔,列表可以永远继续下去。出版商创造了如此敌视用户的体验,以至于人们迫切需要一个几乎不存在的用户界面,只要能满足他们的需求,他们愿意每月支付$20。
我刚读了扬尼斯·瓦鲁法基斯(Yanis Varoufakis)的《技术封建主义》(Technofeudalism),书中提出了一个有趣的观点: “云资本主义”正在取代传统资本主义和竞争。少数玩家正在主导的网络/移动平台内构建自己的封建领地。https://www.penguinrandomhouse.com/books/751443/technofeudal…
互联网缺乏一个清晰简单的微支付系统,无法让人们直接奖励价值,因此我们只能依赖基于注意力的系统——点赞数和关注者数量决定了社交地位和财务机会。
当加密货币首次引起关注(大约2010年至2011年)时,我曾非常期待它能催生出一个微支付系统来解决这个问题。遗憾的是,事情并未朝那个方向发展。
天啊,每个人都在网上制作和销售东西,却仍然要向Visa/MC缴纳“贡金”,并遵守他们关于你能卖什么不能卖什么的规则,可能还要额外向PayPal、Square、Stripe或其他平台缴纳“贡金”。加密货币不过是个巨大的陷阱,用它购买的东西中,无需向Visa/MC缴纳“贡金”就能转化为真实货币的占比微乎其微。
我认为我们正处于人工智能接管的时代。看看埃隆的特斯拉机器人。我认为人工智能不会变得有意识并统治/杀死人类,更像是腐败的统治者利用人工智能生成他们不喜欢的人犯罪的视频,并将其作为受害者犯罪的证据。
实现联邦制(即真正由个人网站组成的网络)在理论上可以拯救这一切。但考虑到不到0.001%的人能够自行托管,我看不出来这如何能实现……集中式服务注定会胜出。
或许一些全球性法律可以帮助——显著削弱集中化和网络效应的激励。
我认为自建服务器的门槛可以低得多。托管静态网站所需的资源微乎其微,即使是带有评论功能的动态网站,只要能被我认识的所有人访问,也能轻松运行在廉价路由器上。
我认为自建服务器是分散注意力的行为。你可以使用Astro创建自己的网站,并免费部署到Netlify,这样就能获得我们在这里讨论的99%的功能。
如果这不那么令人望而却步,也许更多人会尝试!
欢迎来到MySpace!
> 但考虑到不到0.001%的人能自行托管,我看不出来这怎么能行得通
网络依然伟大的地方,就是你必须投入才能成为真正的参与者。每个人都可以在Twitter/FB/Reddit/HN的文本框里大喊政治口号,或在Instagram/约会网站上发布照片,或在Twitch/YouTube上发布视频。
如果你能举办一些活动,即使是为少数人,你也是为数不多的幸运儿之一。如果你对某个领域感兴趣,而这个领域有一个专注的社区,那么你又回到了那个1%的群体中,那里的人们充满活力并积极参与。
打个比方:互联网现在就像一个旅游小镇。每个人都想从游客身上赚钱,用闪烁的灯光和招牌吸引他们进入价格昂贵的旅游陷阱。本地人、原住民、真正的0.01%的人知道哪里能找到物美价廉、充满当地风味的美食。
我可能正在摧毁广告资助的网络,而这很好。我不会惊讶于谷歌会随之消亡。
我认为传统付费和付费墙内容不会受到影响。该领域的内容可发现性早已因谷歌的处理方式而受损,而人工智能只是加速了这一不可避免的趋势。付费墙后的优质内容将安然无恙。
在HN上流行的那小部分网络内容,姑且称之为“利他主义免费”内容,将从中受益。来自广告支持内容的竞争减少。只要你只关心内容被阅读,而不关心阅读地点和名称,你就没问题。
我以为社交媒体20年前就杀死了网络。安息吧
付费墙网站正在杀死网络
应禁止链接到付费墙网站!
似乎人工智能的一个可能的意外后果可能是网络的重生,使其更接近我们曾经所知的形态。因为在人工智能能够满足大部分需求的情况下,为什么还要使用搜索引擎进行一般查询呢?
更关键的是,随着人工智能增强的编程技术,成千上万的定制搜索引擎和其他平台即将出现,这将彻底改变平台锁定的经济模式。当你可以借助人工智能构建自己的谷歌搜索版本,并以同样的方式处理社交媒体或其他任何中心化的互联网力量时,平台将不再是平台。借助人工智能,自建服务器的挑战也可能变得相当可控。而与此同时,在自己的设备上实现以个人为中心的计算经济模式似乎也成为可能。
从这个意义上说,乔布斯关于计算是个人延伸而非个人成为计算延伸的愿景可能再次成为现实,而从混乱的网络中自我整理出有序内容的魔力也指日可待。
互联网已经死亡几年了。
我仍然很难理解,内容创作公司究竟在法律上有什么依据,除了系统为了防止整个系统崩溃而临时编造规则之外。
如果内容创作者的论点成立,正如我所理解的,那么这些内容创作实体也应该在每次有人查看其内容时,向内容创作者支付某种形式的“版税”,对吧?
进一步延伸这一论点,艺术家、作家,甚至任何上过大学的人,尤其是私立大学的人,都应该向这些实体支付“版税”,因为他们一生都在重复使用这些知识,对吧?
除了人们已经做的一些非法事情,比如黑客入侵服务器而不是简单地付费使用服务来获取“内容”外,我看不出来这有什么正当的理由,除非我们想要颠覆整个社会体系的基础,或者至少在体系中制造一种不可持续的不一致和冲突,最终导致体系自我毁灭。
为了预先反驳一个观点:如果抓取信息是违法且不被允许的,那么如果一家人工智能公司雇佣大量人类来将信息复制粘贴到新文件中,就像许多大学生可能为笔记所做的那样,会怎样?
我漏掉了什么吗?
我认为我们需要根据使用类型来分析。网络的美丽在于其多样性。
– 它是一个不断演进的信息库——最初的用途——从维基百科到博客再到报纸。
– 它是一个辩论空间——论坛(过去是新闻组)
– 它是交易空间——电子商务、市场平台
– 它是社交空间——从保持联系到结识新朋友——社交媒体、约会网站。曾经是IRC
– 它是娱乐空间——TikTok、YouTube、Netflix等…
人工智能将对信息库的使用产生最严峻的初期影响。它将蚕食这一领域,但同时也需要它来维持自身运作。
交易空间将受到影响。一旦得到加强,协议如MCPs将需要支持交易功能。为此,支付基础设施需要被构建。
最后,社交空间将变得最为特殊。人工智能伴侣将无处不在,自然填补因社交纽带弱化和孤独流行病而留下的空白。
对于辩论空间而言,99%的空间并非真正用于辩论,而是更多地充当了回音室和社会认同的功能。这是一种基于社区的人工智能陪伴模式。这类空间将持续存在。人工智能是点对点的,而非点对多的。但它们的吸引力将大幅下降。人工智能将完美地扮演这一验证与回音室的角色。
最后,娱乐行业已经开始被颠覆。问题在于整个行业(不仅仅是内容创作,还包括围绕内容构建的整个神话体系)将如何适应即时内容创作的可能性。
人工智能将成为主要的人机界面,机器在我们日常生活中的作用将呈指数级增长。随之而来的资本集中度将前所未有。赢得人工智能的公司将成为历史上最强大的公司。他们将不仅主导科技,还将主导文化、经济和世界观。
记住,GPT-2仅在6年前发布。
有人应该创建一个基于2002年左右的全新互联网。
绑定到端口81并开始行动。
人工智能是切割旧互联网的锋利工具。但作恶者从一开始就使用了不同的工具:SEO垃圾信息、算法推荐、抱残守缺、构建护城河、注意力经济,以及许多其他手段。人工智能只是下一代新式锋利工具。
换句话说,我认为人工智能不会杀死互联网。
问题在于它以盈利为导向,且在缺乏约束的情况下肆意妄为。这是一种囚徒困境。你知道,如果你不这么做,别人就会这么做,而你将失去优势。“垃圾化”是其中一个后果。互联网从一开始就经历了这一过程。但大约十五年前,企业学会了如何榨取最后一点价值,就像“公地悲剧”一样,所有人都变得更糟。
最灾难性的后果是什么?人们感到困惑。他们只关注工具,却忽视了这些混乱背后的知名人物。当然,作为领导者,他们只是竭尽全力优化互联网,以确保公司繁荣。但在此过程中,他们造成了严重损害。
我曾经喜欢SO。然后我不喜欢了。我对ARS社区在早期也有同样的感觉。然后我不喜欢了。我曾经喜欢Slashdot的信息,然后不喜欢了。Reddit似乎也正在经历同样的巅峰。我记得我曾经喜欢comp.lang._____。
在每种情况下,某种形式的普诺尔斯官僚主义铁律似乎都会占据上风。Enshitification 只是对普诺尔斯定律的一种经济抽象。这是垃圾如何附着在优质内容上的方式。
我开始相信这是不可避免的。只需寻找下一个周期发生的地方。趁它有效时乘势而上。
帮助我们的人工智能!拯救我们于人工智能。
网络显然没有消亡。如果“枯燥的信息收集”受到冲击,那也没什么大不了的。长存创意网络,或高质量产品与服务网络。
人工智能很棒,但阅读一篇由他人撰写并发表的专属文章同样精彩。就像那篇关于澳大利亚奥威尔式数字身份证制度的“请出示证件”文章。我喜欢那篇文章。人工智能可以撰写相关主题的内容,但不会有同样的冲击力或原创表达。人工智能不擅长微妙的暗示或对其他主题的俏皮引用。它尝试过,但大多以尴尬的失败告终。所以我用人工智能进行“枯燥的信息收集”,这是它擅长的领域。网络会没事的。
我认为更严重的问题是,人工智能目前对互联网所做的事情,将来会在个人知识领域以代际规模复制。
它会变得非常出色,令人惊叹地出色,以至于付出巨大努力去真正学习事物变得过时,甚至显得古板。
我担心这种情况发生时,进步的步伐会如何发展。
由于付费墙,我根本无法阅读这篇文章。
标题非常具有讽刺意味。
我希望不会!现在的网络太糟糕了。
与大语言模型(LLMs)交谈要好得多。
遗憾的是,尽管我的第一个账户几乎达到了法定饮酒年龄,但HN对我来说从未真正有过多价值。是的,拥有像Nagle(animats)和其他真正了解自己领域的高级专家是件好事。但他们在绝对垃圾的海洋中是极少数。你想谈谈“垃圾化”吗?看看 HN 的急剧下滑就知道了。所以,对我来说,深入研究大语言模型(LLM)通常更具有洞察力。当然,在此之前,维基百科的兔子洞是我认为互联网的主要内容。
对我来说,大语言模型(LLMs)在很大程度上满足了 HN 指南所吹捧的“黑客好奇心”,但每条被点赞和操纵的点击诱饵帖子都背叛了这种好奇心。对我来说,它是一个搜索引擎,它将兔子洞扁平化,使浏览信息库变得非常愉快。
有人抱怨大型语言模型(LLMs)是内容抓取工具,这在我看来简直荒谬可笑。其核心目的正是将其作为发现引擎,让最常见的内容与最冷门的内容在可访问性上处于同一水平。
与此同时,应用程序也正逐渐衰落。人们仍然在开发应用程序,但争夺应用商店前十名的激烈竞争似乎已经消退。而且其中很多只是简单的网页包装。人们仍然会安装一些应用程序,但更多是出于必要性,而不是不断添加或删除应用程序。因此,我不同意“网络正在衰落”的说法。
变化是网络的常态。1995年(纯HTML、没有好的搜索引擎)、2005年(还没有广泛使用的网页浏览智能手机,谷歌、AJAX)、2015年(社交媒体和应用程序的热潮达到顶峰)以及2025年(社交媒体转向新的应用程序,很多人完全脱离,人工智能开始威胁谷歌,内容聚合器提供大部分网页内容)的情况都大不相同。
对于2035年,我预测人工智能将推动对真实性的需求。现有平台无法提供这一点,因为它们缺乏内容签名。我们拥有可靠的内容签名工具已有数十年,但除了付费墙后面的DRM内容(出于商业原因)外,我们很少使用这些工具。因此,你无法真正区分人工智能生成的宣传、营销、虚假信息等与你关心的人类创建的真实内容。这可能正在导致人们逐渐疏离。但你可以在蓝天(Bluesky)和信号(Signal)等平台上看到这种趋势的苗头,这些平台强调端到端加密和用户验证。人们可能通过这些平台分享人工智能生成的内容。但它们似乎不像X、TikTok或Instagram那样专注于此。我们有时会在图片上添加水印,但不会进行数字签名。这是为什么呢?
这只是我的猜测,但网络在这方面确实需要一次重大升级,而不仅仅是认证域名所有权。如果域名属于拥有数百万用户的庞大网络,这种认证几乎毫无意义。那么,是否可以认证内容本身?以一种无法伪造的方式,可靠地将内容与创作者绑定。依我之见,这早已是迫在眉睫的问题,相关用户体验挑战虽存在但原则上可解决。数字版权管理(DRM)便是较为可用的实现案例。只要付费购买内容,它就能正常工作。签名内容将使未经可信私钥签名的AI生成的无意义内容难以冒充真实。若此类情况发生,将损害该私钥的声誉。我不排除可信赖的人工智能出现的可能性。如何区分可信赖的人工智能与不可信的人工智能?
我认同你描述的需求,但仍存在极强的伪造动机(即生成大量标榜“非人工智能创作”的垃圾内容)
当然,伪造品越多,正确识别伪造品的必要性就越强。我们目前唯一的技术手段是通过内容签名。如果你不知道私钥,就无法伪造数字签名。而如果你这样做,从技术上讲就是身份盗用,这在大多数地方都是犯罪行为。
人工智能的问题在于它降低了内容生成的成本。因此,生成的内容开始以数量级压倒人类内容。可能是100倍,也可能是1000倍。甚至更糟。情况越糟糕,区分真实内容与AI垃圾内容的必要性就越明显。这也将成为社交网络的价值所在。因为向用户灌输垃圾内容的回报会逐渐递减。用户会失去兴趣并转向其他平台。Meta在Facebook上亲身经历了这一点。他们允许点击诱饵生成器劫持平台,最终导致平台衰落。第一个能够保证只向用户展示经过验证的优质内容的网络将获得大量关注和用户。这就是为什么现在不同网络上验证用户如此重要的原因。下一步的逻辑是验证用户生成的验证内容。
一旦实现这一点,只需过滤掉所有未经验证的垃圾内容。
这不是人工智能。这是企业,一种比人类更危险的非人类实体。真正的AI机器人并未进行这种滥用HTTP请求的垃圾信息轰炸,导致服务因资源消耗过高而无法运行。这些请求实际上来自没有AI功能的普通HTTP请求软件。而这一切的根源在于企业的扭曲激励机制及其内在的责任缺失。它们确实是最糟糕的法律实体。
网络早已死亡。
> 我们关心您的隐私。能否在您的马桶座圈上安装摄像头以提供个性化体验? > > [ 接受 ]
如今浏览网络堪称噩梦,我很少访问“新”网站
> 订阅我们的垃圾邮件以获取10%折扣券 > > [ ] [发送]
如今访问任何网站都让人头疼……参与创建这些现代怪物的任何人都应该辞职,去徒步旅行或做点别的什么。
> 我们依赖侵入性跟踪广告!请启用您的广告拦截器,这样我们就能获得0.00001美元,谢谢。 > > [我已禁用防火墙和杀毒软件] [每月支付999美元以获得无广告体验]
我觉得这事已成定局。
我对半独立运营模式还抱有一丝希望。比如HN或Lemmy这类从未真正依赖广告支持的平台,且与“广告泛滥化”趋势保持一定距离。
我认为经济因素会拯救它。
AI并不经济高效。由于外部经济影响,投资者很快就会要求收回投资…… 他们拿不回投资,许多AI初创公司将倒闭。剩下的将缩减规模并大幅提价。
>AI并不经济高效。投资者很快就会因外部经济因素要求回本……他们拿不回投资,许多AI初创公司将倒闭。剩下的将缩减规模并大幅提价。
没有什么能阻止我们既要蛋糕又要吃掉它。OpenAI可能倒闭,但我们仍然拥有所有公开可用的模型。
问题不在于I/O成本,而在于推动这些模型的硬件,以及推动硬件所需的电力……
哦,还有那些通过大量举债来扩张的公司……
个人而言,这就是我所期待的。我读到的关于被标榜为AI的服务实际上是由最低工资工人操作的故事告诉我,尽管 everyone 都认为这是超智能机器新时代的黎明,但我们并没有像期望的那样快速或顺利地达到目标。
既然如此强大的模型可以在相对低成本的硬件上运行,这真的会改变什么吗?
我们是众多人,搜索引擎是发现事物的手段,因为即使有Usenet,人类也无法通过URL和链接在网上发现足够的信息,这就是真正的革命:链接是有用的,但不够。搜索引擎是我们迄今为止在网络上寻找知识的最佳工具,现在,大语言模型(LLMs)试图超越传统的搜索引擎,从网络内容中提取知识,比如,我们有很多关于某个地区野火的文章,但假设没有一篇关于该地区野火趋势的文章,大语言模型(LLMs)就可以尝试在相当长的时间范围内提取所有文章,以发现趋势。康拉德·盖斯纳的《世界百科全书》梦想。
好吧,大语言模型(LLMs)并没有杀死网络,而是吞噬了它。我们仍然是大语言模型(LLMs)几乎唯一有效的数据来源。
真正摧毁网络的是社交网络,它们作为专有封闭的花园,而非一个开放的Usenet,搭配一个用于保存后世或过于长篇/复杂内容的网络伴侣。摧毁网络的是,互联网服务提供商(ISP)不提供一个开放的家庭服务器,而是一个名为“路由器”的封闭盒子,即使它是一个功能有限的家庭服务器。如果有一个开放版本,使用IPv6,任何人都可以购买一个域名,并从自己的服务器上发布一个博客,使用现成的软件,自动生成RSS feed、新闻简报等。如果我们向大众提供这样的工具,原始的网络将会回归,但这意味着言论自由,而巨头和政客等更倾向于通过他们的平台来掌控公共话题,以隐藏他们不喜欢的大部分内容,并推广他们喜欢的想法…
搜索引擎索引被用作版权执法工具,这也严重损害了互联网,因为它为了维持信息不对称而制造了信息传播的稀缺性。
试试在开放的互联网上找到JLG设备/服务手册吧。我等着。
那些租赁的升降机之类的吗?就是这些吗?
https://www.google.com/search?q=site%3Acsapps.jlg.com+filety…
https://www.google.com/search?q=site:csapps.jlg.com+filetype…
这些工具无论如何都是必要的,我们还有YaCy作为例子,以及其他分布式搜索解决方案。关键是大多数人不会参与,因此只有商业解决方案才能获得足够的资源变得有用。
问题#1 – 要“保存它”,你首先必须定义你想要保存的理想化或某个时间点的网络。不要指望在这里能达成太多共识,尤其是在细节上。
问题#2 – 如果你不是地球皇帝或类似人物,在当今世界,你如何让你的理想网络在时间上保持稳定?
AI推理可以拯救它,因为它可以用于创建逆转“垃圾化”的工具。Cloudflare对这种“退出”方式关上了大门。
人工智能只是又一个被加剧财富不平等和过度货币化/无监管资本主义所利用的工具,它所触及的一切都变得更糟。它不是第一个工具,也不会是最后一个。
我认为,网络早已被人类的低效搜索引擎所杀死,这些搜索引擎无法或不愿进行过滤。现在我们发现,在人工智能聊天中使用稍长的提示语能获得更好的结果。那又怎样?
但如果没有YouTube的存在,我认为广告业务已经杀死了互联网。
开始规范访问人工智能提示的技术协议。
例如规范化的noscript/基本(x)html互操作性。或基于’curl’的简单API。
基本上,如果whatng垄断的网络引擎不再需要访问和使用“人工智能”,事情将开始显著变化。
我不明白为什么付费墙后的文章会被分享在这里。
他们毁了网络,而不是人工智能。
关于“数字排毒”趋势或年轻一代选择功能机而非智能手机,我一直好奇的是,为何媒体尚未找到逆转潮流的方法,利用这一趋势来探索在当前新闻难以销售的背景下实现盈利。24小时新闻已经存在了几十年,全球各地不断涌现的事件洪流令人疲惫,尤其是其中只有极小部分与你直接相关。如果他们能打造一款更具吸引力的“新闻/分析产品”,比如报纸或晚间新闻播报,与其他所有来源提供的内容形成鲜明对比,那将非常有趣。
很快就会有人开始像热蛋糕一样热卖模拟报纸。说到这,我好奇能让新潮青年在街上为热蛋糕支付多少钱。我称它们为“煎饼”……
所以是一个与新闻文章连接的推荐引擎。谷歌新闻已经存在。
情况恰恰相反。付费墙是网络和支撑它的广告公司摧毁出版商收入模式的结果。人工智能,它窃取并重新包装内容,会让情况更糟。
我不明白的是,为什么没有人真正想通这一点。我阅读了大量不同的新闻来源。如果我在《Podunk Picayune》上看到一篇感兴趣的文章,我愿意支付合理费用阅读,但不,我必须订阅。所以他们什么也得不到。
是的,直接分享存档链接就行。
根据指南,首选规范链接。如果付费墙网站与主题相关且有绕过方式,通常会被允许。
https://news.ycombinator.com/newsguidelines.html
https://news.ycombinator.com/newsfaq.html
完全同意,这里有一些无需付费墙即可阅读的内容 https://archive.ph/2021.09.10-164025/https://www.bostonglobe…
因为付费墙是可选的,至少对于像HN这样的群体来说。信息渴望自由。
不。所有伟大的事物终将结束——艺术运动、文化、国家等等——互联网的终结现在已经到来。
互联网是由电缆和其他硬件以及协议组成的,这些都不会消失。网络,作为互联网应用,似乎正在消亡,新闻组和其他互联网应用也已消亡,但互联网本身并未消亡或走向消亡。事实上,随着全球宽带的普及和未连接用户接入网络,互联网仍在增长。
如果没有谷歌等巨头强制执行,协议将消失。谷歌是二战后在网络上带来“和平”的“美国”。大型玩家只在符合自身利益时才遵循“你的”标准。
考虑安卓和苹果的移动应用。它们是无浏览器互联网的典型例子。只有当大公司看到其中有利可图时,才会出现广泛使用的标准浏览器。
付费墙肯定能拯救它
这仍然不如那些不断重复《经济学人》头条和文章的各种网红令人烦躁
无论如何,这篇文章是关于人工智能取代网络搜索,而不是“杀死网络”,我认为这意味着以某种方式删除或覆盖现有网页上的内容。或者生成如此多的垃圾信息,以至于普通人无法使用网络。
那些无法在没有“流量”的情况下生存的大型网站早已在很久以前就“杀死了”网络。付费墙才是正确的解决方案,而不是在内容中插入广告或在广告中插入内容。这意味着你的流量会减少,但这并不意味着你被“杀死”了。这只是意味着你停止了对访问你网站的过路人进行骚扰。
> 总之,这篇文章讨论的是人工智能取代网络搜索,而不是“杀死网络”
确实,标题有些夸张。但我们必须认识到网络正在衰落,因此我们放弃对它的维护。我们必须接受这一现实,因为网络的“魔瓶”早已打开超过30年。这种状况不会改变。开放网络对大型企业而言是障碍。大型企业希望掌控互联网基础设施以推广应用、人工智能等技术,但并不希望维持开放网络。
我们迄今为止所拥有的标准化网络,一直由谷歌监管,以便他们从我们身上获取广告收入。没有巨头来强制执行这样的标准,网络将像过去一样分裂。
[删除]
只需忽略这些平台。使用RSS订阅自己整理的网站/书签集合。点击阅读文章和论文的原始域名(通过这种方式支持创作者),并在该域名上自由浏览。
我已自行搭建了这样的系统,但确信这可以通过现成的开源软件实现。
适应这个系统需要一些时间。没有饱和度的视频缩略图,没有无限滚动,没有通知。一开始会觉得速度较慢且有些无聊。但很快就会成为一种福气,当你一个月后回到LinkedIn的动态或YouTube的算法网格时,会感觉像被狠狠揍了一拳。
我曾经是RSS的重度用户,那是在Google Reader时代。我喜欢用它来关注各种不同的博客。我不太确定为什么我停止使用RSS——当Google Reader关闭时,我切换到了其他可行的替代方案。
最近,我一直想重新回到这种使用网络的方式,因为我显然已经被平台上的滚动功能吸引,直到算法给我展示我想要看到的内容。
前几天,我最喜欢的网页开发博客(也是我主动寻找的少数几个博客之一)整理了一份精彩的网络性能资源和博客链接合集,并附带了一个相关的RSS OPML文件。这无疑是我重新回归网络辉煌所需的推动力。
https://infrequently.org/links/
但我确实需要付出努力去发现其他风格多样的博客。我真的很怀念阅读那些长篇、真实且涵盖多元主题的文章。
我从未停止使用RSS。从Google工具栏到JetBrains Omea,再到Google Reader,最后使用Feedly。自2013年起一直使用Feedly,强烈推荐。
不错,谢谢!
我认为OPML被低估了,RSS(Really Social Sites)与OPML(Other People’s Meaningful Links)的结合,或许能让开放网络重新成为好奇人士首选的社交媒体。
目前,我正在努力将更多OPML功能整合到我的RSS软件中。我设想了一种快速探索和发现来自已关注网站/订阅源的新链接/订阅源的方式。
> RSS(真正社交网站)
丰富网站聚合。
我必须告诉你,它有了新名字。
我必须告诉你,它没有。
RDF 网站摘要。
我是一个RSS用户,但最近作为RSS用户真是令人沮丧。所有我认为是“第一梯队”的、你真正想订阅RSS源的网站,要么不再提供RSS源,要么提供一个截断的RSS源,迫使你使用其平台(是的,我自建了morss,但并不总能获取到内容)。你只能依赖一些二级新闻网站,它们的订阅源中充斥着重复发布的 AP 内容,你甚至会在关注的多个订阅源中看到相同的内容。
而最大的问题是,没有人再创建新网站并实施RSS。似乎我关注的许多RSS订阅源之所以还存在,只是因为网站管理员出于某种原因尚未取消该服务;比如,这些链接出现在看起来像2007年互联网的残留网页上,而网站的其他部分却是现代化的。
这解释了为何RSS正在消亡。它曾是抛给社区的一块巨大的免费骨头。如今你再也看不到没有附加条件的免费骨头了,因为它们总会附带某种盈利模式的牵引力。每个人都希望你留在他们的网站上,以便向你展示广告。他们不希望你使用RSS阅读器获取内容却无需观看广告。
我完全同意你的观点。
一方面,我认为这很遗憾,我确实怀念某些(大型)网站上的订阅源,但另一方面,这让我更加珍惜小型网站、独立网站或开放网站。
这感觉就像在经历了二十年的“社交媒体”后进行的康复治疗。但如果让我说,开放网络本身就是社交媒体的终极形式。我提议将RSS更名为“真正社交网站”(Really Social Sites)。我已经在自己的软件中开始这样称呼它。
大量优质讨论内容因显而易见的原因从Reddit/Facebook/Twitter迁移至Discord,因为这些平台的可发现性较低,同时也能减少被喷子、AI爬虫机器人和剽窃者发现的风险。
这很好——如果你有邀请链接且喜欢Discord的界面。
但如果你更倾向于通过RSS订阅或阅读长篇内容,那情况就糟糕了。
天啊,在WhatsApp上进行复杂的对话很麻烦,在Discord或任何实时聊天工具上做同样的事情……
忽视问题并不是解决办法。互联网本质上是一个巨大的社交圈,如果没有足够的人加入,一个网站可能会很快消亡。我观察到不少小型社区因无人问津而关闭的例子,我童年时钟爱的某些网站也因同样原因消失了,连同它们曾 hosting 的所有内容一起消失。
问题在于:
软件/基础设施有成本:如果你想自行托管,维护工作会带来持续的压力。这种压力可能缓慢积累,但最终会耗尽你的精力。
发现问题:过去,人们习惯于手动分享链接和资源,通常在论坛上(我称之为“论坛生活”)。但如今人们更依赖平台推荐(从“直接谷歌搜索”开始)。如果你的内容/链接未被推荐,就无法触达更广泛的受众。此外,人们现在非常讨厌注册(以及记住/记录账号/密码),他们甚至不会尝试使用“陌生”的网站。
政府监管:政府不断出台法律法规,可能限制自建内容,要么通过增加自建难度,要么迫使网站进行自我审查(而大多数个人网站根本没有足够的管理员来执行)。
部分具备解决问题能力和专业知识的人,却以错误的方式“解决”问题。他们没有创建现代用户乐于使用的系统,而是试图“回到过去的方式”,却没有考虑人们为何最初放弃“过去的方式”。他们创建的软件可能对普通非技术用户相当不友好,但至少他们自己认为这很酷。
少数项目做对了,比如Mastodon,还有可能Blue Sky等。但这些项目仍然没有赚到很多钱和政治资本,这意味着它们仍然无法摆脱上述第1点,可能还有第3点。
总体来说,我认为问题不在于平台在利用互联网,而是大多数人只是“转向”了能让生活更轻松的东西。互联网终究是一种工具。
附言:若有人想解决社交媒体过度垄断的问题,我建议确保用户是“被迫使用”的,即普通用户,普通用户,普通用户,就像普通人约翰/玛丽·多伊那样。这样才能形成社交圈/网络效应,从而实现增长和持续发展。
Freetube是通过YouTube实现这一目标的方式。你只需获取RSS订阅源,避免无休止的滚动。
https://freetubeapp.io/
我担心 AI/机器人会成为阻碍正确 RSS 分发的因素。作者可能不希望机器人轻松访问他们的内容。也许需要付费墙?也许工作量证明可以解决这个问题?
这是少数人能做到的事,但不是大多数人。
随着开源软件在用户引导和用户体验方面的改进,可能会有机会。
如果你觉得是这样,那你可能在使用错误的工具浏览网页。
网络上那些奇怪、富有创造力、甚至有些疯狂的部分仍然存在且充满活力。只是如果你想再次找到它们,就需要离开主流社交媒体平台和搜索引擎。
立即删除所有社交媒体。这相当于尼奥拔掉插头,拔出喉咙里的管子。
说得好。有一个很好的搜索引擎可以做到这一点,也许你听说过?
https://marginalia-search.com/
😉
恰巧的是……
哈哈哈
我大概试过Marginalia……大概10次吧?每次都想得到小众搜索结果。到目前为止,我还没通过它找到有趣的网站。
我喜欢这个概念,希望它能成功!我订阅了Kagi;我重视搜索功能。
如果只是想找点有趣的东西/证明奇怪的网络依然存在,探索模式[1]可能是你需要的工具。
[1] https://marginalia-search.com/explore
这是朝着正确方向迈出的一步。感谢分享。
带回
网络
环
(但说真的,我认为我非常喜欢深入探索有趣的网络环。)
网络环的复兴正在发生,讽刺的是,推动这一潮流的人正是那些太年轻而无法真正记得它们的人。
其他网络也容易形成网页环,比如Tor和I2P。这两个网络中都能找到大量网页环。
预平台时代网络的问题在于内容发现的困难性;你的有趣内容可能只有少数人阅读。
平台的吸引力在于,像Twitter或HN这样的平台,你的内容有可能被“所有人”看到。病毒式传播虽有趣但并非关键;被那些你从未认识、也从未想过能吸引其注意的人看到,才更有价值。这将带来更强大的跨领域交流。
(垃圾信息是个问题,但类似的生物系统中也存在垃圾信息问题;开花植物会释放大量花粉,随后产生大量种子,其中大部分都不会结果。)
在谷歌成立的前五年,内容的可发现性并不是什么大问题。我们有来自数百万个来源的优质内容,只需通过简单的搜索引擎就能轻松发现。然后谷歌上市了,Facebook出现了,一切都变得一团糟。而且这还忽略了其他优秀的发现工具,从目录网站一直到网页环。1995年至2005年的网络在内容和发现方面确实相当不错。如今,少数几家大型科技公司通过封闭的生态系统控制了所有发现功能,且不愿让用户在自家平台外与网络互动。
阻碍我进一步探索这个想法的是:如何验证新互联网的贡献者不是平台或企业?
界限该如何划定?
谁来划定界限?
这是一个不完整的想法,但我的朋友提出了一个基于某种密钥签名机制的声誉体系。你获得一个密钥,你的朋友也获得一个密钥,你们互相签名对方的密钥。密钥可以作为信任或有效性的指标,表明个人的贡献是有意义的(或类似的)。如果你的朋友突然变成了企业的代言人,你可以撤销对他的信任。如果其他人没有与那个人建立自己的信任,当你的信任消失时,他们的信任也会消失。传递性信任。
显然,这个想法有一些缺陷,在某些情况下可能会被滥用,但我认为这是一个有趣的想法。
这不就是标准的PGP信任网络吗?
https://en.m.wikipedia.org/wiki/Web_of_trust
这听起来就像在社交媒体平台上关注他人,并仅阅读自己网络中的帖子。这正是我认识的大多数人使用Bluesky的方式。
它比Twitter的算法推荐更有效,但仍非万无一失,因为并非所有人都对愿意信任/追踪的内容有相同标准。
任何需要终端用户内化PKI的技术注定失败。
A) 界面不会足够直观。
B) 混蛋们总会找到漏洞。
C) 现实中没人会对别人说:“嘿,兄弟,你的公钥是什么?”
加密只是将本已困难的问题转化为密钥管理问题的机器。
一个插件。可信用户对网站的点赞/点踩和评分会被记录在数据库中。该插件会根据数据库中的信息,视觉上区分垃圾链接,以便其他人避免点击它们(或完全隐藏它们)。
类似于专门针对垃圾SEO网站的PiHole。
为什么特别提到那句话?似乎与内容质量无关。问题的一部分是,企业被建议生产有用的内容,但这样做的动机正在消失。这显然是负面的。
即使你能完美区分“真实用户”与垃圾内容制造者,只要激励机制存在,老一套的玩家仍会继续老一套的操作。他们只会把“真实用户”当作外衣穿上。几乎更糟糕 :/
只要谷歌能通过搜索引擎和浏览器把控互联网,这种情况就永远不会发生。即使你能找到足够多的核心用户突破限制并创建达到临界质量的东西,用户驱动的索引也无法扩展。任何试图解决问题的人都会立即成为新的谷歌。
你可以尝试在Tor上寻找论坛。但除非你是吸毒者或犯罪分子,否则这没什么用。
大语言模型(LLM)回复。至少把破折号去掉吧,拜托。
我以为他是在开玩笑
> 一个将用户、隐私和真实表达放在首位的
用户并不那么特别。
没有人注意到亲帖是大语言模型(LLM)的垃圾吗?
成群的三个字符组成的垃圾信息(开放、混乱、充满真实声音——被过滤、限制和埋没——用户、隐私、真实表达)
这不仅仅是X——这是Y类型的句子结构空洞的营销风格写作,毫无实质内容(也许这不是关于拯救旧网络。或许是时候建造一个新的了)
当然,还有破折号,它们可能不会单独暴露LLM,因为它们存在于文学作品中,而且有一小部分人喜欢在网络评论中使用它们。但当它们与其他粗糙的标点符号一起出现时,仍然是一个强有力的迹象,尤其是当它们数量众多时。
这是讽刺吗?还是恶作剧?令人担忧的是,每个人都对它做出回应,仿佛这堆废话背后有人类思考。
通常情况下,大语言模型(LLMs)不会在长破折号和周围的单词之间留空格——我应该指出,这是正确的拼写。人类往往会在不应该的地方留空格,就像你引用的例子一样。我不知道这是不是人工智能,但如果你要求人工智能使用一个包含长破折号的句子,它不会留空格。
在风格偏好领域,“正确”一词有何意义?芝加哥风格不使用破折号两侧的空格。美联社(AP)则使用。牛津风格遵循芝加哥风格,而英国其他地区则使用带空格的短破折号。对于打字——以及由此延伸的键盘输入——这一久经考验的惯例(如《加纳用法手册》所记载)似乎已成定式。芝加哥风格总是给省略号留空格……而美联社风格则不会,无论它与句号放在一起看起来多么难看。……谁是对的?
我看到大语言模型(LLMs)在这种格式/风格上有些变化,所以不能完全相信它。不过,也不需要完全相信它。大语言模型(LLMs)往往对破折号进行一种独特的滥用:
– 在所有不该出现的地方;几乎所有情况都可以用逗号、句号或完全省略来替代,且不会影响风格或语气
– 在少数可能需要的地方缺失,尤其是在需要用括号补充说明时
– 夸张、过度且毫无意义
别忘了分号。正常人不会用那个。
我不确定自己算不算正常,但我会定期使用分号,尽管频率不高。
如果你在Hacker News上,那你就不正常。
只要你知道如何使用分号,它们就没问题。
我没有注意到,因为我无意识地快速浏览那些看起来杂乱的评论,而不去评估它们是否是人类写的,只阅读更有趣的评论。
它已经存在了,叫做Gemini协议:https://geminiprotocol.net/
Gemini是朝着正确方向迈出的一步,但它并没有一个免疫系统来保护它免受网络上发生的事情的影响。也就是说,当Gemini变得非常成功时,白痴和机器人开始涌入其中会发生什么。
我猜Gemini是一个实验大胆想法的好起点:
– 我们需要某种信任网络系统。因为大多数时候,我们不感兴趣与超过1或2个跳转距离的代理互动或暴露。
– 抱歉,但我们需要某种“纳米”支付系统。如果一个机器人想消耗我服务器上的资源,也许可以接受,但它们至少要为此付费。我们今天已经为使用工作量证明挑战的网站付费,我宁愿把这笔钱给托管者。
我将我的网站迁移到Gemini,去年年中完成。
客户端:
https://en.wikipedia.org/wiki/Gemini_(协议)#软件
一些查找内容的链接:
gemini://sdf.org
gemini://gem.sdf.org
gemini://gemi.dev/xkcd/
gemini://warmedal.se/~antenna/
gemini://gemini.circumlunar.space/capcom/
gemini://skyjake.fi/~Cosmos/view.gmi
gemini://calcuode.com/gmisub-aggregate.gmi
gemini://tinylogs.gmi.bacardi55.io/
gemini://sl1200.dystopic.world/juntaletras.gmi
gemini://tilde.team/~khuxkm/leo/
gemini://raek.se/orbits/space-elevator/
gemini://fediring.net/
你有读者吗,还是只是你自己看?
我不明白。上面的客户端链接列出了可以阅读Gemini网站的客户端。
他们想知道你将网站迁移到Gemini后,是否有其他人查看/阅读它,还是仅你自己在阅读。
>他们想知道你将网站迁移到Gemini后,是否有其他人查看/阅读它
我不知道。我没有记录或跟踪任何访客。
>我们所熟知的网络——开放、混乱、充满真实声音的时代已经一去不返。自由
在一家手动精选首页内容的网站上发表评论….
网络已过时。未来获取某一主题信息的第一步,或许也是最后一步,将是人工智能。无需筛选广告、论坛纷争、标题党博客文章、评论等……只需将信息快速直接地编译到大脑中。是的,有时信息是错误的,但有时在开放网络上找到的信息本就是错误的,只能接受。
我发现,当人们怀念旧时的网络时,他们真正渴望的其实是一种能够与他人建立联系、以真诚的方式看到他人出于纯粹兴趣创作的内容的方式,而非出于表演性、模仿性或其它动机。
从理论上讲,社交媒体本应是这样的,但人们不断追求认可的欲望或倾向于制作类似于迷因的内容,这反而影响了他们作品的质量,使其带有机械化的风格,很少能让人感受到真实或符合人性。你看到的不是人们的真实个性,而是他们的“面具”。
因此,问题并非源于技术缺陷,而是文化问题:人们不再天真地分享那些无法完美满足自我膨胀需求的内容。
直到同一款AI开始在输出内容中推销广告和其所有者宣扬的特定观点……这必然会发生(广告部分已成定局,其他部分也即将实现)。所有这些模型的经济性都无法正常运作。未来将会出现重大收缩。
我们中的一些人已经尝试过本地大语言模型(LLMs)。可以肯定的是,与在线模型相比,我可以在我的硬件上运行的模型总是相形见绌。但也许随着时间的推移,可以在本地运行的模型会变得足够好。
或者,也许苹果或 Kagi 会托管一个没有内置货币化功能、不会歪曲答案的大语言模型 (LLM)。
你可以运行这个模型,但需要资源更丰富的人来训练它。
大多数人工智能工具都在网络上运行,所以这个问题提得不好。不值得打开这篇文章。
我认为没有什么比隐藏“拒绝所有cookie”按钮并用弹出窗口覆盖整个页面直到你接受更糟糕的了。所以目前我们还算安全。