Stack overflow 几乎已死

四个月前,我们曾问过一个问题:大语言模型(LLMs) 是否让 Stack Overflow 变得无关紧要?当时的数据表明,答案很可能是 “是的:”

每月在 StackOverflow 上提出的问题数量。数据来源:此 Gist

此后,Stack Overflow 的情况每况愈下。新数据显示,提问量几乎枯竭:

问题数量已下滑至 2009 年 Stack Overflow 推出时的水平。来源:Stack Overflow Data Explorer (SEDE) / Marc Gravell on X Stack Overflow Data Explorer (SEDE) / Marc Gravell on X

这张图是由 Stack Overflow 史上十大贡献者 Marc Gravell 分享的。让我们仔细看看这些数据:

2014 年左右开始下降

有几件事很突出:

  • 2014 年:问题开始减少,也是 Stack Overflow 显著提高版主效率的时候。从那时起,关闭问题的速度更快了,关闭的问题也更多了,“低质量 ”问题也被更有效地删除了。这与我的记忆不谋而合,我当时觉得网站版主关闭合法问题是一种权力寻租。我大概就是在这个时候停止提问的,因为网站感觉不受欢迎。
  • 2020 年 3 月:由于大流行病引起的封锁和被迫远程工作,网站流量大增。开发人员不再询问同事,而是通过谷歌搜索和访问 Stack Overflow 寻求帮助。
  • 2020 年 6 月:问题开始减少,速度比以前更快。尽管我们当时并不知道,但这距离 ChatGPT 推出还有两年时间!
  • 2021 年 6 月: Stack Overflow 以 18 亿美元的价格出售给私募股权投资者 Prosus。事后看来,创始人杰夫-阿特伍德(Jeff Atwood)和乔尔-斯波尔斯基(Joel Spolsky)的出售时机近乎完美,赶在了终极衰退之前。
  • 2022 年 11 月:ChatGPT 一问世,提问数量就迅速下降。ChatGPT 的速度更快,而且它是在 StackOverflow 数据的基础上训练出来的,所以答案的质量也差不多。此外,与 StackOverflow 版主相比,ChatGPT 会礼貌地回答所有问题。
  • 2025 年 5 月:每月的问题数量与 2009 年 Stack Overflow 推出时一样少。

元素周期表今年 1 月,我曾问过大语言模型(LLM)是否正在让 Stack Overflow 变得无关紧要。现在我们有了答案,很遗憾,答案是 “是的”。现在的问题似乎是 Stack Overflow 何时会停止运营,或者网站所有者会以相对低廉的价格出售网站,而不是是否会发生。

即使没有大语言模型(LLMs),StackOverflow 也有可能最终淡出人们的视线–也许是受到修改政策的影响,也许是 2014 年开始的其他原因。大语言模型(LLM)无疑加速了它的衰落。对于一个曾在 2010 年代初帮助众多开发人员 “摆脱困境”–同时成功地将帮助互联网上其他开发人员游戏化–的网站来说,这确实是一种耻辱。

我当然会怀念在互联网上有一个可以提问和获得帮助的空间–不是来自人工智能,而是来自其他人类开发者。虽然 Stack Overflow 的日子可能已经屈指可数: 我相信我们会看到开发者聚会和互相帮助的空间继续流行–无论是 Discord 服务器、WhatsApp 或 Telegram 群组,还是其他形式。

你也许感兴趣的:

共有 212 条讨论

  1. 我衷心感谢 stack overflow 社区,他们一直以来都非常友好、乐于助人,而且基本上都是免费工作。作为一名自学成才的开发人员,我从 8 岁开始就通过 SO 学习如何编写代码,提出了数百个问题,并回答了更多问题。许多需要 2-3 天才能修复的 bug 最终都能通过它找到答案。但现在,ChatGPT 在几分钟内就能做到这一点……所以这样最好!

    1. 我们的假设是,随着时间的推移,情况会有所改善,但我的经验中最大的不同是,我从 SO 得到的帮助在绝大多数情况下都是有效的,而我使用过的各种大语言模型(LLMs)却经常产生无法使用、误导性或不可靠的结果,而且随着复杂性或稀有性的增加而增加。随着以实际经验为支撑的人类驱动型知识库被依赖于此类输入的模型推断所取代,我对其中长期影响感到担忧。很多人因为各种原因对 SO 感到失望,回到了 SO 在其顶峰时期所解决的无益行为上(他们不再在 newslists 和 irc 频道上进行死胡同和火焰大战,而是在随机的 subreddits 和 discord 服务器上进行)。现在,如果我们在经历了堕落的大语言模型(LLM)之后又绕回来,却发现没有什么可以绕回来,那该怎么办?

      1. 就我个人而言,我已经对 ChatGPT 产生不存在的 npm 软件包或不存在的软件包导入的幻觉感到非常厌烦了。

        1. 那些幻觉中的库存在于大语言模型(LLM) 生活和工作的未来。你只是还没有及时赶上而已。)

        2. 不过,你可以要求它写出那个缺失的库!在未来的某一天,你也许可以要求它编写整个软件包并自行发布。

          “哦,对不起,这个软件包还不存在,但它应该存在。稍等… 好的,现在试着安装它”。

          1. 我遇到过几次这样的情况,也是这么做的。它幻化出一个 js、python 或 microropython 软件包,我在查找或使用它时会感到很烦,因为它缺少我明确指出需要的功能,或者它根本就不存在,然后我就让它从头开始为我编写整个程序。我已经不再使用 ChatGPT 了(在过去几个月里,他们的免费模式已经变得非常糟糕),但通过 AI Studio(前 API)免费提供的 Gemini 2.5 Preview 通常可以胜任这项任务。

            最近,当这种情况发生时,我让它编写了一个 SF2 加载器/解析器/播放器和一个与之兼容的 MIDI 解析器/“中继 ”库,以便在 WebGL 游戏中使用。它对 ABC 符号足够熟悉,你可以让它写一首歌,然后再写一个从修改后的 ABC 符号到 MIDI 的转换器。它可以在 WebGL 中轻松生成带有单个按键的木琴模型坐标,并将其连接到 SF2 模块,根据敲击的按键来演奏音符。我们可以根据用户的交互操作,轻松实现切换音轨上的乐器或更换打击乐音轨等功能。

            这并不值得为它建立一个完整的软件仓库并加以记录,因为当我用它做成一件事时,我就证明了做这件事是微不足道的。

        3. 获得良好的服务。在你的旧游戏机上运行?

          1. 你是在暗示他在游戏机上运行 ChatGPT 吗?

            最先进的模型不断产生废话,即使我发现它们普遍有用。你的盲目炒作只会让人们更加怀疑它。

          2. 也许在被炒作冲昏头脑之前,至少应该了解一下网络服务和本地应用程序之间的区别。

    2. 我想这是我第一次听到有人用 “善良 ”来形容 stack overflow 社区。通常情况恰恰相反: “我问了一个问题,却收到了 30 个问题,问我为什么要这么做“,或者 ”我的问题被无缘无故地关闭了”。

      这简直是我上过的最直白、最咄咄逼人的网站,而不是像《4-Chan》那样直接的巨魔网站。

      1. 我为几个标签回答问题,了解在这些标签上回答问题的其他人的风格,而且我确实把我的回答者视为善类。他们都是。

        这并不意味着你会认为我们对你个人很友好。我们的目的是建立一个可搜索的问答知识库并传播知识。有些人在提问时会产生误解,以为我们是来帮助他们的。为一个人免费工作,而我们不是为了这个。我们是为成百上千的搜索者撰写答案。

        误解的提问者会显得过于自以为是。

        从实际效果来看: 误解的人不会标记他们的问题,或者标记错误。他们发布的截图充满了文字。他们不会在现有的知识库中查找类似的旧问题,或者坚持认为即使是略有不同的问题也有很大区别。所有这些都相当令人反感,而且常常令人费解。你怎么能在请求学科专家帮助的同时,又坚持认为自己比专家更清楚自己的问题是否与另一个问题重复呢?

        1. 你怎么能在请求学科专家帮助的同时,坚持认为自己比专家更清楚自己的问题是否与另一个问题重复?

          这部分很简单,我读了那个 “重复 ”的答案,它并不适用于我的问题:)

        2. 从字里行间可以看出这一点。当然,没有人是自己故事中的反派。网络社区的成员如果驱赶他人,往往只是对自己造成的影响视而不见–在 Stack Overflow 的例子中,这就是一种可悲的生存影响。

          1. 呸。我自愿做 x,如果你试图在字里行间读出一些义务,让我也自愿做 y,那你可以自己做 y。如果你希望我善意地帮助一个我不愿意帮助的人,那就自己去做 y,以示善意。

            没有人付钱让我们这些答卷人做我们该做的事。志愿者的关键特权是由志愿者自己选择志愿服务的内容。

            1. 可能是对的,绝对有道理,超级烦人,主动赶走用户。

              1. 大多数用户不会问。他们搜索。

                那些提问却无人问津的用户并不特别吸引人。

        3. 在我看来,你也是问题的一部分。当然,这已经不是我的问题了,因为我已经不再为那里做贡献了。

      2. 同意!十年前还不是这样。但它已经演变成了一个破坏者社区,他们似乎乐于批评提问的方式,而不是提供解决方案。

      3. 问题已结束;这里有另一个问题的链接,听起来隐约相关,但实际上并没有解决你的问题。

        不过说真的,我很想看到对 SO 语料库进行情感分析,按标签对语气进行分类。

        1. 我已经这样关闭了。一位提问者抱怨说,他提出的关于一种语言中 base64 编码的问题与我发现的重复问题不一样,因为所使用的语言是另一种语言。他认为 “大致相关”,但他问这个问题正是因为他不知道。

        2. “问题得到解决 “并不是在 Stack Overflow 上发帖的正当理由。在发布之前,您应该已经做了足够多的分析,如果您的问题得到了回答,您可以自己解决根本问题。当您被链接到一个重复的问题时,是因为链接者真诚地相信,只要您的问题符合网站的标准,其他问题的答案也会回答您的问题。这也意味着您有责任忽略无关的细节、阅读答案、自己尝试应用答案等。

          如果另一个问题实际上与您的问题不同,您需要编辑问题以明确这一点–不是像在论坛帖子中那样添加 “编辑:”部分,而是修改措辞以直接明确您在寻找什么以及有何不同。这可能意味着要修改输入或所需输出的规格。

          有时这很难,馆长也会犯错。最令人沮丧的是,两个完全不同的问题完全有可能用相同的关键词进行合理描述。我个人就曾费尽周折才把 https://stackoverflow.com/questions/9764298https://stackoverflow.com/questions/18016827 区分开来,同时还解释了 https://stackoverflow.com/questions/6618515 其实和第一个问题是一样的,尽管措辞不同。

          不过,策展人更经常做对。不仅如此,我们中的一些人还不遗余力地为初学者创建人工问答 (https://meta.stackoverflow.com/questions/426205),为初学者永远不知道如何解释的问题答疑解惑,并在问答两方面都付出了巨大的努力。Python 标签中的一些流行例子:

          “我遇到了缩进错误(或 TabError)。我该如何解决?(https://stackoverflow.com/questions/45621722)是为了替换 “IndentationError: unindent does not match any outer indentation level, although the indentation looks correct”(https://stackoverflow.com/questions/492387)和其他几个例子而写的,并在那里说明了理由。

          “询问用户输入内容,直到他们给出有效回复”(https://stackoverflow.com/questions/23294658)

          “为什么 “a == x 或 y 或 z ”的值总是为 True?如何将 “a ”与所有这些进行比较?(https://stackoverflow.com/questions/20002503)主要是作为有机 “如何测试多个变量与单个值是否相等?”的替代而写的。(https://stackoverflow.com/questions/15112125)的替代品,因为发现后者不能很好地帮助初学者(最初的示例很不清楚,不过后来有所改进)。

          1. > “您的问题得到解决 ”不是在 Stack Overflow 上发帖的正当理由。在发帖之前,您应该已经做了足够多的分析,如果您的问题得到了回答,您可以自己解决根本问题。

            你对一个轻松玩笑的回应说明了你对这个网站的热情。无论如何,感谢您花了这么多时间真心帮助有需要的人。

            评估一个用户在发帖前花了多少精力进行研究真的非常非常棘手,也很难量化。我还亲身经历过,以我的经验看来显而易见的事情,别人(尤其是初学者)并不总是以同样的方式看待同一个问题。就我觉得自己有资格提供帮助的(少数)领域而言,还有成百上千的其他领域让我望尘莫及。如果一个问题被当作重复的问题而有效地关闭(似乎没有什么追索权),这既令人沮丧又令人沮丧,以至于我经常在其他地方继续我的旅程。

            1. > 评估一个用户在发表文章前花了多少精力进行研究真的非常非常棘手,而且很难量化。

              这里还有一个常见的误解–多年来我自己也有这样的误解,社区多年来也以拙劣的封闭理由表达了这种误解,但最终得到了修正。或者也可以说:随着时间的推移,我们意识到有些东西并不适合这个目的。

              正如你所说,仅仅通过观察问题,你无法轻易评估或量化这项研究。但这恰恰是它实际上并不重要的原因:因为在一个正确的问题中看不到它。

              研究的目的不是为了赢得提问的权利。而是为了优化问题的格式。如果问题符合标准,那么它就是符合标准的;进行研究只是达到这一目的的一种手段,它之所以是 “预期的”,是因为它通常是必要的。

              因此,举例来说,如果你的代码不能正常工作,你应该先自己进行调试,直到找到真正导致问题而你又不知道如何解决的部分。然后,你不能谈论调试过程,也不能展示代码中无关紧要的细节。取而代之的是,尽可能将不工作的代码隔离到 MCVE、SSCCE 或其他你喜欢的名称中(我们的文档中包含建议:https://stackoverflow.com/help/minimal-reproducible-example),然后直接谈论示例。

              >将一个问题作为重复问题有效地关闭……既令人沮丧又令人沮丧

              为什么?有人直接给你指出了一个已经存在的答案。比起让别人从头开始写答案,你更快就得到了帮助。这就是重点所在。

              是的,这确实意味着你需要根据自己的具体需要,从抽象的语境中应用对同一问题的解释。但无论如何,这应该是我们期望的一部分。因为我们对促使你提出问题的问题并不感兴趣–事实上,我们根本不要求你真的有问题。我们感兴趣的是一个问题的答案是否能帮助处于类似情况下的每个人。

              但我们不提供论坛、服务台或调试服务。

              >(似乎没有什么追索权)

              碰巧的是,我曾经问过一个问题,但被当作重复问题关闭了。如果我回过头去看,在顶部的蓝色横幅中仍然显示着这样的建议:

              > 这个问题在这里已经有了答案: (另一个问题的链接)

              > 您的帖子与一个类似问题相关联。如果该问题没有回答您的问题,请编辑您的问题,突出显示关联问题与您的问题之间的区别。如果编辑了您的问题,您的问题将被审核,并可能重新开放。

              “编辑您的问题 “链接到 https://meta.stackexchange.com/questions/21788/how-does-edit… .

              > 了解有关重复问题的更多信息以及您的问题被关闭的原因。

              链接:

              https://stackoverflow.com/help/duplicates https://stackoverflow.com/help/closed-questions

              请注意,即使是版主也无法控制此表单信息–他们最多只能向公司员工请愿要求更改。关闭问题 “链接会详细说明关闭原因,并最终链接到 ”如果我不同意关闭问题怎么办?如何重新打开?(https://stackoverflow.com/help/reopen-questions),其中还提到了将此事提交元网站的选项。

              如果我要编辑该问题,表单上现在有一个 “提交审核 ”的复选框,弹出的附加帮助包括一个指向 https://stackoverflow.com/help/review-reopen 的链接。如上述文档链接所述,该问题将被置于审核队列中,让那些可以重新投票的人更加关注。

              (揭秘:实际上,我是用我的金徽章特权自己关闭的–要么是我最终发现了我在提问前无法发现的问题,要么是有人在聊天室或其他地方向我指出了这一点。我想要的问答标题是合理的,但与我想出的标题大相径庭。所以现在更容易找到了)。

          2. > “您的问题得到解决 ”不是在 Stack Overflow 上发帖的正当理由。在发帖之前,您应该已经做了足够多的分析,如果您的问题得到了解答,您就可以自己解决根本问题。

            如果我能自己解决问题,你认为我为什么还要提问?

            这听起来可能是个愚蠢的问题,但你所描述的情况正是我从不主动与 SO 互动的原因(从不提问、回答,也不向上投票)。要么我想找的东西已经在那里了,要么我就完全忽略了这个网站。

            也许这就是它正在消亡的原因。毕竟,它并没有那么有用。

            1. >>在发帖之前,您应该已经做了足够多的分析,如果您的问题得到了回答,您可以自己解决根本问题。

              >如果我能自己解决问题,你认为我为什么还要提问?

              我们希望您能够分析问题,直到您提出一个具体问题,得到答案,并在得到答案后解决问题。

              也就是说:我们不会为你做分析。我们会填补你的知识空白。但你必须找出差距在哪里。

              > 要么我想找的东西已经在那里了

              我们的目标是最大限度地提高这样做的几率(并确保你能及时找到你要找的)。当你没有找到时,你可以提供所缺内容的问题部分。但反过来,这样做也是为了提高下一个人及时找到你的问题的几率–并理解它,同时确信你也有同样的问题,并阅读了答案,进而解决一个可能非常不同的问题。

              1. > 我们希望您能够分析问题,从而提出一个具体的问题,得到答案,并在得到答案后解决问题。

                > 也就是说:我们不会为你做分析。我们将填补你的知识空白。

                我明白了。这样就说得通了,我误解了你最初的回复。

                尽管如此,很多时候我确实找到了我要问的具体问题,但问题却因为重复而被关闭(或者不管你用的是什么行话),但现有的已回答问题由于某种原因并不完全是我要找的。这其实不利于我与网站互动,而且可能会让我的时间浪费得更多。

                > 我们的目标是最大限度地减少这种情况的发生(并确保您能及时找到所需的信息)。

                很多年前,这种情况比较常见。我不知道为什么,但我已经很久没有在 SO 上找到我想要的答案了。

                > 当你没有找到答案时,你可以通过提供问题的缺失部分来提供帮助。但反过来说,这也会增加下一个人及时找到你的问题–并理解它的机会,同时确信你也有同样的问题,并阅读了答案,进而解决一个可能截然不同的问题。

                我想我可以。但提出一个有意义的问题需要付出努力,而且我也不知道当权者是否会认同我的想法,认为这个问题是有意义的,或者这个问题会被标记为与其他类似问题重复。这并不鼓励参与。

              2. 你的观点完全有道理,而且听起来就像某个 SF 乌托邦中的机器人霸主:冷酷无情,严格遵守自己的程序规则。正如另一位评论者所指出的:你说得很对,我们也明白你的意思。但也正因为如此,除了因果搜索之外,我多年来都不再使用 SO。让我来做一个不准确的比喻:安全,如果做得完美,就不会让任何人取得任何成就。

                1. 不得不重复说同样的话会让人感到疲惫。我真不该参与这些话题,而应该在博客上写写。

          3. 即使你–以及 SO 所采取的立场–是正确的,但这并不能抹杀一个事实,那就是绝大多数用户都不喜欢这种礼仪。

            正确并不一定会带来人气或成功。很多时候,谦逊、耐心和善意才是关键。

            1. 我认为,SO 对用户的吸引力(除了当你找到愿意帮助你编程的人时)还在于,它也是权力者自恋的供应源,由于 SO 的把关政策,权力者可以最大限度地利用这些供应源。

              1. 看到有人用 “自恋 ”这样的字眼来形容我的朋友们,尤其让我感到痛心,因为我的朋友们自愿花费大量时间,努力礼貌地对待成群结队的其他人,而这些人显然根本不关心他们想要完成的事情,而且似乎认为他们与有提交表单的网站进行互动的惯用方式是唯一存在的方式。

            2. 根据我的经验,绝大多数人反对的是别人告诉他们不能随便问他们想问的问题,而不是反对所使用的具体措辞。

              我们不允许任何人使用侮辱性语言;我们希望彼此都有耐心;我们在评论中使用 “请 ”和 “谢谢”(即使我们在提问中删除了这些词语)–如果您发现其他情况,请标记出来;版主会严肃处理违反行为准则的行为。

              但是,这些似乎都没有起到任何作用。人们带着对礼貌的期望来到这个网站,而这种期望根本无助于让人们停止做他们不该做的事情:

              https://meta.stackoverflow.com/questions/366889 https://meta.stackoverflow.com/questions/368072 https://meta.stackoverflow.com/questions/373801 https://meta.stackoverflow.com/questions/334870

              同时,之所以不要求人们在评论中解释为什么要给某个问题打降级票,一个重要的原因是,我们曾经遇到过一些似乎对规则不感兴趣的 OPs 在回复中直接进行谩骂的情况:

              https://meta.stackoverflow.com/questions/357436 https://meta.stackoverflow.com/questions/352575

              粗鲁无礼的情况到处都是,真的:

              https://meta.stackoverflow.com/questions/326494

              相关链接:https://meta.stackoverflow.com/a/309018/523612

              (当然,一旦开始假设谁是或不是特别敏感的人,所有这一切都会爆炸:https://meta.stackoverflow.com/questions/366665)

              1. 真是讽刺。多年来,你们一直在推行人类交流的非人性化(例如,基本的感激和礼貌是禁忌),而当人工智能出现,人们更喜欢它而不是你们的非人性化平台时,你们却提出了反对意见。

          4. 我最后一次使用它是在问一个数学问题,这个问题有点超出我的能力范围。我已经花了几个小时研究这个问题。问题的部分原因是我知道我不知道正确的术语,但我可以详细描述问题。我在 SO 上提问,得到了一个略带讽刺的评论,回答了一个错误的问题。虽然这给了我一个正确措辞的线索,但在某种程度上,我得到了我的答案。但一般人的态度和你的态度都是 “你为什么要问这个问题?”

            我是在成为程序员之后才开始问这个问题的,而且我更习惯于使用文档或阅读源代码来寻找答案。我曾多次参加特定语言的邮件群组和 IRC,它们要友好得多。至少我不会把任何问题当作愚蠢的问题。

          5. 如果整个互联网都在说你充满敌意、咄咄逼人、难以相处,那就不要再解释为什么你是对的,而应该开始向内看。

            1. 作为 Stack Overflow 的用户,我没有责任让 Stack Overflow 成为一个让大量用户发布和浏览大量内容的网站。

              当你收到大量来自他人的 “合作 ”请求,而这些请求与你想要实现的目标截然不同时,“充满敌意、咄咄逼人、难以合作 ”是正确的。

              我不会向内看,因为客观地说,我在这里并没有做什么道德上的错事。如果人们认为我 “充满敌意”,那也没关系,因为我礼貌地告诉他们不应该做什么,而他们却认为无论如何他们都有权利这么做,因为他们这么做会对我真正关心的事情造成伤害。

              但我不同意选择 “咄咄逼人”。这纯粹是一种防御姿态。

              Stack Overflow 的社区正在努力创造一些有用的东西,而不是试图对任何人造成伤害。因此,该社区有权拥有和追求与他人不一致的目标,而且不应仅仅因为其他人不认同这些目标,或者因为他们想利用 Stack Overflow 的时间、空间和其他资源做一些不同的事情,就要求他们改变这些目标。

              该社区是一个独立于公司(Stack Exchange 公司)的实体。该社区对公司没有任何亏欠,因为它没有得到任何报酬,只是被利用来推动流量和广告收入,而他们的内容则为 AI 提供养料。

              1. 你是一名志愿者。你可以不做志愿者。如果这份工作正在侵蚀你的心理健康,而你又没有足够的情感能量以同理心的方式投入到工作中,那么我认为对每个人来说,更健康的选择是停止志愿服务,让新来的人以同理心来处理这份工作。

      4. 曾经有一段时间,这真的很好。就像真正的好和有用。但随着时间的推移,它最终变成了你所描述的那样。但在谷歌结果中,仍有无数例子证明 SO 的实用性。我在 2012 年停止提问,2015 年停止回答问题。不过在此之前,它还是一个非常有用的工具。

      5. 是的,我相信这是阿特伍德铁腕无废话政策的直接结果。在某种程度上,这很好……我们不想让它变成雅虎问答,不是吗?我想大家都忘了这一点。

        但是,正如你所提到的,他们在用药方面太过分了。

        不,你不能纠正这个拼写错误,难道就没有其他(更多字符)可以改进的吗?真的假的?

        1. >不,你不能纠正这个拼写错误,难道没有其他(更多字符的)东西可以改进吗?WTF,真的吗?

          我同意这种抱怨是合理的。问题在于,系统希望非特权用户的编辑内容能得到三位特权用户的排队审核(这样人们才会真正关注,破坏行为才不会几个月都无人问津),所以这样做的目的是为了限制对这一资源的消耗。

          您可能会对我对 “审阅者过多 ”的回答感兴趣!或请求改进建议编辑队列中新审稿人的入职指导 “的回答 (https://meta.stackoverflow.com/a/420357/523612)。

    3. 对《战略》的看法不一。它很有帮助,但也是一个让人害怕发帖的网站,因为里面都是互联网上最让人无法忍受的人,如果您想得到帮助,就必须忍受他们的谩骂。

      现在,chatGPT 为您提供了同样的帮助,却没有谩骂。

      1. 下一个人工智能完全需要更加尖酸刻薄,让人感觉更像是在和真正的 “thinkperts ”打交道,这些人自以为是专家,即使他们的答案明显是错误的。

        1. “你是《辛普森一家》里的漫画书男主角。你对 _____ 语言非常了解;事实上,你认为自己是这方面最重要的专家。您从百忙之中抽出时间来回答下面的问题,以帮助那些不识字的人……”

          1. >哦,痛苦啊……要向一个可能认为 JSX 是新的男孩乐队的人解释 React 的基本概念,真是痛苦不堪。不过也好。为了人类的利益,或者说至少是为了保留开发人员仅存的一点良好做法,我还是低下头来回答你的问题吧。

            React 中的钩子和组件就像限量版的《Radioactive Man》和周日漫画中的垃圾一样不同。

            […]

            如果你在编写 React 时还不了解这两者的区别,那么请看在斯普林菲尔德所有邪恶之物的份上,离开键盘,去读读 React 的官方文档。读两遍。也许是三遍。

          2. “请务必编辑原始问题,使其更符合你的答案”

    4. 你是在说 Stackoverflow 吗?每次我提出一个详细的问题,它都会在几分钟内被关闭。

      我并不惊讶它即将被淘汰。

      1. 我在 SO 上问过几十个问题,从来没有一个被关闭过。我经常听到你的感慨,但不知道是我的经历更常见,还是你的经历更常见。

        我有 3 个问题被社区机器人当作废弃问题删除了,但因为这些问题都是一年前提出的,所以我也不在乎。

    5. 直到{流行编程语言}有了全新的版本,出现了突破性的变化,而且没有新的正确答案可供训练。

      1. 这些模型可以找出它们从未见过的语法和语言特征。用你自己编造的语言的一些代码片段试试。这有点不可思议。

        1. 他们可以隐含地假定你编造的语言是为了方便母语使用者使用而设计的,从而将他们对 “代码 ”的现有理解应用到其中,当然可以。

          1. 是的,这是它的一部分,但它也可以正确地推理出这种语言被设计成难以理解的。如果你尝试这个练习,它会列出它认为每个陌生语法可能是什么的推理,其中一种方法是引入其他语言的类比,包括其他深奥的尝试。如果你给它一些更有创意的东西,它就会从其他学术领域进行推理,找出解决方案。

            这也是一个很好的检查方法,以确保你没有不小心把东西做得太简单或与其他语言相似;这一点会立即被发现。

    6. 多年来,我从 SO 那里得到了很多宝贵的建议。与大语言模型(LLMs)当然有重叠的地方,但经常会有一些问题在网络上没有公布答案;SO会把懂行的人带出来,他们会创造出以前不存在的解释。几天前,复古计算领域有人在一台 1983 年的 Radio Shack 盒子上安装了银行开关……这种东西在任何地方都没有发表过,直到一个曾经为那台盒子编写游戏的人在《SO》上回答了这个问题。

    7. > 但现在 ChatGPT 几分钟内就能做到这一点

      但它是根据 stackoverflow 数据训练出来的?几年后,当数据越来越过时时会发生什么?到那时,它从哪里获得知识?

      1. 他们正在向 GitHub 中的工作代码学习,IDE “副驾驶”…

        1. 但你先验地不知道在 Github 上找到的代码是否 “好”,而且它也没有附带方便的解释。数据的质量要差很多很多。

          1. 有道理,但大型、流行、维护良好/健康的 repos 可能比 SO 更值得学习。很多 stack overflow 对话也转移到了 GitHub 问题上。

      2. 它会窃取我们自己的数据,5-10 年后,我们就会有一个 “哎呀!我不是故意的!”的大反应。

        1. 我的观点是,根本不会有数据可偷!新颖的人工编写和人工评级的答案将不复存在。它将从哪里获得关于 C++26 功能的答案?肯定不会是不存在的 StackOverflow。

          1. 从训练数据的意义上讲,是有道理。我敢打赌,“代码工匠 ”将在 30 多万美元的范围内重新崛起,他们将像特种部队一样进入你的代码库,清除之前所有 “前辈 ”实施的人工智能垃圾。

      3. 为什么任何大语言模型(LLM)都需要新的信息来做根本上相同的事情?

        是什么让数据过时了?新代码?新代码?或者说,根本就没有新东西可学,只是用新的方法来表达同样的东西。

        1. > 为什么任何大语言模型(LLM)都需要新的信息来做根本上相同的事情?

          你凭什么认为我们将来还会做基本相同的事情?语言在发展和变化,系统在变化,操作系统在变化,硬件和规格也在变化。

          计算机领域没有什么是一成不变的。

    8. 我把它移到了 Stackoverflow 将被怀念的主题。它不属于 “让我们为 Stackoverflow 的消亡起舞 ”主题。

    9. 关闭此贴,因为它是一个声明而非问题

    10. 我只希望我们能继续找到像 SO 这样的高质量训练数据来源。如果人们不在某个地方发布他们的共同学习成果,那么就没有数据可供训练。

  2. > 2014 年:问题开始减少,这也是 Stack Overflow 显著提高版主效率的时候。从那时起,关闭问题的速度更快了,关闭的问题也更多了,删除 “低质量 ”问题的效率也更高了。这与我的记忆不谋而合,我当时觉得网站版主关闭合法问题是一种权力寻租。我大概就是在这个时候停止提问的,因为我觉得网站不欢迎我。

    我也是在那个时候觉得网站变得不受欢迎的。我没有意识到他们对版主工具进行了改版。我也是在那段时间停止使用的。现在我知道为什么了。

    有多少其他网站也因为调整而自食其果?

    1. 是的,我当时也有同样的感觉。stack overflow 似乎在向我传达一个信息:不要再问问题了。这真的很奇怪。

      1. 我也一样。我从来都不是 StackOverflow 的忠实用户,但在 StackOverflow 上搜索并找到与自己问题完全相同的问题(通常是排在最前面的结果),却发现这个问题在两年前就被立即关闭了,因为它与其他问题在其他上下文中的答案重复,既不适用也毫无用处,这让人非常恼火。

        这让人沮丧,不仅因为你无法获得即时帮助,还因为这表明在上面发帖是徒劳无益的。

      2. 拥有围墙花园的人经常会有这样的想法:把树修剪一下,让它们看起来更优雅、更漂亮,这就是审核、删除、禁言等。他们在修剪树木、创造美丽的东西时会有一种很好的感觉,那一刻他们会很高兴,觉得自己创造的这样一个美丽的小花园对游客和潜在的花园支持者来说会更有吸引力。

        有些人往往会过分地这样想,结果却发现修剪得很厉害的树现在成了一棵死树,现在发现自己在死树花园里。

    2. 我是在 2014 年左右才开始学习代码的,所以在这次变革之前我并不了解 SO。但是,当你把自己的平台弄得如此激进地反对提供帮助、如此激进地反对新手、如此让人不愉快地与之互动时,人们停止使用它也就不足为奇了。人类有半数以上的一代学习者在 SO 上的经历几乎都是负面的。

    3. 曾经有一段时间,“让我们与人互动,谈论很酷的事情 ”的群体和 “让我们建立终极知识库 ”的群体的动机是一致的。

      后来,有了更好的版主工具,“终极知识库 ”小组开始通过减少只在那里聊天的人数来实现终极知识库。

  3. 多么具有讽刺意味。“人工智能 “以结构化知识、艺术创作和其他任何人类生产为食,以产生其产出。大语言模型(LLMs)和现代机器学习出现之前,这种趋势就已经愈演愈烈。这反过来又使得 “人工智能 ”的实现没有新的人类内容可以利用。现在怎么办?整个过程自相残杀。我们是否正在进入文化(广义上的)生产的黑暗时代?我并不是认为我们已经进入了黑暗时代,而是因为其他一些相关的原因……

    1. 也许下一步就是让大语言模型(LLMs)在例行摸索特定主题时在 SO 上提问。我可以看到一个知识悬赏系统,人们可以通过提供准确、深入的小众主题培训数据获得报酬。

      1. 在 Stack Overflow 上,无论是提问还是回答,大语言模型的内容都被政策禁止,因为在 ChatGPT 公开宣布后仅仅几天(因为它立即引起了巨大的问题): https://meta.stackoverflow.com/questions/421831

        版主(实际当选的版主,约 2,900 万用户账户和约 2,400 万个未删除问题的二十几名版主)于 2023 年中期罢工,主要原因是网站工作人员/所有者干涉了他们删除此类内容的能力(这是一项获得社区强烈共识的压倒性流行政策):https://meta.stackoverflow.com/questions/425000,这一决定在整个 Stack Exchange 网络中传播开来(因为大多数 SE 网站都采用了类似的政策):https://meta.stackexchange.com/questions/389811/

        很大一部分用户明确反对以任何方式帮助大语言模型(LLMs)。我个人已经停止贡献新的问题或答案内容,只对现有帖子进行编辑。我转而在 Codidact (https://software.codidact.com/) 上贡献新内容(披露:我最近成为了那里的版主)。

      2. 你离黑客帝国的情节只差一两句话了

    2. > 这反过来又使得 “人工智能 ”的实现没有新的人类内容可以利用。现在怎么办?

      在你的印象中,人工智能似乎需要比 2024 年前所有记录在案的人类知识更多的知识,才能达到与 SO 平均贡献者相同的水平。其实不然。因为《战略》的平均贡献者都没有达到这个水平。

      目前还不清楚需要在算法上做出哪些改进才能利用现有数据让人工智能达到 AGI 的水平,但缺乏数据绝对不是瓶颈。

      可以说,这些人工智能系统并没有与其他人工智能系统分享它们的解决方案(或问题),但如果它们这样做了,世界将会从中受益。或许,为人工智能系统提供一些共享空间,让它们分享自己合成的经过验证的解决方案,也不失为一个好主意。

      1. > 你似乎认为,人工智能要达到与普通 SO 贡献者相同的水平,所需的知识超过了 2024 年之前所有有记录的人类知识。

        取代普通的 SO 贡献者并不足以取代 SO,只有在主要模型不仅获得了 SO 作为训练数据,还获得了网络搜索(包括 SO)作为直接基础之后,人工智能才能有效地 “取代 ”SO。

        如果没有 SO 或类似的东西,没有人类的积极贡献,人工智能将更难取代 SO 为新问题和新领域提供的价值,因为人工智能既没有 SO 的训练数据,也没有 SO 的查询时间搜索结果来合成答案。

        1. 你没有回答我的主要观点,即人类不需要任何接近当前和不久的将来人工智能所能获得的相关数据量,就能达到 SO 贡献者的水平。因此,缺乏人类合成的新 Stackoverflow 数据一定会成为未来瓶颈的观点是无稽之谈。

          不要假装大语言模型(LLM) 训练的现状在某种程度上说明了人工智能的根本问题。

  4. 我觉得有趣的是,现在的 StackOverflow 版主往往会说:“过去我们接受了太多的问题,但这从来都不是我们的目标,所以现在我们正在按照它本来的样子做”。

    当然,但在过去,StackOverflow 不断发展壮大,而现在却奄奄一息。也许以前 “做得不对 ”的地方更好?

    1. 我认为这类事情只是规模扩大带来的不幸副作用。规模越大,就会有越多的人迷失在官僚机构中。然而,如果你不建立官僚机构,系统就会在自己的受欢迎程度下崩溃。

      维基百科也有类似的问题,在 2007 年左右,编辑量有所下降,这通常被归咎于更严格的规则执行、更复杂的规则等。我认为这只是发展的一个自然阶段。你不可能永远是一个自由的世界。

      1. “好 “的一面是,他们的发帖量又回到了 2009 年的水平。这显然是版主允许的,但我猜测网站的流量也在急剧下降。他们可以缩减官僚机构,回到过去的精简路线上来。

        但我并不认为这就是问题所在。读了 zahlman 在这个主题中的回复,我觉得版主们掉进了自 Usenet 和 IRC 以来就一直存在的老陷阱,直到今天,只要有版主的地方,这种情况依然存在:他们厌倦了无偿劳动,于是决定变得更刻薄、更严格,而不是决定退出。这就是古老的版主之旅。

        1. 谢天谢地,当当到目前为止还没有走上这条路。

    2. > 当然,但在过去,StackOverflow 一直在发展壮大,而现在却奄奄一息。也许以前 “做得不对 ”的地方更好?

      你是在假定目前的问题量代表了新颖、独特的帖子,而不是你只要进行适当的查询就能反复找到的东西。

    3. 从字面上看,他们总是说现在是为了更好地节制泔水。实际情况是,大语言模型(LLMs)之前的进步已经过时了。即使在计算机辅助流程的初期,我们也不需要为了获得最佳内容和发展少数人而疏远大多数人。内容可以从一个可能是人的人分流到其他可能是人的人,也许有价值,也许你只是没有疏远任何人,有些人仍然会爬到更高的层次,做出值得浓缩的内容。

      1. > 即使是在计算机辅助流程的初期,我们也不需要为了获得最佳内容和发展少数人而疏远大多数人。

        绝大多数来自新账户的新问题都来自那些显然只是为了解决个人问题的人,他们对考虑自己的问题对第三方的价值毫无兴趣,甚至很少花精力去诊断或说明问题。

        甚至在这些人中的大多数人都有可能从大语言模型(LLM) 那里得到即时答案之后也是如此。从 Stack Overflow 策展人的角度来看,这无疑是更好的选择。在大语言模型(LLMs)之前,重点是让他们使用搜索引擎找到一个现有的问题,让他们找出问题所在。但要让问答帮助这些用户,他们至少需要应用基本的问题解决和调试技能。(Stack Overflow 社区显然无法为其他人提供这种帮助;而且在答案中试图提供这种帮助会降低网站对其他人的吸引力)。如果大语言模型(LLM)可以提供一些假设供这些用户测试,那么大语言模型(LLM)就在做它最擅长的事情,而 Stack Overflow 也在做它最擅长的事情。

        Stack Overflow 不会为你排除故障或调试任何东西,也不会对多步骤问题进行推理并将其分解为自然的逻辑步骤。它的作用是直接、客观地回答如何完成每个步骤,并在你找出失败程序中的特定故障点并使问题可重现后,解释故障点失败的原因。

        所以,是的,我们绝对需要 “疏远大多数人”,因为 “大多数人 ”在那里的原因与获得最佳内容完全无关。

        1. > 所以,是的,我们绝对需要 “疏远大多数人”,因为 “大多数人 ”在那里的原因与获得最佳内容完全无关。

          在这个过程中,你疏远了多少 “理想的 ”贡献者?

          我可能太天真了,但当人们说 “我使用 SO 已经有 10 年了,但它变得有毒,所以我离开了 ”时,听起来并不像是新账户在要求他们的家庭作业。

          1. 那些已经使用 SO 10 年左右的人不同意关闭问题政策的基本原则(或者他们的行为明显没有意识到这一点),他们甚至比那些寻求快速解决问题的人更糟糕。因为他们让网站充斥着低质量问题的低质量答案。这样一来,他们稀释了更高质量的内容(因为搜索引擎无法理解我们的内部质量评级系统,所以更难通过搜索引擎找到这些内容),并刺激了寻求快速解决问题的人。这两方面都是对政策的漠视,与网站的目标背道而驰。

            当人们把某样东西描述为 “有毒 ”时,我通常认为这是没有内容的,没有进一步的说明。它并没有具体描述所谓的问题所在,只是将抱怨夸大了。

            1. > 已经在网站工作了 10 年左右的人不同意关闭问题的基本政策[……]因为他们用低质量问题的低质量答案充斥网站

              我看你是没听到这些抱怨。

              我没有听到那些在网站工作了 10 年左右的人因为无法回答低质量问题而抱怨。

              1. > 我没听说过那些工作了 10 年左右的人因为无法回答低质量的问题而抱怨。

                因为他们通常都能回答。没有足够的馆长关注。要阻止他们,通常需要三位策展人发现同一个问题,并在发布答案前采取行动。而且撰写答案的人还能在飞行中获得宽限期。

                然后,当他们终于感到不便时,他们来到元网站,也许是他们 10 多年来第一次尝试了解政策是什么。他们往往会有这样的糟糕经历:大声抱怨,好像他们已经知道了政策,却从来没有尝试过了解政策,然后惊讶地发现自己错了。有时,他们甚至试图在主网站上发布一个元帖子。

                1. > 因为他们通常可以。

                  不知道是我写不出连贯的英语,还是你听不懂。你一直在为不理解人们的抱怨而斗争。

                  他们抱怨好问题被封,你说 “那是因为它们是坏问题”。他们说他们不抱怨坏问题被关闭,你却说 “那是因为我们不关闭坏问题”。

                  听起来,除了 “我们很棒 ”之外,你根本不知道自己想说什么。

                  1. >他们抱怨好问题被关闭,你却说 “那是因为它们是坏问题”。

                    因为他们没有表明他们理解什么是好问题,或者标准是什么。或者因为他们自以为是,认为自己才是有权决定问题好坏的人。

                    >你说 “那是因为我们不关闭坏问题”。

                    ????? 我什么也没说。

                    >除了 “我们很棒”。

                    这也是你的措辞,不是我的。

                    不过,还是那句话。以适当的方式举出具体的例子,否则就没什么好讨论的了。

                2. 反社会的人在网站上充斥着对低质量问题的低质量回答,而不把所有东西都索引到网上实在是太难了。试想一下,如果每个城镇、每所学校都充斥着同样的刺头,那还了得?你们的孩子很笨,不懂博士级别的研究,所以他们应该闭嘴。

                  这一切在旧时代都是合情合理的,当时全球通信是需要留给顶尖研究人员的,因为你们的总能力还达不到人类的需求。但现在,你们只是在以一种反社会的方式重复着上一代人的口头禅。

    4. >现任 StackOverflow 版主

      绝大多数人都不是版主。一周前我向别人解释过这个问题 (https://news.ycombinator.com/item?id=43927665),你也回复了这条评论。

      > 当然,但在过去,StackOverflow 一直在发展壮大。

      那又怎样?Stack Overflow 的用户会因此获得 0.00 美元,无论他们是版主、活跃的策展人还是刚刚注册的用户。对于用户来说,网站的增长并不是目的。增加与网站的互动也不是目的。目标是建立一个有用的人工制品(https://meta.stackoverflow.com/questions/254770)。这经常需要删除、关闭或重复问题,就像建立一个有用的程序经常需要删除代码行、废弃部分应用程序接口并进行重构一样。

      > 现在它正在消亡

      为什么输入问题的减少就意味着它 “快死了”?

      > 也许以前的东西更好

      你认为应该由谁来决定什么是 “更好的”?更重要的是,为什么?

      如果 YC 团队决定优先增加 HN 的网站流量(并引入广告来利用流量),并最大限度地提高新提交问题的比率,而牺牲或无视讨论的质量,这显然是不好的,对吗?你会离开,对吗?我会的。

      同样的原则也适用于那些不以讨论为目的的网站。大并不代表好。

      1. > 绝大多数情况下,你所说的人都不是版主。

        我其实是在想你。你一直说一切都很好。我的看法是,我以前每天都上 SO,即使我有很多东西要补充(实际上比以前更多了),我也完全停止了贡献。

        > 为什么来问的问题减少就意味着它 “快死了”?

        有 “减少 ”之说,也有 “恢复到 2009 年 SO 推出时的问题数量 ”之说。

        1. >你一直说一切都很好。

          我说很好,因为确实很好。我说减少问题量对实现网站目标有好处,因为确实如此。

          我对网站有很多不满意的地方,主要是工作人员采取的措施与网站的目标和宗旨不符。

          > 我的观察是,我以前每天都上 SO,但现在我完全停止了贡献,即使我有很多东西要补充

          … 然后呢?

          > 有 “减少”,也有 “回到 2009 年 SO 推出时的问题数量”。

          如果每天的问题数量为零,我仍然不会认为这是一个问题。这将是一个完善现有公开问题的机会。

          提醒一下:这些问题的数量已经是维基百科上文章数量的三倍多。你说我们不像以前那样每天能看到成千上万的问题。我说,问题是我们已经有了这么多;如果我们有十分之一的数量,就会更容易找到你想要的东西。

          1. > … 然后呢?

            在我看来,它已经奄奄一息了。

            > 如果每天的问题数量为零,我仍然不会认为这是一个问题。

            所以,一方面你认为删除旧问题没有问题,另一方面你又认为不增加新问题也没有问题。但这并不会导致死亡。

            > 如果你想找到你想要的东西,那就更容易了。

            我从未遇到过因为类似问题太多而无法在 SO 上找到想要的问题的情况。但是,我曾遇到过这样的情况:我找不到我想要的东西,因为那里没有。而当我添加问题时,那些显然不了解我的问题(及其答案)的人却把我关在了门外。

            我再说一遍,我并不是说应该禁止关闭问题。我想说的是,SO 已经成了一个连好问题都会被关闭的地方。像你这样的明白人。

            1. > 在我看来,它正在消亡。

              为什么由你来下结论?

              > 所以,一方面你觉得删除旧问题没问题,另一方面你又觉得不增加新问题也没问题。但它并没有消亡。

              是的。

              你这样写好像觉得这里有矛盾。我真的不明白为什么。这里没有矛盾。

              QuickDraw 在丢失 2000 行代码时也没有 “受伤”(https://www.folklore.org/Negative_2000_Lines_Of_Code.html)。

              > 我从未遇到过因为类似问题太多而无法在 SO 上找到想要的东西的情况。

              在我更积极地整理这些乱七八糟的问题时,这种情况每天都在发生。我清楚地记得,我曾多次为此花上几个小时的时间,撕心裂肺地哭喊,并在相应的聊天室里抱怨问题太糟糕、无意中的点击诱饵,以及搜索引擎对查询中细微变化的敏感性。

              > 显然,这些人根本不理解我的问题(及其答案)。

              也许 90% 抱怨自己的问题被关闭的人都是这么说的,而在这些案例中,也许 90% 都被证明是不正确的。

              但同样,“人们不明白你想问什么 ”也对你的问题不利。这是设计好的。因为人们希望问题能够清楚地传达信息。这样,其他阅读者就不用浪费自己的时间来确保问题的正确性。

              当然,还有其他原因导致问题不被理解。但要区分 “这个人几乎写不出连贯的英语 ”和 “我对这项技术一无所知 ”并不难。一般来说,人们不会为了回答问题而在自己不了解的技术上打标签。他们究竟能从中得到什么?

              > 我想说的是,SO 已经成为一个连好问题都会被关闭的地方。就像你这样的人。

              再次强调:请提供一个链接,举例说明你认为被无理关闭的问题,并确保你能根据现行政策清楚地解释为什么你认为关闭是无效的。

              请在 https://meta.stackoverflow.com 上这样做。

              或者,如果您过去曾这样做过,请给我链接一个例子。在这里也可以。

              1. > 要区分 “这个人几乎写不出连贯的英语 ”和 “我对这项技术一无所知 ”并不难。

                对不起,我没有意识到我几乎写不出连贯的英语。

                > QuickDraw 在丢失 2000 行代码时也没有 “受伤”。

                说到写出连贯的英语,这和当前的讨论有什么关系?

                1. > 对不起,我没有意识到我几乎写不出连贯的英语。

                  我指的显然是不同类型的问题,而不是你的写作。

                  > 说到写出连贯的英语,这跟现在的讨论有什么关系?

                  https://en.wikipedia.org/wiki/Analogy

              2. 为什么是你来做这个判断?

                价值数十亿美元的东西可能只需 5000 万美元就能买到(这太贵了……)。

                1. 我认为这也没有关系。在 Stack Overflow 上提问或回答问题、发表评论或编辑现有帖子的人,都没有增加 Stack Exchange 公司市值的特定意图。

  5. 出售的时机非常巧妙。类似于马克-库班收购 Broadcast.com。我想,最好是在价值跌至 0 之前卖掉一些东西。

    至于它的消亡?人工智能吃了它的午餐。我以前经常使用 Stack Overflow,现在已经有几年没上过这个网站了。

    1. 新的所有者一直在努力采用 “如果你不能打败他们,那就加入他们 ”的方法。他们知道这完全违背了社区的共识(在元网站上已经反复向他们表明了这一点)–所以他们就更加偷偷摸摸了。

      值得注意的是,在 2023 年 6 月 https://meta.stackoverflow.com/questions/425081(就在版主罢工刚刚开始,抗议工作人员试图阻止他们删除网站上的人工智能内容之后)被彻底羞辱,并在该功能上得到令人尴尬的反馈(https://meta.stackoverflow.com/questions/425162)之后,他们又在去年 11 月推出了 https://meta.stackoverflow.com/questions/432154,并一直在强行通过该功能。

    2. 如果不再有人在网上发布问答,未来的人工智能从哪里学习?

      1. 这是明天的问题。

        (作为一个经常在明天被雇佣的人,他的工资只有以前的几分之一,来收拾这个烂摊子)。

      2. 信息将被重新包装,就像 2000 年代中期的信用违约掉期一样。

      3. 来自官方文件?人工智能毕竟擅长总结

        1. 我一直在尝试让 ChatGPT 帮我写一些 Emacs Lisp,结果很糟糕。很少有东西的文档比 Emacs 更完善。有几百页的文档和几百万行的 Elisp,但显然还不够。

          我并不要求 ChatGPT 提供什么漂亮的架构,我只要求能完成工作的简单黑客。Elisp 的设计是为了让简单的黑客操作变得简单,但我想对于 ChatGPT 来说还不够简单。

          比如,我要求 Elisp 制作一个命令,可以移动 “标记 ”和 “点”,从而选中整行。如果选区只覆盖了一行的一部分,我希望选区能扩大到覆盖整行。要做到这一点,只需移动标记和点,使它们围绕一条线即可。ChatGPT 做不到这一点。它只会移动点,而不会移动标记,也不会对标记做任何操作。我明确告诉 ChatGPT “不,你必须同时正确设置点和标记”,然后它又写了更多代码,只调整点而不调整标记–它会把点移动到线的起点,然后又把点移动到线的终点,从来不碰标记–这太愚蠢了。

        2. 祝你好运。我最后一次使用 SO 是为 SwiftUI 找答案,我可以向你保证,官方文档并不包含所需的信息。

        1. 其他人的代码在很多甚至大多数情况下都是由更老更笨的模型人工智能生成的?甚至可能是由人工智能代理编写并提交的,根本没有经过人工审核?欧洲皇室曾尝试过这种做法,结果并不理想。

          1. 你说得很对。自从《GPT-3》发布并成为主流之后,我多年来一直试图在这个问题上吹响号角,你可以到处读到和听到 “有了人工智能,你再也不需要{x}了”。

    3. AI 刚刚偷走了它所有的内容,不知道他们会不会选择起诉。

      1. Stack overflow 从未拥有过这些内容,它们现在和过去都是创作共用的:https://stackoverflow.com/help/licensing

        1. 该许可是授予社区的,但根据链接的服务条款,公司获得的许可略有不同(https://stackoverflow.com/legal/terms-of-service/public#lice… ;滚动到 “订阅者内容”)。强调:

          > 您授予 Stack Overflow 永久且不可撤销的权利和许可,以…

        2. 该许可附带的义务,人工智能公司并没有遵守。

          1. 这种说法是否属实还有待商榷。

            cc lience 只适用于信息的呈现方式,不适用于信息的事实内容。至于 openAI 使用的是哪部分内容,则存在很大争议。

            1. 光标有一次写了一条评论,我提示它 “评论的来源是什么”,它就把评论替换成了 stackoverflow 的网址,其中的页面包含了上述评论的逐字记录。我没想到光标会粘贴完整的网址

            2. 好吧……如果给它正确的提示,它就会以原始形式有效地完全复制堆栈溢出的帖子,这样就没有争议了,我们都可以清楚地看到幕后发生了什么。

              1. 真的会这样吗?当然会有这样的事情发生,但据我了解,人们还无法可靠地对特定帖子进行复制。

                1. 定义一下 “它”。

                  是的。我已经得到了许多免费的大语言工具和演示,可以完全重新创建 stack overflow 帖子或博客文章。它们似乎有逐字复制评论的习惯,这通常是搜索原始 “灵感 ”的好方法。

                  这一点做得相当可靠。你要求的程序越简单,它就越有可能直接复制一个。我们可以争辩说,程序越简单,可信的实现就越少,但当它如此准确地复制注释并将它们放置在相同的位置时,就没有其他结论可言了。

                  目前的这批 “人工智能 ”公司只是在为侵犯版权的行为涂脂抹粉。

                  1. 当然,但在冗长的程序中逐字复制一两句话可能还不足以赢得版权诉讼(微不足道)。或者说,至少是非常灰色的。同样,程序越简单,创意意图就越不明显。

                    (我主要想说的是,这些事情取决于细节,而反人工智能的人群倾向于放弃细节。他们可能仍然是对的,但远非显而易见的灌篮高手)。

          2. 不幸的是,这种区别既重要又毫无意义

  6. 这有点可悲。很明显,它之所以如此衰落,是因为人工智能(ChatGPT 和类似的软件)取代了 StackOverflow 过去负责回答有关编程的基本问题的工作。

    看看我 14 年前的个人资料,我解决的最多的问题是关于如何在将 JSON 序列化到 C# 类时正确指定字段的基本问题。

    我相信,StackOverflow 的价值只在于那些懒得阅读他们试图使用的语言/框架文档的人。我以前在 StackOverflow 上很活跃,但在过去的 10 年里,我认为它唯一的价值就是当我需要回到某种语言中寻找如何用该特定语言(swift vs go vs …)编写 for 循环的答案时。

    我个人认为 StackOverflow 上的知识库并不多。过去 10 年里,我向 “谷歌 ”提出的大多数问题,很少有人会引导我到 StackOverflow 上寻找正确答案。

    StackOverflow 上有很多复杂的问题,但网站上充斥着大量询问和回答编程基本问题的人。还有一些人在那里只是为了获得一些 “因果报应”。

    1. >>而且很明显,该网站之所以如此衰落,是因为人工智能(ChatGPT 和类似工具)取代了 StackOverflow 过去负责回答的有关编程的基本问题的工作。

      人工智能取代这些东西的一个重要原因。很大一部分原因是体验本身。有不少人因为自以为是或其他原因被标记为重复/不相关/愚蠢等问题而反感。

      人工智能也非常即时。你还可以像与人交谈一样与它对话。

      人工智能的杀手锏!—————————>人工智能会倾听,而不会对你评头论足。

  7. 感觉人工智能并不是主要驱动力。随着时间的推移,很多东西都发生了变化–开发工具变得更好了,编辑器变得更智能了,编译器的错误信息变得更好了,各种初级资源得到了改进,教程网站、课程和 youtube 蓬勃发展。

    当然,还有一点是,每一个新问题都越来越有可能是已经回答过的问题。在某些时候,网站几乎涵盖了大部分需要回答的问题。

    1. 我还没看到有人提到 GitHub(你所说的 “改进的工具 ”的一部分)是造成这种情况的原因之一。

      如今,您可以访问 repo,通常已经有一个问题开放了,其中包含问题和解决方法。或者,如果有人有关于如何使用工具/软件的问题,他们也会在那里询问。

      在 GH 蓬勃发展之前,经常是 SO 在做这项工作。

      1. 在我看来,这可能是影响最大的方面。

        iOS 问题将直接转到苹果的社区论坛。SalesForce 或 Elastic search 等也是如此。

        噪音/信号比更高,真正有机会得到专家的解答,而且如果问题需要转到付费支持,它还可以作为垫脚石。

    2. > 每一个新问题都越来越有可能已经得到回答

      是的,但应该有最新答案的情况除外。大部分计算技术都在不断变化。有很多 10 多年前的答案已经不再适用了。

      1. 我在 13 年前回答过一个问题,现在仍然可以得分。整个计算技术并不是不断变化的,只是 JavaScript 变化太大了。见鬼,我 30 年前就学会了使用 Apache,而在过去的 25 年里,我根本不需要学习任何新东西。

        1. Python 3 的变化实际上使大量 Python 问题失效或废弃,或者需要编写新的答案。在很多情况下,我们最后只能用一对恼人的流行问题来捕捉 Python 2 到 Python 3 之间的主要差异,因为你会遇到一些毫无头绪的用户,他们以为自己运行的是 2.x 解释器,但实际上运行的是 3.x 解释器,或者相反的情况。

    3. 在 ChatGPT 发布前后,问题率与时间的曲线出现了明显的拐点。

      这没什么。如果你的问题不是由 “site:stackoverflow.com how to do the thing ”来回答,而是由一个大语言模型(LLM) 以 “how do I do the thing? ”为提示,综合现有的 Stack Overflow 内容来回答,那么这本来就不是一个合适的 Stack Overflow 问题。因为其他人也可以把 “我该如何做这件事?”放入同一个大语言模型(LLM)中。这与使用传统搜索引擎没有任何区别。

      (而当大语言模型(LLM)因产生错误的综合结果而失败时,将该结果放到 Stack Overflow 上是一种积极的有害行为–这也是政策禁止这种行为的原因。)

    4. > 当然,还有一点是,每一个新问题都越来越有可能是已经回答过的问题。在某些时候,网站几乎涵盖了大部分需要回答的问题。

      人工智能能够综合多个来源的答案,并根据您的具体提示细节量身定制。这就是我们常说的 “手套合手”。此外,它还能解释自己的答案。

      1. 是的,它可以结合多种来源,编造出毫无意义的答案。即使它能解释 “它是如何工作的”,但当 API 或函数从未存在过时,它也无济于事。

  8. 汪。只看单一指标,推断 “大语言模型(LLMs)杀死了电台明星”

    Stack Exchange 网站旨在清除重复内容,在人们发布新问题之前为他们提供帮助。随着时间的推移,原创问题的数量会逐渐减少,这似乎是一个很自然的结论。

    我不会假装有些人生活在大语言模型(LLM)里,但我们中的很多人仍然在使用搜索引擎和 SO。

  9. 这篇文章谈到了SO中提问的数量,但没有提到可视化。

    经过 16 年的改进,大多数普通问题都已经存在了,这感觉很自然。我每周都使用它,但在拥有账户的 12 年里,我提出的问题(通过我的账户提出的问题为 0)用一只手就能数过来。~我所有的问题都已经问过了。

  10. 我的问题从被批准到被关闭的比率大约是 40/60。而在获批的问题中,我只有 50%-60% 的时间能得到我想要的答案。我自己得到了 350 分。我讨厌这每一秒。

    非常咄咄逼人的审核,人们为了给毫无价值的成就系统加分,总是在评论中说 “你应该缩小这个问题的范围”。

    要想发表评论、点赞或不喜欢,就得磨练成就。

    我曾在 2013 年用过一年左右,后来又回到了 XDA developers、Codeguru 和 Reddit 等论坛发帖。

  11. 我曾经回答过很多问题,到 2013 年左右,我回答过的 HTML 画布问题大概占到所有问题的 12%。在我看来,它下降得更快,2014 年确实是一个合适的拐点。

    有一种想法,有时没有明说,但往往是明确的,那就是真的不能再进行(严肃的)讨论了,而且还想知道如何才能阻止人们提问。如果之前有人提出过哪怕是隐约相关的问题,就很难再讨论任何事情。不可能讨论一些你知道答案但不知道原因的问题,也不可能讨论一些你想知道 5 种方法中哪种最好的问题。所有这些(对我来说)都是非常有价值的技术讨论。完全被封杀了。

  12. 如果 SO 死了,新技术和编程语言的培训数据从哪里来?

    1. 这是我的问题。这暗示了一种奇怪的自我蚕食现象。大语言模型(LLM)之所以如此出色,是因为它能够对现有的 SO 答案进行训练。但是,如果随着时间的推移,SO 内容的产量下降,那么大语言模型(LLM) 的结果就会变得不那么可靠。对于较新的问题/问题,SO 和大语言模型(LLM)都会比现在差,这似乎是一种新的平衡。

    2. 在一种语言有许多关于 SO 的答案之前,人类程序员的所有答案都来自相同的地方。

      – 文档 – 使用该语言的开源项目 – Github 问题 – 源代码 – 博客 – Youtube 视频

      不胜枚举

      1. 再细说一下,SO 有一种问题-答案类型的格式,可以很好地将其转化为提示-回复格式来训练这些聊天应用程序。除了 Github 上的问题之外,其他大多数来源都没有。如果没有这种问答格式,就需要更大的数据标注工作来训练大语言模型(LLMs),不是吗?

  13. 我认为 “提问数量 ”是个错误的指标。因为感觉所有的问题都已经被问过了。每当我需要知道什么的时候,我都可以谷歌一下,然后在 Stack Overflow 上找到答案。我已经不记得上一次真正需要问问题是什么时候了。或者说,我上一次找到的问题还没有很好的答案。Stack Overflow 的问题库相当完备,出现新问题的唯一原因就是新工具。

    当然,大语言模型(LLMs)是一个很大的因素,但我觉得大语言模型(LLMs)很少能给出好的答案(而且值得信赖!),我会在 Stackoverflow 上查看。就像大语言模型(LLMs)不能很好地替代 API 参考资料一样,因为他们总是搞错细节。

    1. 如果没有新问题要问的话,我认为这是正确的。但技术一直在转变和发展。

      多年来,我在 StackOverflow 上最常问的问题之一就是 ECMAscript 6 的可行性。现在这个问题基本上已经无关紧要了,因为它已经被浏览器等广泛采用,但当时很多人都很喜欢这个问题,因为他们想采用这项技术,但又不确定它的成熟度如何。

      同样,有些技术堆栈已经成熟到没有什么可问的地步,但我认为论坛仍会有一席之地,在这里你可以围绕更新、更先进的技术和使用案例等问题进行提问并得到答案。

  14. StackOverflow 应该把重点放在链接重复内容上,而不是禁止重复内容。

    No Boilerplate 最近说 “写作即思考”[0],并建议链接是知识图谱的终极组织工具–而不是标签、文件夹–链接[1]。

    StackOverflow 试图阻止所有重复的问题。这种做法令人窒息,减少了写作,减少了思考,最重要的是,减少了用户的参与度。

    那些想写问题和提问题的人不再去 StackOverflow 了。那些想撰写文章并给出答案的人也不再去 StackOverflow 了。

    看看 Discord 或 IRC,你就会发现人们都有自己的问题要问,而回答这些问题的人也喜欢一遍又一遍地回答同样的问题。让人们写下自己的问题,写下自己的答案并给出建议。与其防止重复,不如把重复的问题链接在一起。

    [0]: https://www.youtube.com/watch?v=sqm4-B07LsE [1]: https://www.youtube.com/watch?v=B0yAy2j-9V0

    1. > StackOverflow 应该把重点放在链接重复问题上,而不是禁止重复….。StackOverflow 试图防止所有重复问题。

      Stack Overflow 并不禁止重复。重复的问题会被链接到一起,这就是系统中 “重复 ”的含义。除此之外,已注销的用户登陆到没有自己答案的重复问题时,会被自动重定向到目标问题。

      当重复问题链接到 Stack Overflow(以及 Stack Exchange 上的其他地方)时,它们会被自动关闭,这只是为了防止出现新的答案。这样做的目的是为了将高质量的答案集中到一个地方–重复问题的目标上,而目标反过来又是问题的高质量版本(当管理员发现问题成为常见的重复问题目标时,还可以将其作为进一步改进的重点)。

      删除重复问题(以及一般的帖子)并不是很好理解,人们的看法也不尽相同–参见 https://meta.stackoverflow.com/questions/426214 等。但通常情况下,除非重复内容会对搜索结果造成损害(即:由于重复内容的撰写方式欺骗了关键字搜索,导致人们找到错误的目标),否则不应删除重复内容。

      没有人会因为发布重复内容而受到正式处罚。你只是被关闭了你的问题,也许还会被要求以后搜索时更仔细一些(或告诉你如何去做)。

      > 想写文章和提供答案的人不再去 StackOverflow 了。看看 Discord 或 IRC,你就会发现人们有自己的问题要问,而回答这些问题的人喜欢重复回答同样的问题。

      Stack Overflow 不应该欢迎那些只想重复回答同样简单问题的人,他们的目的是为了获得虚构的互联网积分,从而在排行榜上更上一层楼。这种行为与 Stack Overflow 想要实现的目标背道而驰。已经有无数的讨论区(如你所说,还有 Discord 和 IRC 频道)在重视这种行为。互联网上应该有一个不重视这种行为的地方,尤其是这个地方是专门为那些希望搜索引擎有用、希望一次写出高质量答案并让很多人阅读的人而创建的。

      1. 也许 “重复回答 ”是一种更友好的说法–但我听到了,是的,封闭式问题是链接的,这正是我所要求的。不管怎样,很多人因为他们的问题被关闭而决定不再使用这个网站。

        > 如果有人想在 Stack Overflow 上重复回答同样简单的问题,以获得虚构的互联网积分,从而提升自己的排名,那么他们就不应该在 Stack Overflow 上受到欢迎。

        我认为值得一问的是,人们为什么要在互联网上给出答案?也许是因为互联网积分,但更多的时候,人们只是喜欢与其他人交流,喜欢教书育人。

        一开始,StackOverflow 是一个希望与其他人互动的地方,也是一个希望建立终极知识库的地方–在一段时间内,他们的动机是一致的。

        但随着时间的推移,与其他人互动的空间越来越小,现在 StackOverflow 几乎完全是为了维护已经建立的知识库。

        是的,就像你说的,如果 StackOverflow 不是人际互动的场所也没关系。StackOverflow 已经建立了自己的知识库,有些人还在维护它,而知识库的长期成功正变得越来越明显–也就是说,并不是很成功–也许很快就会有一天,StackOverflow 甚至不再托管了。

        (另外,我想避免有人说这是因为人工智能。早在人工智能能够胜任回答问题之前,StackOverflow 就已经逐渐衰落了;即使到了 2025 年,人工智能的能力仍然是个问题:https://news.ycombinator.com/item?id=44000118)

  15. 这对大语言模型(LLMs)也将产生有趣的影响,因为 SO 拥有丰富的训练数据。根据我的经验,大语言模型(LLMs)在帮助我使用更新、更快发展的实验工具和库方面非常无用,这并不奇怪。但是,如果SO社区真的萎缩到越来越少人愿意回答问题的地步,那么就不会有另一个集中的答案资源了。也许这只是意味着像随机 Slack 频道这样的巴尔干化社区将填补空缺,但这些频道并没有搜索索引,而且我敢打赌,将它们全部纳入培训语料库也不会那么容易。

    也许未来会有大语言模型(LLMs) 在 SO 等平台上提出问题,因为它经常会在某个特定主题上犯错。人们可以通过回答问题获得报酬,从而提供更多的训练数据。目前谁知道呢?

  16. 社会学案例研究。合法的创始人、丰硕的利基、巨大的价值。增长、政治、公司化。他们做对了很多事,也做错了很多事。

    如果由我来决定,节制就会被彻底改变。但这不是我能决定的。

  17. Stack Overflow 是一个不鼓励人们提问或回答问题的问答网站。

    大语言模型(LLMs)可能加快了发展速度,但似乎它不可避免地会陷入废弃状态,最终以某种方式被取代。

    1. 你的评论看起来很不错,但你把它作为答案发布了,所以我只能删除它。

      当你赢得足够的声誉时,请回来重新发表你的评论。

  18. 就我个人而言,在过去的七八年里,我坚持使用相同的堆栈和工具,让深度不断积累,而不是总是在学习新的框架/语言/任何东西,从而不得不上网搜索如何在 y 或 z 中实现 x,这大大减少了我对 S.O. 的使用。

    与此同时,VS Code 也开始整合 MDN,所以当我遇到不认识的东西时,我的指尖就会有很多额外的信息。

  19. 套用欧比旺的一句话:”我感觉到原力中有一种巨大的骚动: 我感觉到原力中出现了巨大的混乱–仿佛有数百万来自未来的开发者发出了困惑和绝望的呼喊,然后突然鸦雀无声。我担心我们这门手艺的未来发生了什么可怕的事情。

    简而言之,以前我们通过 Ctrl+Copy 的方式访问 StackOverflow 或论坛或 IRC,得到的回复有好有坏。但这些回复让我们思考、阅读或与他人交流。

    现在,我们按 Ctrl+Copy 进入大语言模型(LLM) 就像进入了地狱。

    如果大语言模型(LLM)功能有用,但不要像蜂蜜一样上瘾。

  20. 我并不怀念花几个小时的时间试图找到正确的配置让事情正常运行,以及在 SO 上尝试随机答案的日子。总的来说,现在的开发世界更加美好,节省了大量的开发时间。另外,人工智能现在可以直接从文档中学习任何新的框架/语言。即使是晦涩难懂的,只需将所有 .md 文件传给 gemini 并询问即可!

  21. 我在想,如果他们添加一个类似 phind.com wrapper 的模式,每个问题都存储大语言模型(LLM)的答案作为答案,他们是否还能生存下去。这样就会有更多的内容,人们也就有理由继续使用它了。

  22. 关于元 SO 的讨论:https://meta.stackoverflow.com/questions/433864/do-you-agree…

  23. 我对此喜忧参半。

    它在过去帮助过我,但由于它的工作方式,当我知道解决方案时,却无法回复或张贴任何东西来帮助他人。

    更糟糕的是,我在 IT 部门工作时,曾与一个什么都不懂的人共事,如果没有关于问题的 SO 帖子,那个人就无法解决问题。

    我一直在使用 Perplexity AI,它非常棒,而且它提供了所有使用过的数据源,便于交叉检查答案。它帮助我加快了学习 Python 的速度,但我现在已经不再使用搜索引擎了,而且 SO 也存在上述问题,所以我对使用它毫无兴趣。

    此外,网站布局也是一团糟,我不得不使用带有大量元素选择器的 uBlock Origin 来停止加载其一半的蹩脚内容。

  24. 这既不会是第一个,也不会是最后一个被束手无策的权力绊脚石过度管理所摧毁的网站。而且,他们还用了最糟糕的方式–保留问题,但阻止任何人回答。因此,使用 SO 的默认体验就变成了发现自己的问题已被提出却无人回答。

    尽管如此,在万不得已的情况下,它还是可以找到自己的位置。

  25. 我很好奇 Stack Overflow 是否是人类学习的好资源?比如,遇到一个问题,查看其他相关问题和答案,检查文档,努力学习一段时间,弄清如何构思和提出问题,在等待答案的过程中再努力一些。我有点觉得大语言模型(LLMs) “太简单了”,能明显感觉到自己 “学不进去”,不像以前那样了,但毕竟我年纪大了。

    我很确定,只要系统提示正确,你可以从大语言模型(LLM)中获得堆栈溢出的体验,但人的因素可能不一样。不想在互联网上被别人责骂也许是一种被低估的激励工具。我们该如何找回这种感觉呢?

    1. 更不用说帮助和教导他人了,这感觉很好,但现在感觉没有那么多了。也许只是转移到了 Discord 等平台上,但如果你不认识其他贡献者和审稿人的话,GitHub 绝对没有这种感觉。我很好奇其他人是否也有这种感觉。

  26. 提出的问题并不是宣布其死亡的标准。对财务可行性而言,重要的是流量和与搜索引擎/索引的交易(大语言模型(LLMs)使用的流量和索引

    对于社区可行性:人们会在大语言模型(LLMs)失败的地方继续使用它。对于新问题。它仍然是寻找未注明变通方法的地方。

    虽然流量和投票活动有所下降,但它仍有巨大的价值,人们在这里提出并回答新的有价值的问题。

  27. 它当然死了,这就是骚扰试图提问的用户的后果。

  28. ChatGPT 现在要如何学习下一门计算机语言?

    1. 从我的角度来看,大语言模型(LLMs)在编程语言中大放异彩,因为它们(语言)被人们发明得更加形式化,所以更具有可预测性。即使是语法上不同的编程语言,也有我们无法亲眼看到的相似之处,但训练却能毫无问题地发现。我最喜欢的例子是,我试图找到如何在 Kotlin 中用反射表示 int 数组。向 ChatGPT 或一个足够大的模型询问这个问题,答案会是 IntArray::class.java,但尝试用 google 找到确切的一行–很少或没有,在 github 上搜索更多的源代码,仍然不多。因此,大语言模型(LLMs) “检测 ”到了 Java/Kotlin 中的类型签名制作系统,并且能够成功预测,因为规则是一致的。在人类语言中,它也能起作用,但程度较低,所以如果你给它一个有意义的动词/主语对,并要求它提供等价的动词/主语对,你会得到一些仍然有意义的动词/主语对,但在完整的网络语料库中简直没有。

    2. 我们是在未来,这里不需要什么新东西。

    3. 当人们不再练习编程,编程技能因为人工智能的刻意练习而衰退之后,还会有新的编程语言吗?

  29. 多年来,我的 “积分 ”曲线图一直呈上升趋势。2024 年初,随着人们转而使用人工智能,我的 “积分 ”图变得平淡无奇。

    在 SO 上,最棒的事情就是能看到各种相互竞争的解决方案和讨论,这意味着只要稍加辨别,你就能找到经过同行评审的高质量代码片段。为什么人们会更喜欢人工智能的结果呢?

    幸运的是,我在《SO》上看到了一些小插曲,所以希望人们在人工智能的光芒褪去之后,能够重新回来。

    SO 对世界经济的价值有多大?数十亿。就像互联网档案一样,它应该成为某种由政府资助的图书馆(联合国?

  30. 有没有类似的文章介绍 Stack Exchange 网络的其他部分?还有很多很多与编程无关的其他 SE 站点,而且通常不太适合通过大语言模型(LLM)进行解答。

  31. 我的日常工作包括审核。我认为我更能理解版主每天要处理的问题,因为他们工资低、不受重视、工作过度。

    要把一个社区的规模扩大到既受欢迎又富有成效是非常困难的。新用户与现有用户的使用环境不同。你会发现,规范和礼仪不会从一个群体传递到下一个群体。因此,虽然我注意到 SO 从 2014 年开始变得更加严格,但我并不知道该如何立即解决内容质量问题。

    我的看法是,就像大多数事情一样,旧的媒介会以 2014 年不曾有过的方式被人欣赏。正如布莱恩-伊诺(Brian Eno)所说 “无论你现在觉得新媒体有多么怪异、丑陋、不舒服和下流,它都一定会成为新媒体的标志”。当人们厌倦了大语言模型(LLM)的泔水时,他们会像过去几年一样渴望人类论坛。(如果他们真的这样做了)。

    1. 我不太同情版主。他们的工作就是让某个论坛只包含他们想从提供内容的人(无偿)那里听到的东西。如果这就是你想要的,那就开个博客吧。

      在任何形式的现实社区中,如果某个人决定自己有权阻止别人回答别人的问题,单方面决定不欢迎别人等等,每个人都会认为他们疯了。

      但问题是,任何未经版主管理的公共论坛最终都只能容纳骗子和纳粹。版主解决了纳粹垃圾邮件的问题,但现在又出现了版主的问题。最近我一直在寻找解决版主问题的方法,这是我的一个副业,但我不能说太多,因为这样做可以赚钱。

      当论坛被纳粹垃圾邮件泛滥时怎么办?我们会设置一组版主来清除它们。但如果版主开始删除有用的信息,又该怎么办呢?我们只需释放一波又一波的中国针蛇。它们会把版主一网打尽。但毒蛇不是更可怕吗?是的,但我们早有准备。我们已经准备了一种以蛇肉为生的大猩猩 那我们就只能吃大猩猩了 不,这才是精彩的部分 一到冬天,大猩猩就会被冻死。

      1. 是的,这就是互联网上人类组织的真正难题。你需要版主来把好质量关。但最终,Mods 会因为自身的力量而疏远社区。也许人工和算法相结合的管理方式会有所帮助。

  32. 我的业务也有类似的收入曲线,当然大语言模型(LLMs) 是一个很大的原因,但更多的原因是我分心了,无法与时俱进。我只是不喜欢争斗,并在曲线中看到了足够的价值,所以才让它随之不断下滑。

    我想堆栈的所有者也有类似的感受吧?我对他们一无所知,所以很容易出错。

  33. Stackoverflow 的答案通过试用者的确认/向上投票提供了真相的来源。我们完全放弃了这种媒体(大语言模型(LLMs)就是在这种媒体上培养出来的),即使技术在不断变化。也许编码代理也应该开始在 stackoverflow 上发帖……

  34. 看起来,Stackoverflow 在 Covid 之前就已经开始走下坡路了。

    我想知道开发人员在此期间开始使用什么。

    1. 他们还在用,只是不做贡献了。这并不是说 StackOverflow 毫无用处,而是因为它已经回答了大多数问题。

      1. 而且真正的新问题会被积极地关闭。

      2. 鉴于技术发展的速度,我不认为这是真的。

        我认为它可能回答了五年前的大多数问题,但我想说的是:”它回答了大多数问题,但很多问题已经过时,而且没有简单的方法来判断一个答案是否过时。

        1. “按最近得票数排名 “这一功能可能已经存在五年了。

    2. 该图显示的是每月提出的问题,而不是每月回答的问题。在网站运营初期,该图表的斜率会更高,这完全合乎情理;随着时间的推移,许多常见问题都已得到解答。

    1. 你创办和运营 StackOverflow 并不是因为钱。你这么做是因为你真的在乎。经营利基社区并不是一条赚钱的路,而且(正如我们现在看到的)它们可能相当善变。

      此外,不仅仅是所有者……还有数百万做出贡献的人。

  35. 按照帖子的说法,似乎 SO 无论如何都会滑到地表之下,但大语言模型(LLMs)是众多因素之一,也许会加快这一进程,也许会加快几年。在对该领域没有深入了解的情况下,我觉得这种说法是对的。

  36. StackOverflow 的一个老事实是,浏览量与提问量不成比例。

    浏览量是发帖量/评论量的 1000 倍左右……我不知道这个统计数字这些年来有没有变化?

  37. 或者:所有编程问题都已解决!;-)

  38. 每个人都在指责人工智能,这无疑是一个因素。

    但是,Stack Overflow 的文化多年来也发生了很大变化。过去,任何人都可以在这里提出问题并获得帮助……而且效果惊人。

    如今,你的问题更有可能被降权、被标记为重复(不相关的问题),或者在评论中被过度热心的回复者攻击(一旦发生这种情况,你就很难真正得到帮助了)。你在网站上真正获得帮助的几率只有以前的一小部分。

    我并不只是作为一个新手才这么说: 我从测试版就开始使用这个网站了!作为一个用了这么久的人,网站质量的变化是不可否认的。

  39. 人工智能很棒,但当它卡住时,我就会去 stack overflow。我昨天就遇到了这种情况

  40. 这也难怪,首席执行官基本上是这么说的,他们会利用所有会员开发人员的免费劳动来出售人工智能的训练数据,以取代这些开发人员,那为什么还有人会继续在那里做贡献呢?

  41. 我猜想,类似 SO 的网站总会有一席之地,但它将转变为主要用于创建供大语言模型(LLMs)摄取的高质量数据。

    1. 这绝对是最糟糕的结果!人类辛辛苦苦地生产内容来训练人工智能

      多么悲惨的未来啊

      1. 即使有人付钱让你做出高质量的答案?

  42. > 这与我的记忆不谋而合,我曾觉得网站版主关闭合理的问题是一种权力寻租。

    恕我直言:像这篇文章的作者这样的局外人无权决定一个问题是否 “合法 ”或 “有效”(这是我经常看到的另一个术语,被那些既不了解 Stack Overflow 的标准也不了解其目标的人)。

    参考阅读:

    Stack Overflow 的目标是什么?(https://meta.stackoverflow.com/questions/254770)

    希望 Stack Overflow 用户付出多少研究努力?(https://meta.stackoverflow.com/questions/261592)

    问题关闭原因 – 定义和指导 (https://meta.stackoverflow.com/questions/417476)

    在关闭问题之前,我们应该等待发贴者澄清问题多长时间?(https://meta.stackoverflow.com/questions/260263)

    对 “Stack Overflow 上的粗鲁程度太高了 ”的讽刺性回答 (https://meta.stackoverflow.com/questions/262791/_/309018#309…)

    因细节和清晰度、调试细节、需要更多关注或质量很低而关闭问题的意义何在?(https://meta.stackoverflow.com/questions/405519)

    为什么我应该帮助关闭我认为有效的 “坏 ”问题,而不是帮助 OP 找到答案? (https://meta.stackoverflow.com/questions/429808)

    为什么积极评分的问题和答案的比率在稳步下降?(https://meta.stackoverflow.com/questions/393032)

    Stack Overflow 何时才能停止妖魔化那些使网站取得成功的关注质量的用户?(https://meta.stackoverflow.com/questions/366858)

    ChatGPT 和大语言模型(LLM) 是否会扼杀 Stack Overflow (https://meta.stackoverflow.com/questions/430994)

  43. 每月 25K 个新问题是怎么死的?即使逐渐趋同到只有 1K,这些问题的答案也足以继续作为大语言模型(LLMs) 的高质量训练数据的重要基础层。

    为了论证起见,我们假设 95% 的人类灭亡了。那么人类死了吗?并没有。

  44. 所有事物都有其存在的时间。

    有些会被取代。

    另一些则会通过自毁长城和/或湮没无闻的方式加速衰落。

    Stack Overflow 之所以默默无闻,是因为私募股权的漠不关心、其他地方有更好的文档以及版主缺乏领导力。早在大语言模型(LLMs)出现之前,Stack Overflow 就已经开始走下坡路了。

    这不是一个新故事–但它确实有助于勾勒出平台衰老的模式。

    这不是第一个,也不会是最后一个。

  45. 这只能怪他们自己。是的,人工智能大大加速了衰退,但我认为它主要是提供了一种使用起来不那么令人沮丧的选择。ChatGPT 从未说过您的问题不清楚或偏离主题。

    我认为,如果他们真正解决了审核问题,他们或许还有生存的机会,但我认为他们是依靠志愿者版主陷入困境的,因为他们认为许多有效的问题被关闭是件好事。

    事实上,他们也曾试图解决一些问题,例如,我记得公司曾建议用户至少可以重新打开已关闭的问题一次(这是一个很好的尝试!),但版主们把这个建议否决了,所以他们也就放弃了。

    我是以一个拥有 10 万声誉的人的身份这么说的。

    1. > ChatGPT 从不会说您的问题不清楚或偏离主题。

      是的,因为 ChatGPT 并不关心发布您的问题及其答案的明确目的是让其他人以后能通过搜索引擎找到它。它没有组织内容的任务,也不关心内容的质量。它没有理由关心主题。其他人不会阅读你的提示(甚至根本不需要试图提出问题),因此没有理由关心其他人是否能理解这个问题–更不用说弄清楚这是否是他们也想问的问题了。

      > 我记得公司曾建议用户至少可以重新打开已关闭的问题一次(这是个很好的尝试!),但管理员把它降到了地狱,所以他们就放弃了。

      问题可以重新开放,这一直是我们的原则。不允许的是 OP 单方面重开问题,因为这违背了关闭问题的初衷。关键在于,当您来到 Stack Overflow 时,您不能决定问题的标准是什么,也不能判断您的问题是否符合这些标准。因为如果是你,标准实际上就不存在了。

      你认为的 “版主 ”绝大多数都不是。

      > 我是作为一个拥有 10 万声誉的人这么说的。

      我发现,声誉分数并不能说明一个人是否了解网站的目的或网站的设计原理。著名的是,一个拥有 100 多万声誉的用户曾经疯狂地违反了元网站(https://meta.stackoverflow.com/questions/421831/)上最广为人知的网站政策(https://meta.stackoverflow.com/questions/430072)。许多拥有 10 万以上声誉和/或 10 年以上历史的用户可能从未查看过元网站。(参见 https://meta.stackoverflow.com/questions/427224,有人在 14 年后才第一次在元网站上发帖)。

      1. > 它没有组织内容或关注内容质量的任务。

        这正是 SO 出错的根本原因。版主认为他们在构建编程维基百科,但普通用户却把它当成了一个问答论坛。

        > 问题可以重新开放,这一点一直以来都是如此。不允许的是 OP 单方面重开问题,因为这有违关闭问题的初衷。

        的确如此。关闭问题太容易了,而且很少有人会重新打开问题。建议是用户只能单方面重开一次。

        > 我发现,声誉分数并不能说明一个人是否了解网站的目的或网站的设计原理。

        这正是问题所在。版主认为网站应该这样运行,但这并不是人们想要的运行方式!

        版主们希望它成为一个经过精心策划的参考网站,在这里只有完全符合常见问题解答风格的完美问题。他们并不在乎这使得它作为一个问答论坛变得毫无用处(或至少是极其令人沮丧)。

        1. 简而言之: Stack Overflow 一直以来的目标都很明确,那就是成为您认为 “出了问题 ”的网站,而且是由一个在公开场合积极讨论政策(并给出详细理由)的社区–而不是由其人数极少、不堪重负的管理团队–来实现这一目标的。有大量的历史文献证明了这一点,但这一意图需要时间才能得到连贯的解释,而且网站最初的发展速度远远超过了适当的把关速度。这得益于一个破损且构思欠佳的声誉系统,即使在 2023 年最终明确征求整体反馈意见后,该系统也从未得到应有的反思。此外,还有一些关于人性和激励系统的天真想法也起到了推波助澜的作用。

          —-

          再说一遍,你认为的 “修改者 ”绝大多数都不是修改者。

          我的观点是策展人–这是一个非正式的角色,任何人都可以通过阅读元网站、了解政策并尝试在这个过程中提供帮助。当然,关闭投票需要 3000 声望,但任何人都可以提交编辑,参与元网站只需要 5 声望(如果是关于自己的问题被关闭,则无需声望),标记帖子需要 15 声望,发表评论(解释问题的错误)需要 50 声望。

          你说你有 10 万声望。这比我还多。然而,我却采取了你所抱怨的所有行动,而且有时还非常积极地这样做(例如,我添加或移动了数百个重复链接到 https://stackoverflow.com/questions/45621722,并曾连续数周每天关闭投票)。我不是版主。

          网站有 2,900 万个用户账户,其中约有 10 万个账户可以进行关闭投票。有 24 名版主。

          问题实际上很难关闭。根据上述统计,有资格发表答案的用户数量几乎是 300:1,因此必须有三个人同意关闭问题。关闭问题的目的是防止问题在符合标准之前被回答;原则上可以符合标准的问题应该得到修正。但是,任何人都可以在答案区随便发布答案;要删除答案(答案不能单独 “关闭”)就更难了;而且答案的存在还会带来更多问题。

          问题很少被重新打开的主要原因是,被关闭的问题绝大多数来自新用户,他们丝毫不关心任何程序或目标,也不阅读向他们提供的关于发生了什么的信息,因此从未尝试解决这个问题。(顺便说一句,即使在 “删除 ”之后,他们也可能无限期地这样做–而且他们应该这样做,而不是重新发帖)。

          你所认为的 “普通用户 ”并不是决定网站是什么或如何运行的人。人们希望一个已经存在了 16 年的网站如何运行,这完全无关紧要。16 年来,人们一直希望它以这种方式运行,但这一事实也是无关紧要的,因为 a) 互联网上已经有无数的地方可以以这种方式运行,他们可以使用这些地方;b) 他们一直以来都在被指责,而且被指责的程度不一,手段也各不相同。

          如果有人开始尝试使用维基百科作为问答论坛,那么无论有多少人想这样做,他们被关闭都是正确的。我知道这里的人们对移民问题的看法各不相同,但我想你们都会同意,移民不应该在来到一个国家后就为这个国家制定新的法律。

          Stack Overflow 和所有 Stack Exchange 网站都不是论坛,这是设计的初衷。对此的经典解释(https://meta.stackexchange.com/questions/92107;尤其请参见罗伯特-卡泰诺的回答)最初是在 2011 年起草的。既然不是论坛,就不是问答论坛。它是一个问答网站,人们一直希望提问者的问题符合标准,以便他人从中受益。当然,随着时间的推移,这些标准也发生了变化–因为社区开始认识到问题的模式会分散注意力,无助于建立有用的东西。但是,我们始终坚持最基本的动机和认识:看看传统论坛上发生了什么;了解在这种环境中寻找或贡献信息的令人沮丧之处;做点别的。

          1. > 由一个在公开场合积极讨论政策(并给出详细理由)的社区来实现,而不是由一个人数少得不堪重负的版主团队来实现。

            当我说 “版主 ”时,我指的是花大量时间在版主问题和元讨论上的一小部分人。我说的 “版主 ”并不是指那些拥有额外权限的人。

            你可以说 “但它本来就应该被过度管理”。但这并不能改变这样一个事实:尽管如此,它还是很受欢迎,而不是因为它。

            1. 你这么说好像是希望我默认流行==好。

  46. > 2021 年 6 月: Stack Overflow 以 18 亿美元的价格出售给私募股权投资者 Prosus。事后看来,创始人杰夫-阿特伍德(Jeff Atwood)和乔尔-斯波尔斯基(Joel Spolsky)的出售时机近乎完美,赶在了终极衰退之前。

    嘿,如果这一切都毁于一旦,至少是房间里所谓最聪明的人随船沉没。只是一群风险投资人痛定思痛,发现自己根本不知道如何真正运营或发展自己买下的公司。“看看我们优化得多好!” 是啊–直接被打入冷宫。

  47. stackoverflow 早在人工智能之前就开始衰落了。这都要归咎于他们那些喜欢封禁的版主。

  48. 我想知道其他溢出者的情况如何?

  49. > 问题似乎在于 Stack Overflow 将于何时结束运营,或者其所有者以相对低廉的价格出售网站,而不是是否会发生。

    我看到了后一种选择,但前者呢?至少从他们发布的硬件信息来看,SO 两年前是在九台服务器上运行的[1]。这在成本上几乎不算什么–电费、上行链路和偶尔的硬件轮换,但可能一个工作体面的人就能负担得起网站的全部硬件。

    如果不在层层叠叠的复杂性上浪费数不清的金钱和精力,就能真正体现出预算的拮据程度。

    > 我相信,我们会看到开发者聚会和互相帮助的空间会继续流行–无论是 Discord 服务器、WhatsApp 或 Telegram 群组,还是其他形式。

    是啊,去他妈的。每个人和他们的狗都搬到了这些有围墙的花园里,这太令人讨厌了。谷歌无法捅破它们,不像以前的 IRC,让保镖公布日志很常见,WA/Telegram 有隐私风险,而 Discord 则是个地狱。

    [1] https://news.ycombinator.com/item?id=34950843

    1. 硬件通常只是网站运营的一小部分。

      1. 根据 “云原生 ”建议设置 StackOverflow,哎呀,这将是一笔不小的开支,而这正是我要说的。Cloudfront 用于全局负载均衡,ELB 用于在 Cloudfront 和 Kubernetes 之间架设桥梁,EFS 用于存储,RDS 用于数据库,EKS 和 EC2 用于计算,ElastiCache 用于 KV 缓存,CodeBuild 用于构建/部署管道…… AWS 的开销相当大。

        1. 哦,当然。AWS是个烧钱的地方。

          然而,在运行一个大型网站时,服务器并不是那种你只需插上插件就能忘掉的东西。服务器会出现故障,用户会触发边缘情况,有人会试图对你进行 DOS 操作,磁盘会填满等等。你仍然需要一些员工来处理这些事情

  50. 2008 年的股市就像这张图,看看我们现在在哪里?

    除非大语言模型(LLMs)可以立即接受所有新软件框架和语言的培训,否则我不担心 stackoverflow 还会有用武之地。

  51. 所有的 “溢出/交流 ”网站都很糟糕,不仅仅是 stack overflow。被关闭的问题太多了。我在 mathexchange 上的一个问题被关闭了,原因是,我猜测这个问题 “太明显”,尽管在 2021 年之前也有人提出过更简单的问题,甚至是更初级的问题。此外,我的具体问题以前从未在那里提出过,而与 mathoverflow 相比,数学交流的重点在于提出更简单的问题。

    但也有可能它正在转向类似维基百科的模式,成为一个答案库,而不是贡献库。在这种情况下,这与它的消亡并不相同。就像维基百科一样,即使很少有人再为它做贡献,它仍然可以获得大量的流量和收入。

  52. 有趣的是,当 “乐趣杀手”[0] 手握该网站时,该网站也停止了增长。值得注意的是,他们删除了投票率最高的问题 “你创造的新编程术语?

    这种明目张胆的不民主和破坏性行为当然受到了网站(前)用户的应有惩罚。

    [0] https://blog.codinghorror.com/new-programming-jargon/

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注