LibreOffice 指责微软使用“复杂”文件格式锁定 Office 用户

LibreOffice 近期一直处于进攻态势,只要有机会就会指责微软及其做法。如今,LibreOffice再次发声,指责微软“故意”使用“不必要的复杂”文件格式,以实现其Microsoft 365(Office)文档的用户锁定。

对于不了解情况的人来说,XML是一种标记语言,微软365和LibreOffice等程序使用它来结构化和定义文档。正如LibreOffice所说:

XML模式包含XML文档的结构、数据类型和规则,并通过XML模式定义(XSD)文件进行描述。这告诉计算机应预期什么内容,并验证数据是否符合规则。理论上,XML和XSD共同构成了互操作性概念的基础。

这两大办公套件在此采取了截然不同的路径。LibreOffice采用OpenDocument 格式(ODF),这是一个旨在不受任何单一公司控制的开放标准。该格式为我们提供了如.odt(文本文档)和.ods(电子表格)等文件格式。

元素周期表

另一方面,微软创建了其专有的Office Open XML (OOXML),以支持其软件中的所有功能,从而产生了我们熟悉的.docx和.xlsx文件。有趣的是,这两种格式本质上都是ZIP压缩包。验证这一点最简单的方法是将一个.docx文件重命名为.zip,然后解压它。这将向你展示一个Microsoft 365文档的内部结构。

正如LibreOffice所指出的,XML本应作为“桥梁”存在,但微软却通过将其设计得“复杂到成为障碍而非桥梁”的方式,将自己的架构变成了武器。LibreOffice将其比作铁路系统:轨道是公开的,但某家公司的控制系统如此复杂,以至于其他公司无法制造兼容的列车,这使得其他公司几乎无法竞争。乘客们并未意识到自己正被这些技术障碍所困。

这种复杂性的一个例子包括一个深度嵌套的结构,带有非直观的命名约定,以及如此多的可选元素,以至于实现该格式对任何不在微软工作的开发者来说都成为一场噩梦。即使是一个简单的句子,也会变成一个嵌套标签的迷宫,几乎不可能让局外人正确解析,尽管屏幕上的结果看起来相同。

LibreOffice在其他地方也看到了这种锁定逻辑。它将复杂的文件格式直接与推动Windows 11升级联系起来,认为微软没有技术上的正当理由强迫用户升级,这一举措似乎仅旨在让客户继续依赖其产品。因此,它敦促Windows/Office用户放弃该操作系统/办公套件,转而使用Linux/LibreOffice。

共有 131 条讨论

  1. > 这两款办公套件在此处采取了截然不同的路径。LibreOffice采用开放文档格式(ODF),这是一个旨在不受任何单一公司控制的开放标准。而微软则创建了自有格式Office Open XML(OOXML),以支持其软件中的所有功能,从而带来了我们熟悉的.docx和.xlsx格式

    微软的这一做法堪称巧妙而隐蔽:当OpenOffice.org(LibreOffice的直接前身)在OO.o 2.0版本中将ODF设为默认格式、其热度达到顶峰时,微软恰好推出了与ODF竞争的“Office Open”格式,而此时MS Office首次面临一个既可行又受欢迎的竞争对手。

    https://www.openoffice.org/press/2.0/press_release.html (2005-10-20)

    https://news.microsoft.com/2005/11/21/qa-microsoft-co-sponso… (2005-11-21)

    1. 我高度怀疑除了极少数技术娴熟的人之外,没有人听说过“Office Open XML”或“OOXML”。对普通人来说,.docx 只是更新版的 .doc

    2. 而 OOXML 基本上只是微软 Office 内部结构的序列化,某些元素带有“likeword95”等属性。

      微软搞了个彻底的烂摊子,而它的用户根本不在乎。

      1. 我觉得你搞混了一些东西。根本不存在“likeword95”这样的属性。

        在标准化过程中曾有提案建议添加几个类似名称的属性,但其中大部分指的是非微软产品如WordPerfect,最终这些提案并未被纳入最终标准。这可能就是你所指的内容。

        其目的是允许编写WordPerfect到OOXML转换器的人员,在OOXML文件中标记使用了无法在OOXML中复制的特定WordPerfect格式的位置。

        OOXML文字处理器在遇到这些标记时应予以保留,但绝不能自行添加。

      2. 是的,情况很糟糕,但用户确实关心。大多数人别无选择,因为商务设备默认安装了MS Office/Outlook/Teams,他们无法更改。

        1. 他们并不真正关心。我拒绝了需要大量使用MS软件的工作,也拒绝打开Photoshop文件和其他各种专有格式文件。

          他们可能在乎,但只是在乎一点点,绝对不够让他们为此感到不便。

  2. 我认为自己有资格对此发表看法,因为我既是Word的前资深用户,也是从零开始为律师开发文字处理器的开发者[1])。我花了很多时间研究.doc和OOXML规范并实现它们。从这些规范中可以明显看出,从1984年计算机内存不足、RAM四舍五入到零的时代,到2000年代XML成为热门概念,再到今天微软希望所有人都永久使用云服务。

    与集成开发环境(IDE)或通用文本编辑器不同,开发者对这些工具充满热情,并通过自托管来测试产品,而文字处理器则相对枯燥,需要单独的测试/质量保证。

    微软有足够的资金来支持开发和测试/质量保证。LibreOffice则没有。

    商业模式明确表明,采用GPL许可证的LibreOffice已难以为继。

    [1] 推荐:https://tritium.legal

      1. 其中有一句话让我印象深刻:

        > 归根结底,当前版本的Word和Excel投入了数千年的开发人员工作时间,如果你真的想完全克隆这些应用程序,你将不得不投入数千年的工作时间。

        这显然是不正确的。在任何时间点,这些产品中实际活跃的开发人员年数仅占总数的极小部分,因为其中大量开发人员年数用于替换其他开发人员年数的工作成果。

        这就像1170亿人类曾经存在过,而目前只有80亿人类(在工业革命之前,任何时候也只有几百万)——我们已经存在了一段时间,据说。

        而且这还忽略了试图重新实现Office的人正在追赶一个现有的东西,而不是试图从头开始创造它。其中大量开发人员工时用于设计和研究,而非机械实现。

        1. 我部分同意。最终版本的增长并非线性,但估计仍类似于sqrt(时间)或类似函数。其中包含大量重构和后端改动,但也积累了许多晦涩的“功能”。

          (如果能对Chrome或其他大型开源项目的代码行数(LOC)进行研究就好了。LOC并非完美指标,但总比凭空猜测好。)

          Word有一个兼容性配置窗口,其中包含许多奇怪的功能,比如(完全杜撰的)如果项目符号列表在新的页面开始,则添加3像素,因为这是WinWord 1.7的默认设置。类似的配置项还有十几个,用于模拟十个版本,甚至其他编辑器。

          此外,很久以前Word有一个“功能”,会自动将每个首字母缩写转换为带有虚线下划线和悬停时显示矩形的“迷你卡片”或“智能卡片”之类的东西。这很烦人。至今仍保留着显示这些内容的代码,甚至可能还有生成它们的代码。

    1. 微软可能财力雄厚,但有些Word文档在LibreOffice中能正确打开,MS Word 2007也能正确打开,而MS Word 2024却无法打开。

    2. > 商业模式明确表明,采用GPL许可证的LibreOffice已无生存空间。

      只有当Word格式保持主导地位时才成立。随着欧盟放弃Word,或许会有希望出现一个真正的替代标准。

      1. 随着AI工具日益主导,企业将希望其文档能被AI完全读取,无论采用何种格式。我不会对未来几年围绕这些问题展开的争夺战感到意外。

      2. 文档格式本身并不重要。问题在于编辑器本身及其巨大的复杂性。

        1. 复杂性与问题有何关联?LibreOffice已为大多数用户提供了99%所需的工具,唯一缺失的是可靠读取专有Word格式的功能。

    3. *仔细研究

      律师也倾向于仔细研究,所以用词要准确! 😉

      1. 据我所知,世界上确实有非英语母语的律师

  3. 自成立以来,微软的战略就是在进入任何领域时大量开发专有技术,并以一种锁定客户的方式进行,使得一旦其产品不再是市场领导者,客户也难以轻易离开。他们在每个产品和市场中都采取这种策略。在无法最终胜出的领域,他们会收购竞争对手并整合其产品,然后逐步淘汰该产品。

    1. 有必要提醒人们这一点,因为他们误以为微软整合开源项目(如Git、Linux等)是出于善意。众所周知,这只是“拥抱、扩展、淘汰”策略的第一步。下一步(正在进行中)是添加大量仅在微软生态系统中运行的功能,最终将这些原始工具宣布为过时技术,不允许在企业中使用。

      1. 他们甚至对ISO C也采取了同样的做法。他们声称像strlen这样的可移植函数已过时且不安全,而他们推荐的替代方案则是MSVC专有的。

      2. 我认为没有人会认为微软与git或Linux等项目合作是出于善意。他们这么做与其他人一样,是因为用户/客户都在那里,他们想从他们身上赚钱。这并不是什么邪恶的阴谋,只是正常无聊的为人们构建产品的方式。

        1. > 只是正常无聊的建产品方式

          微软从未寻求正常无聊的建产品方式。一家软件公司若抱有这种想法,很难取得进展。他们正在使用其老旧但成功的策略:拥抱、扩展并淘汰。

    2. 说实话,我在微软从事过Excel相关工作(虽然与文件格式相去甚远,且是在OOXML推出很久之后),但我可以肯定,OOXML的结构之所以复杂,是因为这样更容易与应用程序使用的数据结构相匹配。

      1. 作为一个感兴趣的第三方,我的看法也是如此。

    3. 是的,他们变得更加狡猾了。VS Code和专有的Pylance、远程SSH等。

    4. 盖茨甚至没有开发过DOS。他是从别人那里买来的并重新品牌化。他从第一天起就是个骗子。

      1. ……精明的商人就是骗子?80年代和90年代的微软确实有很多值得批评的地方,但公平地购买 DOS 并围绕它构建生态系统只是一个明智的商业决策。他们被起诉并差点被拆分的那些事情才是可疑的部分。

        1. 他被称为骗子是因为他与IBM签署了一份供应操作系统的协议,而当时他根本没有操作系统。当然,从现在来看,他“聪明”地去购买了一个,但事实上,他向IBM承诺了自己没有的东西,在另一个平行世界里,他可能会因此被起诉。

          1. 如果我订购一辆新车,它可能还未存在。交易的条件是在某个约定日期前交付车辆。我认为盖茨所做的事并未比类似的购车交易更违法。或许风险更高,但那是完全不同的事情!

            1. 如果存在隐藏风险,出售商品是不道德的。你不会明知一家公司声称懂得造车却缺乏实际经验,还从他们那里订购汽车。

              也许IBM已被告知并理解了风险,但据我所读,盖茨对微软实际拥有的东西并不坦率。

            2. 如果你从一家不知名公司订购汽车,你可能会幸运地得到1963年的兰博基尼,但也可能得到2004年的Aptera Motors。

          2. 根据快速搜索的顶级链接,似乎IBM完全清楚他们是通过微软转授权操作系统:

            https://www.pcmag.com/news/the-rise-of-dos-how-microsoft-got…

            https://thisdayintechhistory.com/11/06/ibm-signs-a-deal-with…

            来自第二个链接:

            _然而,微软知道一家名为西雅图计算机产品公司的小型企业开发了一款与CP/M类似的操作系统,名为QDOS(Quick-and-Dirty Operating System)。微软向IBM建议QDOS可作为IBM PC的操作系统。IBM要求微软获得该操作系统的许可并进一步开发,这导致了1980年11月6日正式签订合同。合同签署后,微软于1980年12月开始授权QDOS操作系统,着手开发IBM PC版本。

      2. 至今仍是唯一能跨过椅子的大型科技公司CEO

        1. 新商业创意:向科技公司CEO出售小型豪华椅子。订阅服务,若每月未支付百万美元,将失去跳过椅子的许可。

        2. 但我打赌他无法像猴子男孩鲍尔默那样扔椅子。

  4. 这怎么会上HN首页?这里连新闻都没有。这只是关于20年前的XML文件格式的争论,而现在文件格式已经无关紧要了?

    此外,Office支持OpenDocument格式,就像LibreOffice支持Office格式一样。

    而且,据我所知,Office XML文件格式在第三方应用中支持得更好——无数应用可以读写这些文件。我安装了多个能读写Office文件的应用,但我的机器上唯一能打开OpenDocument格式的应用是MS Office。

    1. 这是一个老问题,至今仍在损害用户自由并阻碍LibreOffice的采用,原因在于微软的反竞争行为。你是在说这不值得讨论吗?

      1. 作为用户,我肯定会提出这个论点。普通用户只是希望尽可能减少摩擦,微软不在乎,而开源软件开发者只能在这个环境中生存。作为更广泛的开源软件开发和使用论点的一部分,这里可能有一些值得思考的地方,但即使我们中有十几个人抱怨,微软也不会改变它的做法。

        最近我对Chrome/FF的事情感到恼火(好吧,对Chrome感到恼火,作为普通用户对Firefox的相对不足也感到恼火),所以想了想创建一个新网页浏览器需要什么。这太复杂了;需要实现的东西太多了。HTML/JS/CSS过于复杂,设计用于几乎没人会遇到的使用场景,而且为了兼容性,你几乎必须实现Chrome所做的一切。Firefox居然存在真是不可思议。

        我决定作为一项练习,构建一个基于CrypticWeb并运行Mystic Beaver Protocol(MBP)的全新互联网;想必你听说过这些,它们在我家非常流行。这非常简单;与其分叉互联网添加更多垃圾,我们从头开始。我们不使用JS,而是使用水车文件(.ww),这些文件会修补运行在状态化服务器上的Python脚本。我甚至将服务器移植到了Micropython,并可以在我的小指上放得下的ESP32C6上运行。客户端是用Python编写的,它解析服务器发送的简单JSON负载,以渲染并根据需要与服务器交互。

        一切运行正常,但人们被困在這個過度複雜的Bad/Legacy/Corporate/Devil互聯網中。真是令人失望;醒醒吧,羊群!

    2. 微软Office甚至与自身不兼容,尽管它有专属的文件格式。例如,Excel中的公式在不同语言版本之间无法移植。

    3. 是的,这基本上就是LibreOffice的广告。在2025年抱怨Office中的XML是荒谬的。

  5. 为什么标题说“抨击”,但 neither 标题 nor URL 包含“抨击”?我认为任何提到“抨击”的内容都不值得阅读。

    1. 为了在 HN 提交标题长度限制内节省 4 个字符(相对于“指责”),我猜是这样。

    2. 我认为微软不会在意任何人的批评,更不用说LibreOffice了。

    3. 这太荒谬了,显然是为了吸引眼球。这样的标题应该贴上“点击诱饵”标签。

  6. 这是一种遍布整个行业的瘟疫。这种格式在很大程度上受到某家公司设计其自身产品的影响。多种文档格式都存在这个问题。但你也可以在PCI DSS和其他标准中找到完全相同的情况。比如,某家公司设计了一款用于扫描特定漏洞的工具,突然间它就成了强制要求。这简直荒谬。

  7. 不仅仅是复杂的XML格式。Word与Skype、Teams、SharePoint、OneDrive等工具存在协作集成

    这是一个完整的生态系统

    此外,我尝试过使用LibreOffice,但必须学习全新的工具。用户界面也截然不同。Word当然也有自身问题,但LibreOffice的使用体验并不如Word流畅

    Word 中有一些遗留功能和从过去继承下来的特性,它们带有各种细微差别。这些功能也不是全部都有文档记录

    试图完全复制 Word 的外观和感觉是非常困难的

    大多数人会在企业环境中遇到 Word,让他们切换到其他工具将是一项巨大的挑战

    1. 我遇到的非技术人员中,很少有人能分辨出Word和WordPad的区别,或以不同方式使用它们。

      30岁以下的大多数人可以在Google Docs和Word之间无缝切换。他们使用的功能也仅限于其中少数几项。

      你提到的“巨大障碍”不过是幻想。

      1. 你说的对,对于家庭用户来说是这样。但在企业中,这座大山还包括一些用户是重度用户,他们以略微不同的方式将自己锁定在特定系统中。此外,公司本身也通过深度依赖微软生态系统(如AD、SharePoint和Windows等)将自己锁定,要摆脱这种依赖将耗费大量时间、精力和金钱。

        1. 如果律师和财务分析师需要使用Windows Office进行特定工作,就让他们继续使用。但我需要指出,我之前撰写的一本书的第一版中包含SharePoint工作流,但在第二版中已不再使用。

          许可证/支持成本较低确实有一定优势。但Windows在桌面端与Linux的竞争中并未取得太多胜利。然而,Google Docs在协作和整体简便性方面确实赢得了许多公司的青睐。

        2. 我的评论主要针对Word。在商业领域,微软生态系统确实存在大量锁定效应。但这是大型官僚机构的本质。它们在UPS和FedEx之间切换,或在Staples和OfficeDepot之间切换都困难重重。脱离微软生态系统的难度远超这些。

    2. > 我尝试过使用LibreOffice,但必须学习全新的工具。

      我很少使用文字处理软件,每次使用都感觉像在学习新工具。无论是Word、Google Docs、LibreOffice还是其他任何软件。

      我必须承认,Google Docs和Word都比LibreOffice显得更“精致”,后者仍给人一种典型的90年代桌面程序的感觉。我想可能是因为它确实如此。

      1. 最近,我在一家主要使用开源软件的公司工作,该公司尽管遭到许多人的反对,还是从LibreOffice切换到了Google Docs。无论是软件本身还是协作能力,这都带来了天壤之别的改进。

      2. LibreOffice 在设计上大量借鉴了旧版 Office 的布局。而像 OnlyOffice 这样的替代品则借鉴了当前 Office 的布局。

        1. LibreOffice 此前名为 OpenOffice,而 OpenOffice 此前名为 StarOffice,这是一个办公套件,其根源可追溯至 1985 年发布的 Zilog Z80 处理器专用文字处理器 Starwriter。

    3. 有一段时间,LibreOffice 和 MS Office 的功能几乎不相上下。

      但微软围绕这些系统构建了一个巨大的专有服务生态系统,一旦用户被吸引到这个环境中,就很难切换到其他系统。

      切换到其他系统需要相当大的成本,同时还要满足公司不同角色和经验水平的各种工作流程。

      如果不是MS Office及其M365生态系统,那该选择什么?Google Workspace?那不过是换汤不换药的问题?

      1. Google试图让学生在学校使用其产品,效果还不错。但当需要进行严肃工作时,必须使用微软产品。Google的产品就像玩具一样

        1. 大多数严肃用户使用非微软产品也完全没问题。问题在于文件兼容性。不幸的是,网络效应确实存在。而且大多数用户根本没意识到他们其实不需要一直向微软砸钱。

          1. 我对高级谷歌文档了解不多,但我知道谷歌表格的情况远非如此。谷歌表格覆盖了Excel的大部分功能,但严肃用户绝不能用表格替代Excel。

            我们有很多市场和销售人员想用谷歌表格代替Excel,从共享的PG数据库导入销售报告。这是Excel的内置功能(将PG表加载为表格)。Google Sheets显然不支持任何导入功能。所有导入插件都是付费的,且按行、单元格或列收费。

            你可以编写插件实现该功能,但Google的AppScript环境(一种自定义的同步JavaScript/V8环境,不支持异步操作或回调,且承诺会阻塞)存在限制。

            不过,该插件仅能连接到 MySQL。PG 支持请求自 2011 年起便已提交。他们于 2014 年决定不计划支持 PG。2018 年又认为或许只能支持 GCP Postgres。[1]

            好吧,那你自己创建 API 调用并加载数据。不,你不能返回超过 50 MB 的数据。所以最好将查询拆分。

            哦,你想加载一个 50MB 的 CSV 文件?为此有 3 个不同的 API:

            – “从 GDrive 导入”。这是你想要的。几秒钟内即可导入 50MB 数据。但它需要用户 GDrive 的完全访问权限

            – “基本导入API”。该API以约100kbps的速度导入数据,但不总是如此。对于大型数据,速度会变慢。

            – “高级导入API”。该API以约250kbps的速度导入数据,但不总是如此。对于小型数据,速度会变慢。

            你需要运行自己的基准测试[2][3]来了解在何种情况下使用哪个API,然后随着情况变化继续重新运行这些测试。

            [1]: https://issuetracker.google.com/issues/36752790?pli=1

            [2]: https://gist.github.com/tanaikech/d102c9600ba12a162c667287d2…

            [3]: https://gist.github.com/tanaikech/030203c695b308606041587e6d…

            1. 我总是对人们对微软产品如此苛刻感到惊讶,而使用这些产品的根本原因往往是因为它们是市场上最好的选择,功能最齐全,能够实现其他产品难以实现甚至无法实现的功能。

              最令人发指的是苹果粉丝们试图声称iWork套件可以替代微软Office。当然,如果你只需要写信和简历,它可以做到,但到目前为止,任何免费的办公套件都可以做到……

            2. > 但一个认真的用户永远无法用Sheets替代Excel。

              这没什么意义。

              1. 如果你继续阅读,可能会理解其中的含义

                1. “严肃用户”会用其他软件以不同方式完成某些任务。没有什么是不可以替代的。

                  唯一的问题是他们是否愿意学习以不同方式完成任务。

                  1. 从泛泛而谈的角度来看,这没有意义,因为并非每款软件都具备其他软件的所有功能。

                    但具体来说——选择他们的关注点,描述使用Sheets的替代工作流程,然后解释为何这是个不错的替代方案

                    > 唯一的问题是他们是否愿意学习以不同方式完成任务。

                    当然这不是唯一的问题,其他问题可能包括他们是否能承担在学习后花费大量时间/金钱(尽管这笔投资也不应被忽视)来做同样的事情,以及他们是否能为所有依赖当前工作流程的人做同样的事情

              2. 如果你反复说某件事,它最终会成为事实。

        2. 我持相反观点。如果我对某件事五年后是否不可逆转并不在意,或者不在意它在不同打印机上打印效果不同,那么微软办公软件(MS Office)就能满足需求。

          不过,我经常与他人合作。谷歌在这方面做得更好

          1. 我最初在攻读硕士学位时,团队项目中大量使用了谷歌文档,但最终我们切换到了公司内部的Teams协作空间。我们无法让谷歌文档匹配作业所需的格式。Word则能直接使用。

            1. “作业所需的格式”具体指什么?是“Microsoft Word”吗?

              1. 文本的内容和格式在Google Docs中无法复现,比如正确的字体、页眉、页脚等

    4. 如果LibreOffice足够聪明,他们会为学校和大学提供免费许可,这样学生可以学习它,然后在未来工作时要求使用它。

      也许他们甚至可以将源代码发布在copyleft许可证下,这样学生可以从中学习并可能做出贡献。

      1. LibreOffice是免费的,并且遵循GPL许可证。

  8. 这里的关键是,当面对客户对开放的 ODF 标准的兴趣时,微软创建了一个完全不同的“开放”标准,然后利用其影响力来推广它。这是许多技术行业中主导企业常用的惯用手法。关键在于不要过分推广自己的标准,否则它可能会成为真正的行业标准。你需要保持平衡以维持两个标准,从而显著削弱两者的影响力。

    或许微软已到不再感到ODF威胁的阶段,并通过增加复杂性来降低自身标准的价值。微软还会费心制作符合任一标准的文档吗?

  9. 每个人都应该停止与Office竞争,而是专注于打造更好的办公软件。

    事实上,如今没有人需要兼容性。每个人要么:

    – 在整个公司范围内使用同一款软件,无论是LO、Google Docs还是MS Office

    – 在与组织外的人共享文档时导出为PDF

    LO真正缺乏的是服务器端托管和轻松同步功能… 在他们实现这一点之前,它只会是个人和小型组织使用的工具。

    我仍然记得,在我的大学里,实验室电脑上安装了LO,而MS Office是学生必须购买的“必备品”,但大多数教授坚持要求我们提交作业时使用Google Docs链接,因为.doc、.docx格式与LO生成的格式之间存在兼容性问题…… Google Docs是唯一能通过链接在每台电脑上实现100%同步共享的工具。

    如果LO提供基于网页的托管解决方案,并为组织提供易于安装的服务器代码,他们就能主导市场。但他们没有……

    1. LibreOffice同时具备这两项功能,由Collabora(LibreOffice的主要企业开发者)提供。

      1. 嗯……他们可能需要更多宣传这一点,或将两者关联起来。我之前完全不知道它们有关联。此外,Collabora 的官网设计糟糕,尝试使用起来非常困难……

      2. 我曾努力尝试使用 Collabora 的“网页”解决方案。但它完全无法使用。

        对于不了解的人:它在服务器上渲染整个LibreOffice界面并传输给你。非标准布局(我使用Dvorak)下的热键问题、语言切换问题、鼠标行为问题、剪贴板问题,一堆麻烦。当然它对资源需求很高。不行。这不是正确的方式。

        1. 你确定这不是基于VNC的Collabora Office桌面版本演示吗?

          我不会对他们的网页版本是那样感到太惊讶(考虑到第一个版本发布的时间已经很久了),不过Nextcloud使用的是基于Collabora的系统进行在线编辑,我怀疑他们不会选择那种方案。

          目前已有在线ODT编辑器(例如https://webodf.org/demo/ci/wodotexteditor-0.5.9/localeditor….),因此即使Collabora的编辑器表现不佳,要开发一个更好的版本也不算太难。

  10. 我怀疑这并非明确的“锁定”策略,更多是反映了内部复杂性日益增加以及对产品质量的忽视。我敢打赌内部团队也对这些过于复杂的结构感到头疼。

    1. 到了这个地步,我怀疑微软甚至无法再执行“锁定”策略。

  11. 不要在无能足以解释的情况下归咎于恶意。

    微软并非故意混淆docx格式。docx之所以一团糟,是因为数百个微软商业计划、高管个人项目和古老的兼容性规则相互碰撞,最终形成了一堆垃圾。

    如果LibreOffice担心docx对他们的生产力有何影响……你应该看看微软内部的工程师们是如何抱怨docx对他们生产力的影响的。

    这堆垃圾不是任何人的计划。这堆垃圾是一种像后院的白蚁丘一样自发形成的现象……没有单只白蚁对此负责或了解,但它们共同堆积成了一堆破坏你割草机的垃圾。

  12. 我明白大多数人缺乏技术素养,但如果给Markdown和Pandoc加上一个图形界面,难道不能满足99%用户的需要吗?

    当然,当你需要格式化,比如写正式信件时,你会使用别人制作的模板,但这并不是大多数人使用Word的目的。

    别让我开始谈论“人们不会理解如何加粗或斜体”;他们连Word都用不好。不如使用更简单的东西。Office“生产力”套件对我来说已经过时了。

    1. 如果你对格式化如此不在乎以至于Markdown就足够了,那你也不会在意docx文件中那些复杂的边界案例。

      1. (1) 这些看起来很棒——我保存了《影响》以便以后继续阅读。你能分享一下这份文档的背景或原因吗?

        (2) 希望你能指点我一下。我经常用 Markdown 与客户做笔记,然后在通话结束后进行整理。此时,我希望能够将其导出为一个外观精美的 PDF,以及可以粘贴到 Apple Mail 中的 HTML。我已经尝试过 Markdown –> Pandoc –> HTML 的流程,但逐渐意识到需要更深入地研究 Pandoc,理解其 HTML 模板,并创建 CSS。我不确定是否应该采用 Markdown–>HTML–>PDF 的流程。我理想中的“流程”应该是这样的……

        pandoc 2025-07-18_Client1_Topic.md –style “Client1.css” —output 2025-07-18_Client1_topic.pdf –output 2025-08.18_Client1_Topic.html

        在研究Pandoc时,我感觉还需要学习TeX排版。目前我还没找到这方面的“解决方案”,所以想听听你的想法。

        目前,我使用Obsidian进行笔记记录。然后通过“Copy as HTML”第三方插件将Markdown笔记转换为带主题的HTML格式。接着在MacOS TextEdit的富文本格式下粘贴内容。在此过程中,我可能会进行一些文本格式调整,例如清除[ ]标记的 Markdown 链接等。接下来,我将内容从 TextEdit 复制并粘贴到 Apple Mail 中。有时我会手动为标题添加颜色,并进行其他基本格式设置。在此步骤中,我会添加“Hello, ”和“Sincerely”作为邮件开头和结尾,然后发送。随后我会通过 iPhone 邮件应用检查邮件在深色模式下的显示效果。

        这似乎是“笔记工具”领域的一个巨大缺口,但我希望只是我对某些能处理此工作流的优质工具不了解:在通话中记录笔记,然后以美观格式通过邮件/PDF发送给客户。

        感谢您分享任何想法或建议!

        // JRO

        1. cmark 是一个易于构建的 C 项目,它读取 Markdown 格式(CommonMark,但足够接近),我也在 Obsidian 中使用它,并将内容转换为 XML 或 HTML 格式。你可以通过 XSLT 等工具自动化部分转换过程,不过我得承认这需要一定学习成本。

    2. WordPad、Notepad 或 TextEdit 已经预装在计算机上,对于大多数写作和打印沟通来说完全足够。

  13. 我可以确认。当尝试将简单的 Word 句子和表格从 Word XML 转换为例如 Markdown/HTML 时,你需要对 XML 的边界情况和嵌套垃圾有深入了解。

    1. 我好奇微软的这个工具是否能处理:

      https://github.com/microsoft/markitdown

      当我意识到Word文档只是ZIP文件,且可以查看其中嵌入的XML文件时,我感到惊讶。

      我曾在2017年几乎实现了一个可工作的React到Word文档渲染器,但它不支持创建包含冒号(:)的XML标签(而OOXML文档使用这种标签)。

    2. 虽然看到“香肠是如何制作的”并不美观,但从docx文件中提取格式化文本绝对可行,无需博士学位。来源:我曾将其作为一个小任务完成,因为它有助于审核一组Word文档。

  14. 我曾经很喜欢OpenOffice.org,但在当今世界,没有现代的网页协作选项,它已经过时了。我了解到有人试图让它通过浏览器运行,但不,它们还远未实现,甚至相差甚远。

    我们今天需要的是一个以网页为先的应用程序套件,它能完成Google Docs/Spreadsheets/Slides的所有功能,但使用OpenDocument标准作为其原生文件格式。

    1. 它并未消亡,因为它仍可用于许多场景。我用LibreOffice Writer撰写大量文档,并经常使用LibreOffice Calc进行财务计算。此外,LibreOffice Calc这个名字很蠢,因为它与应用程序启动器中搜索子字符串的计算器冲突。

      1. 最后一个问题可以用一个不同名称的别名轻松解决?

  15. 我在工作中使用LibreOffice打开和编辑MS Office文件,大部分情况下都正常,除了PowerPoint(缺失字体以及其他问题)。总体而言,我认为LibreOffice团队做得非常出色,尤其是在支持MS文件格式方面。当然他们必须这样做,因为我(我想大多数人也是如此)实际上用LibreOffice打开的MS文件比其原生格式文件更多。

  16. 我真的很希望看到一个尽可能使用.md和.csv格式的办公套件。

    我主要使用LyX和pyspread,它们足够接近/开放。

    1. > 我真的很希望看到一个使用.md格式的办公套件

      它叫做pandoc和一个文本编辑器。

    2. CSV是通往地狱的门户。Markdown很棒。

  17. 在为多家公司工作后,我认为复杂的文件格式很可能是由于员工流动、管理层的压力要求尽快完成工作,以及粗心的编码所致。并非出于恶意的反竞争行为。这种锁定可能是微软的意外收益。

  18. 我没想到我们回到了2007年。我曾大量使用 OOXML,是的,文档确实晦涩且经常缺失,但如果你在他们的论坛上联系微软,他们会提供帮助。我经常看到 LibreOffice 开发者在那里!

    但这种复杂性并非某种阴谋——它是内在的——源于Office系统历史悠久且极其复杂,拥有海量功能。许多功能都是在旧版本类似功能的基础上以向后兼容的方式实现,随后整个系统又从一堆C结构被回溯移植到XML格式,而XML拥有可想而知最糟糕且功能匮乏的模式语言。

    1. > 这种复杂性源于 Office 系统历史悠久且极其复杂,拥有海量功能。

      据我所知,微软在 OOXML 规范中做出的诸多不幸决策之一(无论是有意为之、无意为之,还是两者兼有),就是将大量显示和格式化怪癖直接硬编码到 schema 中,且几乎没有提供任何解释或文档。本应将其封装为独立的命名空间或层级结构。

      因此,要实现 OOXML,你还需要反向工程,例如 Word97 等的行为。

  19. 与此同时,是否已经发明了更好的现代、功能丰富且可扩展的富文本格式?

    1. PDF规范设计得既非常可扩展又易于阅读。

      但尝试编辑它简直糟糕透顶。

      这是因为PDF的结构本质上是一系列媒体“流”。你可以轻松指定“在页面此位置渲染一张JPEG图片”,但仅此而已。它不会存储例如需要在页面上换行等信息。而是“这里有一个包含文本的框”。

      让PDF渲染变得困难的唯一原因可能是Adobe在规范中加入了大量冗余内容。例如,完整规范曾支持运行JavaScript和Flash(不确定现在是否还支持)。

      1. JavaScript应该还在,因为我认为这就是表单验证的工作方式?不过我不记得Flash曾经存在过。

        1. 那是Acrobat Reader,但不在标准中。有一段时间只需要阅读器,不需要播放器。

    2. 不。有数百个程序可以轻松读取和创建PDF。另一方面,读取.docx文件很麻烦。我可不会为Adobe辩护,但PDF与MS Office格式完全不同。

      1. 哦,这不公平。许多PDF不符合规范,而Acrobat如何处理它们完全没有文档记录。

        1. 几年前苹果推出Preview时确实很有趣,它渲染PDF文件的效果甚至比Adobe自己的Acrobat更好

          1. 没错,这是一款很棒的应用,是我继续使用MacOS的主要原因之一——但仍有某些功能必须依赖Adobe Acrobat,比如填写我所在国家的税务表格就需要它。

      2. 我是说渲染部分。据我所知,渲染器并没有那么多。

    3. 不,如果考虑它针对的PC,这个规格确实不错。

  20. groklaw.net对此进行了深入分析。据我所知,微软从未实现过其自有格式之间的双向转换,更不用说ODF了。这是一种锁定策略,微软会派人加入ODF委员会(不记得官方名称)从内部破坏它。

  21. 题外话:有没有一个Firefox扩展可以屏蔽包含“slams”、“claps back”、“rips”等词的文章?

  22. 微软不会锁定用户。

    是用户自己选择锁定。

    1. 你可能没错,但对那些接受大多数人甚至不理解或不在意的便利功能的人大喊大叫,在我看来有点无意义。为什么只停留在文档格式上?为什么不对他们选择Windows本身感到愤怒?

      你觉得这样做有什么好处?我真的很想知道。

      1. 根据StatsCounter的数据,Linux现在占桌面用户市场的5%。 🙂

        ChromeOS占2.7%,macOS占24%左右。

        编辑:如果我猜得没错,Valve/Steam至少占了这5%中的1%。

      2. > 为什么不因他们选择Windows系统本身而感到愤怒?

        因为这并不一定影响到任何人。使用Windows系统本身并不意味着你会发送一个需要Microsoft程序才能阅读的文件。

        我家有两台Windows电脑,它们都安装了LibreOffice和Firefox。

        1. 不,但我认为最可能对这一切毫不知情的人,正是那些默认使用微软专有格式程序的人……如果其他人也这样做,我甚至不会说他们错了。

          人们经常给我发送我完全无法阅读的Outlook邮件,以及许多在Linux上没有任何软件支持的Excel电子表格和PowerPoint演示文稿。我不得不使用安装了完整Office套件的Windows虚拟机来阅读这些文件。而且不仅是工作文档,还包括我孩子学校和老师发送的文档。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

你也许感兴趣的: