脊髓损伤的重大医学突破竟然源于一个计算机程序

以脊椎损伤治疗的新进展为例,新软件可以从早已被遗弃的研究数据中,挖掘信息并为研究人员提供新的方向。

医生们发现一个过去未知的关联,即脊椎损伤病人的长期康复与他们早期手术中的高血压之间存在联系。这看上去不太像什么医学新闻 —— 尽管它对于临床有直接的影响 —— 但重要的是一开始是如何发现这个关联的。

这个成果并不是出于什么新的长期研究,而是源自对一项失败基础研究进行的元分析,20 年前的这项基础研究现在价值六千万美元。这个项目是由加州大学旧金山分校的一群神经学家和统计学家主导,并和一家名为 Ayasdi 的软件公司合作完成的,其中用到了数学和当时还未发明的机器学习技术。描述这一过程的论文刊登在了《自然通讯》上,从而预示着从失败科学实验数据中挖掘医学重大突破的可能性。

“过去被认为是打了水漂的研究,现在被证实有着巨大的价值”,亚当·弗格森说道,他是加州大学旧金山分校脑和脊椎损伤中心的首席研究员,同时也是论文作者之一。尽管仍有待人体实验的证实,这一发现引发了一系列有趣的问题 —— 很显然科学家们是否该发布他们的原始数据供后人使用;还有相对于展开新的科学实验,是否应当把时间和经费投入到对旧有实验的分析上去。

弗格森领导的科研小组从精心重构数据开始,这些数据来自于对 3000 只动物的研究,其中有 300 多只动物的数据来自俄亥俄大学九十年代中期『多中心动物脊髓损伤』的研究。不仅仅局限于公开发布的结果,弗格森和他的同事们还联系了每位研究人员,向他们要到当时未发布的数据和实验笔记。“他们都相当配合,”弗格森说道。“许多其他领域的科学家却不是这样 —— 他们感觉你在审查他们。”

也许这些“审查”是出于好心。据《柳叶刀》去年刊登的一篇论文的统计,所有的研究发现中只有不到一半出了成果,剩下的构成了“隐藏数据的长尾”,将很有可能解决科学上重现性的危机。脊髓损伤的研究人员也有自己需要面对的危机。自从针对克里斯托弗·李维瘫痪的研究为这一领域取得一些成就起,之后的二十年间,居然再没有重大的突破。“没有研发出药物,”弗格森说。“甚至都没有任何达成共识的手术手段。这有点难堪。我们至少应该有所发现。”

然而,研究却以失败告终。其中一个原因是变量的总数太多。脊髓损伤相当复杂,所以相对于其它系统而言,人们对它们了解得较少的。要想分离出简单的因果机制不是那么容易,“这对于发现新的疗法而言是真正的挑战,”弗格森说。因此他和他的团队想要对旧有的、隐藏的数据再进行一次试验,这一次使用的技术手段适用于揭开大量变量之间隐藏的联系。

他们选择的工具是由斯坦福的数学家古纳·卡尔森(同时也是论文的共同作者)所研发的拓扑数据分析(TDA),这个分析工具用到了几何拓扑学的概念 —— 通过对高度复杂形状的研究 —— 找到隐藏在大数据集中的规律。卡尔森同时也是 Ayasdi 公司的总裁及初创者之一,这家公司致力于把 TDA 技术和机器学习技术双剑合璧,以此找出数据集中变量之间的联系。(Ayasdi 是《Fast Company》评选出的大数据领域最具创新力的公司之一)。在弗格森想到用 TDA 技术探索脊髓损伤问题之前,卡尔森和其他研究人员已经成功利用 TDA 技术,从十多年的乳腺癌公开数据集中挖掘出了独特的基因突变。

Ayasdi 的黑盒模型使它在传统竞争者中独树一帜:将结果画成网络图供下一步分析之前,软件在不受人工调控(或者偏见)干预的情况下搜寻规律。“这恰好与传统的基于假设的理论相反,”弗格森说。“使用传统理论的工具,我们永远也不可能发现同高血压之间的相关性,因为从上千个变量中一个个试验下来找到目标几乎是不可能的。”

这是否意味着人类探索旅程的终结?未来是不是所有的发明创造都会来源于机器对数据的挖掘,而非人类本身的创意?尽管弗格森觉得“理论的终结”这一说法过于夸大,但他仍相信科学方法的第一步 —— 观察会从根本上因大数据而变得复杂,并且因为机器的介入而变得成熟。或许正像 Ayasdi CEO 古吉特·辛格今年早些时候告诉我的那样,“以往来说,你的运气必须足够好,同时洞察力也不可或缺。然而随着时间运气只会越变越差,所以你得依赖机器来替你干活了。”

在脊髓损伤数据这个案例中,Ayasdi 基于 TDA 的方案很大程度上证实了研究人员已经知道的:药物没有效用。然而高血压对长期恢复所起的消极作用,这一发现对于病患有着直接影响,也就是说,在损伤后和手术前及时用高血压药是否能够改善恢复情况,弗格森和他的同事们想要在加州大学洛杉矶分校马上验证这个假设。

长远来看,弗格森相信追溯性的数据挖掘是“一个物有所值的工具”,尤其考虑到相对于展开新实验,在旧有数据中再次挖掘所省下的费用。“仅仅花了一百多万美元,我们却打开了价值六千万美元的领域。”

本文文字及图片出自 伯乐在线

余下全文(1/3)
分享这篇文章:

请关注我们:

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注