总有那么一些临床试验实施起来困难重重,神经内科医生海伦·梅博(Helen Mayberg)用以验证她开发了15年的抑郁症治疗方法的试验便是其中之一。她采用的治疗方法是在患者头顶钻两个洞,将两个电极插入大脑深部的布罗德曼25区。这里有一对淡粉色的弧形脑组织,叫做胼胝体下扣带回,它的大小和形状跟一个婴儿弯曲的手指一般,布罗德曼25区就占据着这只手指的指尖部分。电极通过电路与埋在患者胸口皮下的电池相连,放置到位后便开启。
在2003年到2006年间,梅博前后分别在多伦多大学和埃默里大学尝试了这个试验性的脑深部电刺激手术(以下简称DBS),试验对象包括20名遭受多年抑郁症折磨,已经尝试过所有可能的治疗方法的患者。她认为抑郁症患者大脑的布罗德曼25区是一个过度活跃的神经接线盒。梅博设计该试验的目的是想要看看DBS产生的刺激能否镇静25区,并以此缓解患者的绝望情绪。2005年,梅博发表了取自前6位患者的第一份试验结果,这6位患者表现非常好,剩下14位患者也逐渐表现出了类似的积极进展。大部分人的抑郁指数降低了一半,大约三分之一的患者得到完全缓解。
梅博在2005年《神经元》(Neuron)上发表的文章令她的同事惊讶不已。在几乎病入膏肓的患者身上能得到这样的治疗效果令人惊叹。前美国国家心理健康研究所(US National Institute of Mental Health)所长汤姆·英赛尔(Tom Insel)将其成果评价为“一条新的认识抑郁症的途径”。2006年,这项成果逐渐进入公众视野——我在同年4月份的《纽约时报》上写了一篇介绍梅博工作的文章;9月份时,CBS电视台《新闻60分》节目对此进行了报道。她的手机从此再也没有安静下来过——记者打进电话想要采访她,大学及研究所想邀请她去讲课。打进电话的还有大量无助的抑郁症患者,或是他们同样无助的家属,在看到报道之后渴望能够接受该治疗。梅博变得炙手可热。
没过多久,梅博所使用的神经刺激器的制造商圣犹达医疗公司(以下简称圣犹达)决定开展一项临床试验,为梅博提出的治疗方案争取美国食品和药品管理局(以下简称FDA)批准。要说一切进展太快的话必定伴随风险。梅博和她的同事用DBS治疗的患者越来越多,同时他们注意到一些可能影响治疗效果的因素,比如患者抑郁的程度,医生放置刺激器的位置。如果继续探寻下去,很可能会使治疗更加有效。当然如果无止境地探寻下去,你总是会发现更多的影响因素,但是总有一天需要向前推进。重要的是这个治疗方法现在切实有效,这些患者正在起死回生。
Broaden不仅揭示了上面问题的答案,同时揭示的还有临床试验本身的限制造成的矛盾和困惑,以及科研的本性,还有这两者之间的区别。
于是在2008年,经过一番探讨,梅博加入了一个横跨北美,由二十多位科学家构成的临床试验团队,帮助设计并实施临床试验。这种多中心,大规模的临床试验,一般都是由赞助商——也就是圣犹达负责管理。这个团队的很多科学家以前做过临床试验,不过梅博还没有。同时这个团队,包括梅博在内没有一个人可以全权指导试验的全部内容。她希望能尽自己所能保证这个试验规程严格,同时患者能够接受到良好的治疗。圣犹达将这个试验命名为Broaden试验,取自Brodmann Area 25 Deep Brain Neuromodulation(布罗德曼25区脑深部神经调节)。试验计划是联合20个神经外科中心,在200位难治性抑郁症患者的大脑内植入圣犹达公司的DBS设备,并激活其中三分之二,剩下三分之一作为对照组,在植入6个月后激活。任何直接接触患者的人都不会知道具体哪个患者在哪个组。在植入设备后的两年内,科学家将跟踪随访两百位患者的病情进展。治疗组的表现会比对照组的好吗?他们又能赶上梅博亲自治疗的患者的表现吗?
2017年临床试验结束,这比本来设定的试验结点晚了不少。Broaden不仅揭示了上面问题的答案,同时揭示的还有临床试验本身的限制造成的矛盾和困惑,以及科研的本性,还有这两者之间的区别。
····
试验开始很顺利,三个外科中心陆陆续续在2008年和2009年初完成了30例DBS植入。根据计划,试验进行到这个阶段要进行一个强制性的安全评审。试验因此暂停了几个月,这期间科学家完成了一个安全性报告并和FDA一同审阅。完成之后,DBS植入项目从三个外科中心扩展到了十五个。新植入DBS患者的数据在后续几个月陆续得到汇总,虽然其中很多人的抑郁程度有所改善,但是比起梅博之前治疗的患者,他们的进展却没有那么迅速。这个结果并不意外——大型、双盲对照临床试验的结果比起没有对照的开放试验,经常会显得差强人意(开放试验,或者说“非双盲”试验,指所有的患者都知道自己接受的治疗手段)。所以梅博并没有太在意这些早期数据。
2011年和2012年,随着15个外科中心在越来越多的患者中完成了DBS植入,Broaden试验进行到了接受第一次评估的时刻,即试验中期的“无效性分析”,用以评价试验进展。接受“无效性分析”的前提是至少75个患者完成DBS植入,时间持续至少6个月,其中又有至少三分之二在治疗组,三分之一在对照组。因为有一大批患者都满足以上条件,所以这个中期分析总共囊括了90位患者。这个时候要回答的一个主要问题是,这些患者的治疗进展对比试验设定的主要目标,达到了什么样的程度,即“结果评估”。在这类FDA临床试验中,主要目标必须要在计划试验时声明,这个目标必须清楚,简洁,这样可以避免试验规则变来变去,或者试验当中出现欺骗行为。同时这个目标必须反映治疗目标,这例的主要目标就是抑郁程度的改善。
Broaden试验六个月时的主要目标是“至少40%的治疗组患者的抑郁评分减少至少40%”。试验使用“蒙哥马利抑郁评定量表”进行评定,这是一个临床医生常用的抑郁症调查问卷。蒙哥马利量表包含10个问题,总分60,用以区分抑郁症严重程度。一般将9或10分以下定义为无抑郁症,10分到18分定义为轻度抑郁,19到34分定义为中等程度抑郁,35分以上为严重抑郁。Broaden试验的主要关注点是长期的改善,因此将11分以下定义为无抑郁症(或临床缓解),除此之外没有定义抑郁的严重程度。
参与Broaden试验的患者基本上已经尝试过所有可能的治疗方案,但是都没有获得持续的缓解。他们的量表分数平均都在30多。对于这些患者而言,量表分数降低40%代表他们依旧处于抑郁状态,但是没有那么严重了——考虑到这些患者曾经有多么难治,这可称得上是一个宏伟目标。不过在参考了之前梅博令人瞩目的结果之后,这个目标看起来还是可以达到的。
将目标设定为40%改善的同时,Broaden团队同时很想知道有多少患者可以达到完全缓解。这些患者的表现能赶上梅博的开放试验的结果么?不幸的是,以上的乐观估计并没有出现。2012年底,试验团队将90个患者治疗6个月后的数据统计后发现,跟梅博所治疗的患者的结果完全没法比。60个治疗组患者中,只有20%(12名)患者的抑郁分数在6个月治疗后降低到了目标值以下,即预期的降低40%;同时,只有5%(3名)患者得到完全缓解。这个结果和空白对照组的结果基本一致,后者在植入未激活的设备6个月之后,有17%患者的抑郁分数达到目标值,7%的患者得到完全缓解。
虽然中期分析的结果给试验泼了点凉水,但是并不代表这个试验就因此终结。中期分析的目的是“估计”,即如果给200名患者植入DBS至少一年时间,这个试验能够达到其主要目标的可能性。但是如果计算出来的可能性,比FDA预先设定的该试验的最小可能性低的话,那FDA通常会因为认定“无效”而终止这个试验。
DBS手术的成本最高可以达到一个患者10万美金,继续试验的成本太高了。
FDA将Broaden试验的成功率设定为十分之一。无效性分析得出的成功率是六分之一。准确的说这个几率还是比较低,但是足以通过FDA设定的条件。Broaden试验得以继续开展。
然而,赞助商却有权终止临床试验,而圣犹达此时也这么做了。2013年,该公司通知Broaden团队,包括梅博在内的15家科研中心的科学家,他们将要终止Broaden试验。圣犹达并没有公布这么做的理由。DBS手术的成本最高可以达到一个患者10万美金,对圣犹达来说,继续试验的成本太高了。也许他们自己有一个认定试验无效的成功率标准,也许这个成功率比六分之一要高。不管怎样,他们还是终止了Broaden试验。
圣犹达以及之后将其收购了的雅培公司(Abbott),会继续为已经参与临床试验的患者提供照料,其中有些人选择将植入的DBS移除。他们也继续为参与试验的研究中心支付科研经费,用以收集患者的实验数据,一直到所有患者达到植入后两年这一时间点。但是他们没有再给更多的患者植入DBS,同时他们停止了FDA许可的申请。试验启动五年,在差不多花了一千万,同时也是梅博给她第一位严重抑郁患者植入首个DBS十年后,Broaden试验宣告终结。
····
当这个被称为过去十年内最有希望、最新颖、并被寄予众望的抑郁症治疗试验终结的消息传出后,得到的第一个反应是——没有任何反应。圣犹达没有发声,参与的科学家因为都签了保密协议,所以在数据发表之前不能发表相关讨论意见。没有任何一个参与人员对试验终止公开发表意见。
世上没有不透风的墙,还是有一些信息泄露了出来。
第一个泄露出来的信息来自业界分析师詹姆斯·卡沃托(James Cavuoto)。2013年底,他在自己的newsletter《神经科技商业报道》中发表了一篇文章,提到他在一个科学会议上听到Broaden试验没有通过无效性分析:“这个消息,给原本气氛愉悦的会议蒙上了一层阴影……再一次,当一个充满潜力的新技术被迫停滞数年的时候,业界能做的也只有收拾残局,重整旗鼓。”
卡沃托这篇文章的剩余部分遣词小心,造句微妙。但是那个匿名者提供的信息——“没有通过无效性分析”,则明确意味着Broaden试验是被FDA终止的,因为它没有通过FDA设定的成功率标准。不管怎样理解,“没有通过无效性分析”听起来都不怎么中听,因为其中的“无效性”(futile),放在一般语境里,就是“没有意义”(pointless)。卡沃托在文章里明确指出他认为梅博的治疗方法是成功的,并且有潜力的,但是因为圣犹达公司以及参与人员的沉默不语,他使用的“无效性”这个词(在这里会被一般读者理解为“没有意义”),为后续跟进的媒体报道和讨论定下了基调。
一直关注Broaden试验的一些记者和博主随后也加入讨论,其中有些人在讨论的时候则更加审慎。
2014年1月,卡沃托发表文章后一个月,一位署名”神经批评家”(Neurocritic)的博主再次报道了他的文章,并在此基础上提供了更深刻的见解。神经批评家算是神经精神科学博主中言辞比较犀利的一位,同时他也是梅博治疗方法的长期追随者。这篇结构严谨,内容丰富的文章抛砖引玉,在接下来两年内,评论区内充满了同样结构严谨,高质量的讨论。讨论者中有10到12名自称是参与试验的患者(因为很多人匿名留言,另外一些人在他人评论下评论,所以要得到准确的数字不太可能)。其中有两三人,或是四个人声称治疗并没有改善他们的抑郁,有一两个人说他们遭受了严重的并发症,虽然这些并发症已知可能伴随这类手术出现,但是读起来还是令人痛心不已,更不要说亲身经历了。大概七到九名评论者说该疗法在自己身上,或者自己伴侣身上起效了;有几个人说这种疗法救了他们的命。
2014年3月,《科学美国人》在线专栏作者约翰·霍根(John Horgan)也就Broaden试验被终止发表了一篇文章,在其中他引用了卡沃托的描述——“没有通过无效性分析”。霍根曾撰文批判过梅博的治疗方式(当然也批判过我报道她的一些文字)。有两位读者评论说他们亲身参与了该试验,并声称这种治疗挽救了他们。另外一个人说他太太参加了试验,但是出现了严重的记忆和认知问题(这些人和在神经批评家博客留言的可能是,也可能不是同一批人)。霍根对整个事件的描述是非常尖锐并且准确的。其他人对Broaden试验的描述,则是通过流露的只言片语将其定义成一个彻彻底底的失败。此时此刻,信息的缺失为肆意的揣测提供了发挥空间。
不管怎样理解,“没有通过无效性分析”听起来都不怎么中听,因为其中的“无效性”,放在一般语境里,就是“没有意义”。
梅博看到这些文章和评论,以及同事间不时传出的闲言碎语后感到很吃惊。“我感到很屈辱。我向圣犹达要求他们发表公开声明,因为现在关于试验停止这件事流传在外的只有谣言,以及几位患者的糟糕体验。”圣犹达继续保持沉默。不久之后,在会议上遇见梅博的同事都会对她报以安慰,并为试验的失败而感到由衷的抱歉。
一天她收到一封回复经费申请的邮件,经费申请负责人回复道:“如果这个治疗方法无效,你为什么还要继续研究它?” 另一个期刊的编辑在回绝她发出的一篇论文时这样回复:“每个人都知道这种治疗方法失败了,你为什么还写这方面的文章?”。梅博开始担心她的整个研究项目可能都岌岌可危。
但是之后发生的一件事情,却在同一时间同时扩大并缓和了试验终止造成的影响——患者开始逐渐好转。
····
准确的说,DBS治疗并没有像我们期望的那样起效。和预想的一样,这个治疗方法并没有帮到很多人。在开始治疗后第一年,90位患者中有10个人或因为抑郁恶化,或因为出现了自杀倾向而脱离了试验(其中四个人的设备被移除)。最终,有37名患者因为没有感受到明显改善而最终选择将设备移除。
同时意料之中的还有,在如此绝望的患者群中进行手术,伴随着潜在的副反应及并发症,这些情况或多或少在神经批评家的博客评论中被提及。总的来讲,至少有9位患者反馈自己的抑郁程度加重,6人反馈出现了感染,另外一些出现了如头痛或者一种叫做“弓弦现象”(埋在皮肤下的电线因为与组织黏连而造成拉扯感)的副反应。3位患者的焦虑程度加重,1人出现自杀念头,1人自杀未遂,2人自杀。
史蒂夫·奥格博(Steve Ogburn)可能是所有这些患者中最有名的。他是一名建筑师,在2012年11月底于斯坦福医学院接受了DBS手术,在手术后没多久就出现了并发症。他在2014年上传了一段视频,在此后被约翰·霍根及其他报道他的博主引用。在视频中他描述了一个痛苦的情景:严重退化的认知能力,持续的抑郁,严重的头痛,埋在皮下的电线周围无止境的疼痛。2013年12月,斯坦福的团队将他脑中的DBS移除,但是这些并发症并没有随之消失。
一位来自米尼苏达的小学老师,丽萨·维克(Lisa Wick)也遭受了并发症的困扰。不过她的并发症是在起初还算成功的植入后过了7年才出现的。2008年,当丽萨首次接受植入的时候,她已经抑郁很多年,尝试过不同的药物组合、心理治疗和好几轮电击治疗。她告诉我:“那个时候我只是活着而已,我会白天教书,然后回家,崩溃。”
一如其他使用DBS治疗后好转的患者,丽萨清楚的记得在手术台上,刺激器打开的瞬间她就立马感受到了不同。“我突然开始说话了,就像绿野仙踪里面黑白画面突然变成彩色,我立马就感觉好了起来。”伴随她数十年的痛苦转眼间消失不见。
丽萨的抑郁在一年内就改善到了她可以轻松应对的水平。之后她的状态一直都很稳定,直到2015年,在换电池之后出现了感染。感染沿着电线一直蔓延到颅骨,最终,芝加哥的团队不得不移除她脑中的设备。
设备移除后,丽萨又滑入了术前那个足以令她瘫痪的抑郁深渊。就这样煎熬了大约一年后,在梅博的帮助下,达拉斯的Broaden团队再次给丽萨脑中植入了设备。据梅博描述,这个团队得以成功复制首次植入的位置及设定。丽萨在这次手术中处于麻醉状态,但是她清醒过来后的第一个感受就是一直折磨着她的“那种可怕的”痛消失了。在接下来的一年中,丽萨恢复到她被感染前的状态。她在2017年12月告诉我:“这是一次漫长的等待,但是我终于还是回到了我日思夜想的地方,我回来了。”
虽然从统计学角度出发,丽萨和奥格博的故事都只是个例,但是绝不能说毫无意义。他们让我们感受到这些案例的复杂、丰富和多样,感受到命运以及生物本身是多么变幻无常。他们展现了针对如此摧人的病痛,进行这种高风险的侵入性治疗所伴随的巨大风险。但是在一个临床试验里面,通常只有冷冰冰的显著性和非显著性两个结果。而这类案例的显著性,则被限定于他们能够在多大程度上代表研究中小组水平的数据。在这些结果当中,一个案例仅仅能代表90个数据点中的一点。两个代表丽萨和奥格博的点分别位于分布曲线的两端。梅博本人也承认,如果选择分析六个月的数据,这个试验显然失败了。
但是这个治疗方法呢?在2013年11月试验被停止后几个月甚至几年,随着更多继续接受治疗的患者提供的数据积累,结果清晰的显示越来越多的患者正朝向并超过设定的改善40%这一阈值。有些患者甚至得到完全缓解。
大部分科学家都可以在数据积累后及时获得分析报告。但是最终结果,在经历了论文受期刊限制刊登,圣犹达拒绝分享原始数据所有权,论文作者就数据相关性发生分歧等一系列事件之后,才得以在2017年10月首次被公布。
最终发表在《柳叶刀-精神病学》(Lancet Psychiatry)的这篇文章列举了DBS激活后24个月内的患者数据。当跟踪随访时间由中期无效性分析设定的六个月延长为两年时,治疗组抑郁分数下降超过40%的患者数翻了一番,达到了全部治疗组人数的一半。完全缓解率也上升了,从六个月的10%达到了24个月的31%。这些结果和梅博的开放试验结果不相上下。
DBS治疗会随着时间的进展而体现出疗效。
同样振奋人心的是对照组患者的结果。他们的DBS设备在植入后6个月被激活,两年后他们的改善程度也与治疗组患者差不多。但是对照组患者的完全缓解率较治疗组却要差一些。这也许是因为对照组的样本量相对较小,而小样本会放大抑郁分数中的细小差别带来的统计学影响。我们并不知道是否存在这种情况,即对照组有大量患者的抑郁量表分数,距离完全缓解就差那么一点(或者正相反,离完全缓解还差很远)。这只是我们不知道的事实其中的一个,因为不管是圣犹达还是雅培都没有公布患者个体的数据。
不管怎样,这个试验的长期数据反映了梅博最初的发现,在Broaden试验开始前,及该试验进行当中实施的另外一些开放试验表明,DBS治疗会随着时间的进展而体现出疗效。这些几乎病入膏肓的患者在两年后,有一半达到了改善40%这一主要目标,几乎三分之一得到完全缓解,这一结果和六个月时的统计数据大相径庭。
我们现在得到了一个失败的临床试验,而它被用来验证的,是一个很可能有效的治疗手段。
····
这是一个棘手的难题。如Broaden试验的主要参与研究人员,保罗· 霍兹海默(Paul Holtzheimer)去年在一个大会上说的:“试想一下,抑郁程度如此严重,已经对其他治疗没有反应的患者,他们中的50%能够好转并维持了这么久。我们一只手拿着一个大型的失败试验,另一只手拿着这些惊人的开放实验数据。要让我们同时接受这两个结果很难。”
霍兹海默的这番感慨触及的是两个不同却又相互连接的问题。第一个问题是为什么在患者好转的情况下,这个试验都会宣告失败。另外一个是为什么该试验的结果比梅博开放试验的结果要差。
我们先回答简单的问题:为什么在患者明显改善的情况下,试验都宣告失败?
也许Broaden试验最大的限制,就在于对六个月结果的强调程度。尽管六个月对抑郁症相关实验已经算挺长时间了(一般抗抑郁药物的试验都只持续6到12周),但对梅博的DBS治疗来说,还是有点苛刻。她既往的治疗都显示,患者一般会在6~24个月之间出现明显改善。她在多伦多治疗的第一组患者结果显示,有明显好转,即抑郁分数降低至少40%的患者比例,在治疗后一年是62.5%,两年后是46.2%,三年后是75%。完全缓解率在一年后是18.8%,两年后是15.4%,三年后是50%。梅博在埃默里大学治疗的另外17位患者结果显示,6个月后显著改善的患者比例是41%,两年后这一数字增加到92%。完全缓解率从六个月的18%,增加到了两年后的58%。最终结果证明,将Broaden试验的全部赌注压在在六个月这一时间点,比预想的要冒险的多。
那为什么只跟踪六个月呢?根据部分参与研究人员的反馈,将时间点设定在六个月,是基于既往治疗体现出的显著疗效,如果要让三分之一严重抑郁的患者使用安慰剂超过六个月就显得太不人道了。如果最后试验需要终止,稍微短一些的试验时间也能帮圣犹达省不少钱。总而言之,六个月这个时间点,使得Broaden试验最后只得到该治疗方法早期的一次性快照,而它原本却是需要长时间才能体现出自己的治疗价值。同时,这也意味着失去了六个月之后的对照组数据,导致没有办法客观的进行后续跟踪随访。
第二个问题回答起来有些难度:为什么梅博的开放试验,特别是她在Broaden试验启动后亲自治疗的那些患者,对治疗的响应比起试验组患者要好很多呢?
一个可能的原因是偏差。任何形式的研究都存在偏差,它可以表现为多种形式。有可能(这个有可能介于“肯定”和“也许”之间),梅博在治疗过程中扮演的角色影响了治疗效果。和常规试验方法一样,患者的抑郁分数是由第三方进行评估的,他们和梅博或她的实验室不存在任何关系。然而,梅博是一位热心、自信且对患者无微不至的医生,她和患者之间建立的感情,毋庸置疑会给患者带来更多自信,让他们对治疗方案更有信心。
尽管Broaden试验排除了患有焦虑症或者人格障碍的患者(梅博的试验也排除了这些患者),但是并没有排除或者优先选择某种特定的抑郁症类型。
一些观察者评论道,在这个试验中,有两个潜在的利益冲突会影响到梅博的工作:从圣犹达收取的注册及咨询费用,以及部分专利所有权,假使这个治疗方案被通过,梅博则可以因此获得专利收入。试验进行当中,雅培向梅博和另一位专利所有者,多伦多神经外科医生安德鲁· 洛萨诺(Andres Lozano)支付注册费用,得以在试验中使用该治疗方法。梅博提到她每年收取的注册及咨询费用“大概够买一台不错的二手车”。“买得起不错的二手车”的钱不能说完全不用当回事,但比起一般临床试验提供的“买得起全新凌志”的咨询费,还是比较少,如果比起梅博本可以要求并收取的咨询费,这就显得更微不足道了。
另外一个明显的差别是,梅博的开放试验没有对照组,而Broaden试验则有。每一位参与Broaden试验的患者都会被告知,他们当中将有三分之一的患者脑中植入的设备在头六个月不会被启动。也许这个消息本身就造成了一定程度的偏差——使得患者信心不足。这种偏差同时影响了治疗组和对照组。
上面提到的因素也许就是造成Broaden试验和梅博的开放试验结果存在差别的原因。但是要用它们来解释梅博开放试验在六个月的结果,比双盲试验要好出将近两倍还是有些牵强。也许我们可以在梅博以及Broaden试验的治疗方案的许多不同点中找到答案——梅博在自己的开放试验中不断改善方案,而Broaden试验则没有。
即便是在Broaden试验进行当中,梅博也没有停止自己的研究,没有停止使用DBS手术治疗新的患者,同时她不断改善治疗方法以获得更好的治疗效果。这就代表她的治疗方法慢慢地,同时明显地偏离了Broaden试验采取的方法。她选择患者的方法不同,她定位与管理刺激器的方法不同,她帮助支持患者的方法不同。她所做的一切都有可能在她自己的研究和Broaden试验之间,创造出新的或者扩大已经存在的差距。总结一句话:Broaden试验使用的是最初设计的治疗方案,而梅博则在此基础上不断更新改善。
两个试验的区别之一在于如何选择患者。Broaden患者忍受难治性抑郁症的时间平均在12年,远远超过梅博的患者,后者平均在5年。更长时间的难治性抑郁,也许就造成了Broaden试验参与患者对治疗的响应程度更低。
尽管Broaden试验排除了患有焦虑症或者人格障碍的患者(梅博的试验也排除了这些患者),但是并没有排除或者优先选择某种特定的抑郁症类型。梅博在她个人的试验中,已经识别出至少三种对治疗的响应程度更好的心理学特性:相对比较弱的情绪反应性,或者对环境因素的改变出现相对较弱的短期反应;明显减慢的精神及躯体活动;强烈的负向情绪,即抑郁的体验不仅仅表现在愉悦感的缺失,而是存在精神甚至躯体的疼痛,这是心理学家与哲学家威廉·詹姆斯(William James)描述的“持续存在的痛苦”,是丽萨分别两次被植入刺激器时消失的那种痛苦。梅博将这些特质定义为“经典忧郁型”抑郁的特征性表现,在这些患者中,布罗德曼25区可能发挥更大的作用。梅博选择的就是这类患者,而Broaden试验既不特别选择也不会回避这类患者。
另外一个区别就是两者定位电极的方法不同。Broaden试验使用的是梅博在治疗初期采用过,但是在前者开始时就放弃了的方法。在2008年前,梅博的团队使用“大体解剖”来定位。他们使用传统磁共振扫描,将电极置于25区的某个特定靶点。Broaden也采用这种方式定位电极。
但是当Broaden试验启动时,梅博开始使用一种更新,更精确的影像技术——弥散张量成像(DTI),它不仅能清晰地显示脑区,更可以显示连接大脑不同区域,传递神经信号的白质束。DTI显示当电极位于或者临近25区的白质束交界处时,治疗效果最好。这种精确定位,结合有选择的治疗患者,有效提高了2008年之后梅博开放试验的结果。但是Broaden试验就来不及用上这些技术了。
最后一点,梅博一直在为她的患者提供全面的、个性化的精神以及社会支持服务,帮助他们重塑自己的生活。在与严重抑郁症斗争多年后,大多数患者的生活,人际关系以及思考方式已经被疾病扭曲,单纯的手术治疗无法彻底帮助他们。“就像做了膝关节修复的患者,”梅博提到,“手术之后他们还需要做复健才能恢复。”她的团队给这些患者提供心理治疗,职业治疗以及物理治疗,帮助他们恢复生活技能,恢复生理健康,同时帮助他们和社会援助服务取得联系。
Broaden试验只提供术后支持,同时为了避免统计时被干扰,有意没有添加新的心理治疗或者其他药物治疗。这种做法在统计意义上成功将干扰因素降到最低,但是同时降低了患者恢复的几率。
····
如果从梅博提出的假设以及进行的治疗这个背景去看Broaden试验,后者就是一个干枯的骨架——看得出来是什么,但绝对不能认为它就是梅博提出的治疗手段。所谓临床试验,就是将一个需要验证的治疗方法,抽筋扒皮,只留下最基本的、可重复的、可扩张的部分。但是如果将这些简化工作之后的结论,判定为该疗法所有可能展现形式的结果,那就太愚蠢了。举个例子:一个使用阿司匹林治疗头痛的临床试验,如果患者有偏头痛,或者服用剂量太少,亦或是在服用后5分钟而不是5个小时后评估疗效,那么这个试验都会失败。
梅博设计出一种治疗方法来验证她的假设,在做了数年颅脑扫描之后,得出25区在抑郁症中扮演重要角色(因此可能是潜在的靶点)。随之出现新的假设,即如果这部分神经网络至少在某些精神疾病中是主要靶点,那么其他区域,或者单独,或者联合25区,都有可能成为不错的治疗靶点。Broaden试验没有能够有效证明或者证伪这些假设,就像失败的阿司匹林试验并不能排除“头痛至少有一部分和神经化学物质有关”这一假设。
这些对临床试验的影响造成的限制,恰恰就是既往许许多多临床试验被提前终止的主要原因。莫林·米德(Maureen Meade)是一位重症监护医生,同时也是研究临床试验和科研方法的专家,她在2005年呈书抵制因无效性而终止试验的做法。她提到这种做法是对数据的浪费,不仅影响对主要目标的评价,同时影响的还有次要目标评价、副作用评估、亚组分析等。即便主要目标没有达到,这些数据都能够提供宝贵的信息。因为“无效性”而终止试验因此会“增加数据误判的几率”,其中就包括得出某种有效的治疗方法无效这种错误结论。
做“无效性分析”的目的就是提前终止那些看起来肯定失败的临床试验。米德的文章以及其他报道因无效终止研究的文献都清楚表明,试验的终止属于科学上的决定,而不是商业上的决定。因此一个常规使用的办法就是由科学家进行中期分析,评估一个试验是否满足预先设定的基准。Broaden试验通过的就是这种由科学家进行的中期分析。然而最终却是圣犹达,而不是科学家终止了试验。而且试验终止的时候,圣犹达没有引用任何基准、任何数据,他们什么都没有引用。如米德所说,如果终止试验的决定不是基于清楚的标准,那么“就显得太过随意或自私了”。我们无法判断圣犹达终止试验的决定到底是随意还是自私。但是他们的决定很难称作是基于科学的判断,因为谈到科学,即意味着将数据公布于众。今天,很多参与临床试验的公司对实验数据都采取更加开放透明的态度,甚至包括那些“失败”的试验数据,他们认识到这样做的价值在于帮助其他科学家,在失败的基础上建立更深刻的理解,并更快取得进步。
假设用法庭审讯的术语,几乎每一个被停止的临床试验,包括这一个,都不是有效裁决,而是无效审判。这个问题依旧没有解决,只有等待日后被回答。梅博的治疗方法以及她的假设还需要证据去证明,不过至少Broaden试验还没有证明它们是无效的。
····
Broaden试验的失败会终结抑郁症的DBS治疗吗?它又会损害到梅博的研究项目吗?
现在看起来不会了。有那么一段时间,梅博有理由担心她的科研经费会消失,不过2013年由国立卫生研究院(National Institutes of Health’s Brain Initiative)设立的脑计划项目为她创造了更友好的科研环境。2017年,国家精神卫生研究所为梅博提供了五百多万的科研经费,帮助她继续DBS研究。2018年1月,她从埃默里大学搬到了位于纽约的西奈山医院,领导新成立的高级回路治疗中心。在这里,她继续优化改善她的假设和治疗方法。
我们不知道是否再会有其他器械商认为,赞助另一个在25区进行DBS治疗抑郁症的试验是值得的。雅培依旧持有相关注册许可。詹姆斯·卡沃特告诉我,他认为雅培仍然对这种治疗方法感兴趣。雅培告诉我,他们和DBS以及抑郁症领域的科学家“保持着沟通”。
如果雅培决定要在25区再试一次,它将能够在2016年FDA新颁布的、更加灵活的试验规则下进行。这些规则允许一项研究设定数个不同的结果评价方法,包括在不同时间点,而不是一个时间点进行有效性分析。这样做有助于对新出现的假设添加新的结果评价方法(这也许会引发靶点的改变,或者电极放置的不同)。同时可以识别并评估参与人群中对治疗响应较好的亚组的特征。
密切关注临床试验的评论者则提到,如果选择太多种评估方式,或者有太多结果目标或患者亚群,则会为科学家有选择性的报道阳性结果或中途改变治疗目标提供便利。然而如果控制得好,这种灵活性有助于我们发现某种治疗方法或者它的变型是否仅对某个特定人群疗效显著,比如是否对某一类型的抑郁症患者效果好。这就如同一些肿瘤药物,对被诊断某种组织类型肿瘤的患者,可能只对5个人中的1人起作用;但是对拥有某种特定基因型的肿瘤患者,同样5个人中,可能就会有4个人收益。
将这些办法结合在一起并进行有效控制,就可以利用新的规则为梅博的复杂试验提供更多灵活性。在某种程度上,这些规则可以用来去寻找为被机器学习专家称作“勘探和开采问题”提供平衡的更好方法。这是一个要在某个区域穷尽所有可能去勘探,还是用最快的方法去开采的问题。像Broaden这样的试验被迫专注于一个点尽快开采。一个拥有更广泛参数的试验则可以测试数个不同的结果或者范围,这样至少可以将科研的探索特性引入到试验中去。
卡沃特希望雅培能够再实施一个试验并尝试回答这些问题。FDA的规则改变,Broaden患者持续的好转,以及潜在的收获,所谓天时地利人和,机不可失。“从商业角度来看,”他提到,“这个治疗方法有很大的市场。但更重要的是,有成千上万,也许上百万个患者正在承受不用承受之痛。这个病真的在置人于死地。”
与此同时,梅博说道:“我需要做的就是继续工作。”她想要准确识别出成功背后的因素——患者表型的不同,电极放置的不同,术后支持的不同,并将这些因素优化成可以复制的流程。
“我先生问我什么时候退休,我会在工作完成之后再退休。”
“我还不能停下来,因为有些人认为这个没有意义。我的患者告诉我这些人都错了,数据告诉我这些人错了…这件事还没完。”