替代统计方法可以改善临床试验

2022年1月5日整理发布：康奈尔大学研究人员磨练和推进的另一种统计方法可以使临床试验更加可靠和可信，同时还有助于解决科学界所谓的“可复制性危机”。

在本月发表在《国家科学院院刊》上的一篇新论文中，康奈尔大学的研究人员进一步提出了“脆弱性指数”，这是一种在医学界获得关注的方法，作为 p 值的补充，p 值是一种应用于科学的概率测量，自1920 年代，有时甚至不顾后果地引用作为良好结果的证据。

“临床医生相信他们执行的程序和协议是通过合理的临床试验得出的。任何少都会让外科医生感到紧张，这是正确的，”查尔斯·A·亚历山大 (Charles A. Alexander) 统计科学教授、论文合著者马丁·威尔斯 (Martin Wells) 说。“我们发现，许多这些显示出有希望的结果并发表在顶级期刊上的后续试验都很脆弱。这是这项研究带来的令人不安的惊喜。”

这篇由康奈尔大学的统计学家、威尔康奈尔医学院和多伦多大学的医生撰写的论文提出了一种新的统计工具包，使用脆弱性指数作为替代方法，以帮助研究人员更好地确定他们的试验结果实际上是否可靠或者仅仅是偶然的产物。

“当你告诉全世界应该或不应该使用某种治疗方法时，你希望该决定基于可靠的结果，而不是基于一两个患者的结果可以以一种或另一种方式摆动的结果，”本杰明说贝尔博士 '21，论文合著者，目前是罗彻斯特大学的博士后研究员。“这样的结果可以被认为是脆弱的。”

测试有效性的随机临床试验对于外科手术和医学治疗至关重要。为了解释试验结果的统计显着性，几十年来，研究人员转向了一种经常被误解的衡量标准，即 p 值，以确定结果是否有价值或只是偶然发生。

但是，在过去的 15 年中，当单独使用且没有支持方法时，对 p 值可靠性的怀疑越来越多，特别是因为过去的试验结果最初被认为是强大的，无法在后续试验中复制。在 2014 年使用脆性指数的一项研究中，研究人员分析了 400 项随机临床试验，发现四分之一具有“统计显着”p 值的试验实际上具有低得惊人的脆性评分，表明结果不太可靠。

“人们可以理解为什么科学中存在复制危机。研究人员发现了很好的结果，但他们站不住脚，”威尔斯说。“这些都是研究前沿问题的严肃大型试验，研究结果发表在顶级期刊上。然而，其中一些大型试验的脆性指数较低，这引发了对结果可靠性的质疑。”

康奈尔大学的学者通过他们的最新研究提供了一种解决方案，即通过磨练脆弱性指数来调查有多少患者结果可能会影响试验的成功或不成功。脆弱性数字越低，结果就越脆弱和不可靠。例如，一项有 1,000 名参与者的试验根据少数患者的结果在统计上显着或不显着，其脆弱性指数极低。

自 1990 年代出现以来，脆弱性指数一直因僵化而受到批评——它仅适用于具有两个研究组、治疗组和对照组以及二元的、事件与否的结果的数据。这项最新研究提供了更灵活的脆弱性指数，可应用于任何类型的结果和任何数量的解释变量。

该团队的方法还使跨科学领域的研究人员能够根据特定结果的可能性计算脆弱性指数。

“就是-否而言，统计显着性的传统框架过于简单化，而我们正在调查的问题并非如此，”威尔康奈尔医学院威廉福利杰出医学教授玛丽查尔森博士和一篇论文说合著者。“对于每种临床情况，您都在处理不同的背景。这种方法使我们能够测试假设并考虑范围更窄的结果的影响。”

替代统计方法可以改善临床试验

猜你喜欢

最新文章