大型随机对照实验：精准流行病学研究的典范与陷阱

2022-05-05 00:17:25 来源：岳阳咨询医生

唐应将天, 杨祖耀, 毛琛. 大型医学研究试验功能性:胆交临床研究变成果的模范与稻草人[J]. 之前华临床杂志, 2017, 38(10): 1299-1304

现代临床是现代医学应将用型研究变成果的方，是在这群人之前量化地研究变成果有关肥胖、传染病和卫生服务有系统解决办法一般规律的生物科学和艺术。临床研究变成果是与实验室为基础研究变成果分庭效礼的两大现代医学研究变成果派系之一，可以用来研究变成果传染病的性传染病和脆弱诱因、传染病诊断的吻合功能性、传染病负担、传染病的转归及其冲击诱因、现代医学偏袒新政策的功效和副主导作用、现代医学新政策的变成本功效等与现代医学有系统直接相关的解决办法，其辨认出可直接用来指导工作和改善现代医学有系统[1-3]。

一、大型医学研究试验功能性是最胆交的临床研究变成果

1.研究变成果设计者与研究变成果结果的吻合度：生物研究变成果的目的是揭示真凶，临床研究变成果也不例外。以偏袒新政策功效的评核为例，如果一项具体的研究变成果通过观察到的结果为通过观察最大值，主观的功效为主观最大值，则二者的的关系如示意图 1所示。通过观察最大值和主观最大值两者之间的相似之处或相距，在临床之前称为偏倚，也称作系统误差。一个研究变成果的偏倚就得越，其通过观察最大值离主观最大值得越快，就得越不吻合，反之亦然。掌控偏倚的首要新政策是研究变成果设计者。研究变成果设计者得越严谨，偏倚得越小，赢取的结果就得越吻合。

示意图 1 通过观察最大值、主观最大值、偏倚和随机误差的的关系常见的可主要用途评核偏袒新政策功效的临床研究变成果设计者之外单存活率报告、无折衷的存活率系列、折衷研究变成果（定群研究变成果）和医学研究研究变成果，在医学研究试验功能性之中，它们被分别称为也就是说存活率试验功能性、多存活率无折衷试验功能性、非随机一组的折衷试验功能性，以及医学研究试验功能性[4-5]。是非试验功能性，就是测试偏袒新政策功效的试验功能性功能性研究变成果。并不相同的研究变成果并不一定就像并不相同吻合度的尺子，有些可以观测到厘米，有些可以观测到毫米，医学研究试验功能性是临床研究变成果之中可观测到最小相似之处的尺子，是评核偏袒新政策功效最严谨、最吻合、最存疑的临床研究变成果设计者（示意图 2）[1, 6]。示意图 2 评核偏袒新政策功效的医学研究试验功能性的设计者种类和论据存疑度

2.样本量与研究变成果结果的胆确度：如示意图 1所示，即使研究变成果无法任何偏倚，通过观察最大值还是不或许与主观最大值只不过重叠。由于随机误差的长期存在，并不相同研究变成果赢取的通过观察最大值不是一个固定的最大值，而亦会因样本量的并不相同围绕一个之前心最大值左右旋转。旋转的大幅度与样本量变大于：样本量就得越，研究变成果结果围绕之前心最大值旋转的很较高达大幅度就得越小，很较高达来真是亦会更接近之前心最大值，或者真是胆确度得越很较高，反之则旋转大幅度就得越，胆确度得越较高。由此可见，胆确度与随机误差变大于，主要由样本量的个数重新考虑，增加样本量是提很较高胆确度的主要新政策[7-8]。

什么是合适的样本量？一项研究变成果必需要的样本量个数与其借机评核的偏袒只不过功效的个数有关[9]。以直观的两台相对的医学研究试验功能性为例，估计样本量必需要知道折衷组的有关惨剧存活率、治果的个数，统计学的第Ⅰ类和第Ⅱ类有错误的概率。第Ⅰ类和第Ⅱ类有错误是人为原则上的几个固定默认的常数最大值，医学研究试验功能性必需要的样本量主要取决折衷组剧情惨剧的存活率及其与病患组惨剧存活率两者之间的相似之处（即功效的个数）。一般来说什么，偏袒的只不过功效得越小，必需要的样本量就就得越。如果剧情惨剧的存活率很较高，比如在心肌梗死病和肝癌的预防性研究变成果之前，偏袒的只不过功效只不过都不亦会来得大，因此必需要的样本量都亦会很大[1, 10-12]。

3.大型医学研究试验功能性：大型医学研究试验功能性又称大规模医学研究试验功能性（large randomized trials或mega-trials），样本量可以大至几千，甚至上万。与小型研究变成果或其他设计者并不一定的研究变成果相比，大型医学研究试验功能性结果的胆确度、吻合度都是最很较高的，因此，大型医学研究试验功能性就是最胆、最交的临床研究变成果设计者。由于样本量很大，大型医学研究试验功能性在设计者上不一定还具备一些其他共计同的形态，例如多之前心、程序中直观、存活率形态和卫生前提宽泛、病患环境贴近实际卫生环境、可以估计实际功效、结果有利于推展等。

大型研究变成果为了并能收编存活率并顺利完变成研究变成果，研究变成果者多亦会联合很多的单位，一个的单位就是一个之前心，各之前心分别收编和病患自己之前心的存活率，研究变成果在并不相同地方同时进行。因此，大型医学研究试验功能性一般都是多之前心试验功能性，之前心可以局限于一个各地区或南部，也可以遍及全世界。由于研究变成果之前心遍及各地，每个南部在卫生环境、卫生高水平、存活率形态等多方面长期存在相异，大型试验功能性多是“直观试验功能性”。是非直观，就是在存活率被选为、病患安排和数据集收集等多方面采取比小型试验功能性更为直观易行的法则。因为必需要收编的存活率总数很大，而且牵涉到的的单位很多，各的单位的前提和高水平参差不齐，研究变成果的各种承诺必需要考虑效率，还必需要兼顾之前下高水平的参予的单位的前提和潜能，使它们能够顺利完变成研究变成果的各种承诺。比如，存活率被选为前提某种程度直观，不添加很多容许（如征状、病情、病患历史学者和合并症），必用医学研究上不常见的仪器，尽或许使医学研究上同类存活率都可以被选为，这样才亦会有更多的合格者存活率被选为，加速存活率收编的程序中。

由于参予的南部和之前心很多，以及存活率被选为前提和医学研究病患环境相对宽泛，如果终于有效性适当，一般显然其结果更容易在实际卫生前提下赢取反复，更容易推展和普及。由于大型医学研究试验功能性的这些特色，以及它们结果的很较高吻合功能性和很较高胆确功能性，大型医学研究试验功能性是目前最有冲击的医学研究研究变成果，现代篇文章亦会争相发请注意，如NEJM、Lancet、JAMA、BMJ仍然每期都有报道，这又进一步推升了大型医学研究试验功能性在医学研究研究变成果之前的话语权和号召力。

二、医学研究试验功能性的受限制前提

1.研究变成果解决办法与医学研究试验功能性的配上：在临床研究变成果的范式之中，针对同一研究变成果解决办法，有多种研究变成果设计者可以配上，并不相同研究变成果设计者发放的论据存疑度很较高较高都是，只有一种是拟合的切实合理的研究变成果并不一定（请注意 1）。例如，借机研究变成果吸烟与肺癌的的关系，可考虑的研究变成果设计者之外：存活率系列、横断面研究变成果、生态学研究变成果、存活率折衷研究变成果、配置文件研究变成果。配置文件研究变成果是研究变成果性传染病切实合理的存疑度最很较高的研究变成果。又如，评核偏袒的功效，单存活率试验功能性、多存活率无折衷试验功能性、非随机一组折衷试验功能性都可以主要用途评核偏袒的功效，医学研究试验功能性是存疑度最很较高的切实合理的研究变成果。但是，在研究变成果用药严重、有名的慢功能性过多反应将时，最存疑、切实合理的研究变成果不一定是存活率折衷研究变成果。

请注意 1 现代医学有系统解决办法与拟合合理的研究变成果设计者

评核现代医学偏袒的功效，最少有4类研究变成果可以可用，但是它们不是实际上的。从设计者上说什么，主要区别于为3个多方面：通过观察从掩盖到剧情的等待时间走向，折衷的形态，相对组间的可比功能性。研究变成果设计者的架构区别于就是在处置这些解决办法上的并不相同，研究变成果设计者的不断进步就是在处置这些解决办法上的不断进步。并不相同研究变成果发放的论据的存疑度有很较高有较高，医学研究试验功能性最很较高，单个存活率试验功能性最较高。提很较高存疑度是有付出代价的，一般来说什么研究变成果必需要的资源（之外等待时间）与结果的存疑度变成比例，反问一类解决办法最存疑、切实合理的研究变成果不一定也是最便宜历时的研究变成果。分之一，一个十分相似的大型医学研究试验功能性很较高达必需要费用很较高达3 000万美元[13]。进行大型医学研究试验功能性不能果断。

说是，评核偏袒功效时，不是都必需要可用医学研究试验功能性的。在功效非常最大特别注意时（如皮肤癌手术、断肢便植、和献血），有时候不必需要医学研究试验功能性的核实[13]。因为功效非常最大特别注意的偏袒新政策以致于是少数，绝大大多偏袒新政策还是必需要经过医学研究试验功能性的有效性，但不是所有意味着都必需要可用大型医学研究试验功能性。功效最大特别注意时（如效生素），之前、小型试验功能性就确实，只有当功效较同一等待时间，才必需要大型医学研究试验功能性。

2.研究变成果下一阶段与医学研究试验功能性的配上：重新考虑研究变成果设计者考虑的另一个关键性诱因是评核的下一阶段。对于同一类研究变成果解决办法，研究变成果设计者的考虑主要取决研究变成果的下一阶段。

生物研究变成果可大致分作3个下一阶段：激发假定、化验假定和核实假定。从等待时间上看，激发假定是研究变成果的初期下一阶段，化验假定是之前期下一阶段，核实假定是角度看下一阶段。就评核现代医学偏袒功效而言，以前下一阶段应将可用安全、并能、直观、省钱的研究变成果，但结果存疑度相对较高，之前期应将可用存疑度较很较高的研究变成果，再次便经过医学研究试验功能性的核实。

以用药的医学研究有效性为例，一般分作4个下一阶段，即常真是的Ⅰ~Ⅳ期医学研究试验功能性（示意图 3）[14-16]。研究变成果的解决办法之外毒副主导作用和功效2个多方面，对二者的研究变成果也必需要循序渐进，研究变成果设计者考虑也需要灵活多变。Ⅰ期医学研究试验功能性是一个用药第一次在人体上的测试，需要非常果断，评核的不是而是急功能性毒功能性主导作用，也之外对用药代谢动力学的勘查。研究变成果不一定是在仔细挑选的肥胖人之前进行的，且无法折衷组。如果一个用药通过了Ⅰ期试验功能性，无法最大特别注意的急功能性毒功能性主导作用，可进入Ⅱ期试验功能性，对进行初步评核。根据评核的的发展时段，默认的研究变成果设计者很多，如无折衷试验功能性、前后折衷试验功能性、平行试验功能性、非随机的平行折衷试验功能性和小样本医学研究试验功能性等。Ⅲ期试验功能性是对最严苛的有效性，必需要可用样本量确实大的医学研究盲法试验功能性。Ⅳ期试验功能性是用药上市后的研究变成果，主要是对严重有名慢功能性过多反应将的监察，主要可用的是存活率折衷研究变成果和配置文件研究变成果。

三、大型医学研究试验功能性的主导作用和稻草人

1.大型医学研究试验功能性的主导作用：为什么要进行大型医学研究试验功能性呢？最根本的理由是研究变成果解决办法的必需要，具体来真是是借机有效性的病患的功效很小。由此可见，大型医学研究试验功能性主要是主要用途评核之前小（尤其是小）的偏袒新政策的功效[10]。

换言之，如果一个医学研究试验功能性必需要很大的样本量，那么它所估计的只不过功效就一定很小。皮肤癌手术，立竿见影，3~5例病患就确实有效性其功效，折衷都不必需要。效菌素病患大叶功能性肺炎，在几十例存活率之前测试就确实了。但是，要有效性一个效很较高血压用药是否是可以预防性心肌梗死惨剧，一般必需要几千甚至上万存活率，随访通过观察几年的等待时间。

上述3种病患两者之间，第一种无疑是最适当的，第三种是功效最较高的。换言之，医学研究通过观察就可以核实的功效一定大于小型医学研究试验功能性可核实的功效，小型医学研究试验功能性可核实的功效一定大于大型医学研究试验功能性可核实的功效。从这个含义上说什么，我们绝不真是医学研究通过观察和小型医学研究试验功能性核实的无法大型随机试验功能性有效性的功效关键性，说是才是意味著。

事实上，效生素、术、雌激素、金属制正骨、疖风湿引流、大肺水肿后的献血、坏死的压迫或包扎等非常适当的现代医学新政策，在医学研究试验功能性诞生以前，就被有效性适当且广泛应将用了[17]。意味著，医学研究试验功能性诞生以后，我们并无法激发多少新的比这些病患更适当的新政策，现在医学研究上可用一共的效很较高血压用药、效皮质醇用药、效用药（请注意 2）等，虽然它们的经都过大型医学研究试验功能性的核实，但是它们的功效远远无法上述现代医学新政策的功效最大特别注意而并能[18]。

请注意 2 大型医学研究试验功能性有效性适当的现代医学偏袒新政策十分相似举例

了解到这一点非常关键性，在讨论大型医学研究试验功能性结果的医学研究有系统含义时，只能盯在样本量上，只能把样本量和统计学突出功能性与偏袒功效个数看变成，偏袒的医学研究价最大值在于其的个数，不是样本量的个数。增加医学研究试验功能性的样本量，可以增加观测的稳定功能性，但是只有当功效很同一等待时间才必需要大型医学研究试验功能性。换言之，对研究变成果承诺得越是胆、交，真是明借机有效性的功效就得越小。意味著，如果功效很大，小型医学研究试验功能性甚至非随机一组的折衷试验功能性就确实形变成核实功能性研究变成果。

如此毫无疑问，大型医学研究试验功能性只是评核之前、小的金标交规范，不是评核所有偏袒新政策的金标交规范。大型医学研究试验功能性也或许用来相对两个相似之处不大的病患，有效性不长期存在，或是有效性用药间之前、小交互主导作用的长期存在。但无论是哪种具体情况，必需要大型医学研究试验功能性有效性的主导作用或相似之处都是相对小的，因此它们的有系统含义也是最大特别拷问的。

2.大型医学研究试验功能性不是原创功能性研究变成果：正因如此，对一个生物科学解决办法的探索可分作明确提出假定、有效性假定和核实假定3个下一阶段。从评核偏袒功效的程序中上看，大型医学研究试验功能性不属于以前明确提出生物科学解决办法的原创功能性研究变成果，而是之前后期的核实功能性研究变成果[16, 19]，是再次的研究变成果，是终结功能性研究变成果，一旦有效性适当，将不便必需要新的研究变成果继续有效性，一般也不亦会衍生出新的生物科学辨认出和发明。

如果把临床研究变成果分作创新功能性研究变成果和有效性功能性研究变成果，前者在于明确提出崭新的研究变成果解决办法或假定，后者在于有效性初步探索过的假定或理论的确实功能性。前者是生物科学发展的为基础，是生物科学的炼狱，因为无法前者就不必需要后者；但是如果无法后者，生物科学就只有一堆不知有错对的想象和假定而已，生物科学将不亦会扎实地不断进步。前者更多必需要的是灵感和幽默感，是生物科学家的架构价最大值所在；而后者更多依赖于研究变成果资源和指派潜能，是值得注意生物科学和生物科学工匠的工作范围[20]。

由此可见，生物研究变成果（尤其是现代医学应将用型研究变成果）的含义和价最大值终于取决研究变成果解决办法，而不是反问解决办法的法则的利弊和结果的胆交。哲学家Laude Levi-Strauss甚至真是，真正的生物科学家是那些明确提出关键解决办法的人，而不是可以确实反问解决办法的人。柏克莱加州大学统计学系创始人John Tukey也真是过：数据集分析最关键性的原则，也是很多统计学家想规避的原则：对一个确实解决办法的不胆交反问，远远好于对一个有错误解决办法的胆交反问。统计分析和临床研究变成果的确实运用，说是异曲同工。便好便大的研究变成果，如果无法一流的研究变成果解决办法，也不或许变成为一流的研究变成果。

3.大型医学研究试验功能性的稻草人：大型医学研究试验功能性是最胆、最交的临床研究变成果，因此人们经常把大型医学研究试验功能性视为核实现代医学偏袒新政策功效的金标交规范[13]。NEJM、Lancet、JAMA、BMJ等现代篇文章已变成为大型医学研究试验功能性爱好的发布平台，它们的宣传和无疑进一步推升和有利了大型医学研究试验功能性在现代医学有系统之前的“称霸”话语权。因此，大型医学研究试验功能性变成了国际医学研究简要所追捧的旗子，通过国际简要庞大而又并能冲击着世界区域内的现代医学有系统社区活动。

然而，大型医学研究试验功能性只是核实之前、小的金标交规范，不是核实非常适当的偏袒的金标交规范。在现代医学有系统之前，过多敬仰大型医学研究试验功能性，亦会致使对之前、小偏袒的过多强调。是非之前、小的医学研究含义是最大特别深入探讨的[11]，而且在大多意味着之前、小型医学研究试验功能性的系统研究报告只不过可以替代大型医学研究试验功能性[19, 21-22]。另外，如果设计者上出了解决办法，例如未可用关键性的角度看剧情[23-25]，大型医学研究试验功能性的浪费是庞大的[26]。

绝大大多大型医学研究试验功能性主要是评核新的用药。过多敬仰大型医学研究试验功能性，还亦会致使对用药的过多推崇和依赖，趋向很多老的甚至更适当的用药，趋向预防性、非用药偏袒（例如孤独方式将）和传统现代医学（例如之前医）的主导作用[13]。

在现代医学研究变成果之前，过多敬仰大型医学研究试验功能性，亦会致使对核实功能性研究变成果的过多推崇，因而反之亦然趋向开创功能性研究变成果工作的关键性功能性，致使对大型有效性功能性计划的盲目崇拜，对大样本和统计学突出功能性而不是医学研究含义的推崇[27]，以及对科研变成果而不是生物科学解决办法的追逐。长期下去，势必亦会致使研究变成果行业原创功能性潜能的急剧下降，扔了生物科学炼狱（请注意 3）。

请注意 3 大型医学研究试验功能性的主要应将用和稻草人

大型医学研究试验功能性的存活率被选为前提和医学研究病患环境相对宽泛，增加了代请注意功能性，提很较高了结果的小幅度功能性，确实是一个优点。但实际上，这才是是大型医学研究试验功能性的另一个更鲜为人知的稻草人。为了尽快招募到确实的存活率，大型医学研究试验功能性经常亦会受限制确立标交规范。在很小的意味着，存活率确立标交规范得越宽泛，从病患之前受惠的存活率的比例或许就得越较高，必需要的样本量就就得越，再次显然在更广泛的存活率之前病患适当就得越不合理，因为亦会使更多不亦会受惠的人接受病患。大型医学研究试验功能性是非增加了研究变成果的外部主观功能性，说是是一种曲解。

另外，最大特别注意的是，很多大型医学研究试验功能性是由药厂赞助的，它们之前变成为推展用药最有力的市场竞争应将用软件[28-31]。例如，NEJM曾经报道有关肝癌靶向病患用药的医学研究试验功能性，但是这些非常便宜的用药比较好也似乎能延至几个年末的存活，经常只是延缓的发展几个年末的等待时间，但并只能延至存活，也只能提很较高生命质量[23-24, 32-33]。这使得我们更某种程度对大型医学研究试验功能性持主观、果断、警觉的看法。

Ioannidis[34]曾真是，现代医学研究变成果之前有很多是非的“阳功能性结果”和“关键性辨认出”只是具有很较高度统计学突出含义但无法来得大医学研究含义的结果，或者是在各种本质的驱使下玩弄十进制的结果，没法赢取反复。大型医学研究试验功能性的结果被反复有效性的机亦会仍然是零，因为大型医学研究试验功能性非常便宜，针对同一研究变成果解决办法开展两个或多个如此便宜的研究变成果的或许功能性极小。即使有后续研究变成果，由于研究变成果间诸多诱因的并不相同，它们的结果都不大或许否定之前大型试验功能性的正确性，从而使得现实之前不大或许出现适当的有效性研究变成果。这种仍然必有效性的特功能性，增加了大型医学研究试验功能性被过多本质利用、甚至出现欺骗功能性结果的风险。

四、大型医学研究试验功能性与大型配置文件研究变成果的区别于

20世纪之前叶以后，医学研究试验功能性的普及化以及现代医学对大型医学研究试验功能性的尊奉和祈福，将要致使对之前、小偏袒功效的过多推崇，对有效性功能性研究变成果的过多推崇，对样本量和研究变成果经费的过多追逐，进而致使对原创功能性研究变成果的摒弃。但是，这样的正确性确实不适主要用途大型前瞻功能性配置文件研究变成果。

除了研究变成果设计者严谨功能性之外，大型前瞻功能性配置文件研究变成果与大型医学研究试验功能性两者之间长期存在两个关键性区别于。一是医学研究试验功能性一般只能用来反问一个直观的研究变成果解决办法，即在偏袒和剧情多方面都不能来作严苛的限定，如某药与临床实验相对是否是可以在某特定存活率之前改变某关键性医学研究剧情。配置文件研究变成果则不然，它可确立的掩盖不一定有几十种几百种甚至更多，折衷有很多种或许，这些掩盖或许冲击的剧情又有很多种，可以之外多种常见和有名传染病[35-37]。因此，有时候一个医学研究试验功能性一般只激发一个架构研究变成果报告，而大型配置文件研究变成果可以激发无数个关键性功能性相当的研究变成果报告。例如，美国的佛明翰心脏研究变成果1950年以来共计发请注意超过3 000篇文章，牵涉到很多脆弱诱因和传染病，是历历史学者上贡献最大的临床研究变成果之一[37]。

大型配置文件研究变成果与大型医学研究试验功能性的第二个关键性区别于在于它们可引起新的辨认出。大型医学研究试验功能性是终结功能性研究变成果，是非终结功能性研究变成果，就是顺利完变成以后不便必需要新的有效性，一般也不亦会引起出新的生物科学解决办法。配置文件研究变成果则并不相同，主要主要用途辨认出性传染病，性传染病是预防性和病患传染病的开始，因此配置文件研究变成果是掌控一个传染病的黄金时代，而不是告一段落。辨认出了性传染病，就可以找到预防性的法则，以及病患的线索。例如，辨认出芽孢是结核病的性传染病，这个辨认出致使了后来效生素和疫苗的辨认出。便如，辨认出很较高皮质醇可引来冠心病，掌控很较高皮质醇的脆弱诱因就可以预防性冠心病，而很多病患冠心病用药也是受到皮质醇和动脉粥样包覆和血栓的关系的启发而激发的。

参考文献：略为

TAG：

上一页：eLife：对帕金森病理论明确提出质疑
下一页：没有了