分层随机试验
在统计学中, 分层随机试验 Stratified randomization 是一种抽样方法,首先将整个研究 总体 Population 层为具有相同属性或特征的子群,称为 分层 Attributes ,然后从分层组中进行简单随机抽样,在抽样过程的任何阶段,随机、完全偶然地无偏抽取同一子群中的元素。[1][2]分层随机试验被认为是 分层抽样 Stratified sampling 的一个细分。当共享属性部分存在,并且在被调查总体的不同亚群之间有很大差异时,应该采用分层随机试验。因此,在取样过程中需要特别考虑或明确区分。[3]这种抽样方法应区别于 整群抽样方法 Cluster sampling ,整群抽样方法是在整个群体中选择一个简单的随机抽样来代表整个总体,或分层系统抽样方法,在分层过程之后进行 系统抽样 Systematic sampling 。分层随机抽样有时也称为 定额随机抽样 Quota random sampling 。[1]
分层随机试验的步骤 Steps for stratified randomization
分层随机试验在目标总体异 质性 Heterogeneous的情况下非常有用, 它能有效地显示研究中的趋势或特征在不同阶层之间的差异。[1]当进行分层随机试验时,应采取以下8个步骤:[4][5]
- 定义目标总体
- 定义分层 变量 Variables 并决定要创建的分层数量。确定分层变量的标准,包括年龄、社会经济地位、国籍、种族、教育程度等,并应与研究目标相一致。理想情况下,应该使用4-6个阶层,因为任何分层变量的增加将提高其中一些变量抵消其他变量的影响的概率。[5]
- 使用 抽样框架 Sampling frame 评估目标总体中的所有元素。之后根据 覆盖率 Coverage 和分组进行更改。
- 列出所有的元素并考虑抽样结果。每个阶层应该相互排斥 Mutually exclusive,加起来涵盖总体的所有成员,而总体的每一个成员应该属于唯一的阶层,和其他差异最小的成员一起。[4]
- 决定随机抽样的选择标准。这可以手动完成,也可以用设计好的计算机程序完成。
- 为所有元素分配一个随机且唯一的编号,然后根据分配的编号对这些元素进行排序。
- 回顾每一层的大小(Size)和每一层中所有元素的 数值分布 Numerical distribution 。确定抽样类型,按比例或不按比例分层抽样。
- 按照第5步中的规定进行所选的随机抽样。至少,必须从每个阶层中选择一种元素,以便最终样品包括每个阶层的代表。如果从每个阶层中选择两个或两个以上的元素,则可以计算所收集数据的 误差范围 Error margins 。[5]
技术 Techniques
分层随机试验决定一个或多个预后因素(prognostic factors),在平均意义下,这些预后因素使每个亚组具有相似的进入特征。通过检查先前研究的结果,可以准确地确定患者因素。[6]
子群的数量可以通过乘以每个因素的层数来计算。在随机化前或随机化时测量因素,并根据测量结果将实验对象分为若干亚组或层。
在每一层中,可以应用几种随机试验策略,包括 简单随机试验 Simple randomization 、 分块随机试验 Blocked randomization 和 最小化试验 Minimization 。
分层内简单随机抽样 Simple randomization within strata
简单随机试验被认为是在每个阶层中分配受试者的最简单方法。对于每个任务,受试者被完全随机地分配到每个组中。尽管简单的随机化很容易进行,但由于取样量小,分配不均,因此在含有100多个样本的地层中,通常采用简单的随机化方法。尽管很容易进行,但简单随机试验通常应用于包含 100 个以上样本的层,因为小样本量会使分配不均等。[7]
分层内的区块随机试验 Block randomization within strata
区块随机试验 Block randomization ,有时称为置换区块随机试验,应用区块将来自同一阶层的受试者平均分配到研究中的每个组。 在区块随机试验中,指定了分配比率(一个特定组与其他组的数量之比)和组大小。 块大小必须是处理次数的倍数,以便每个层中的样本可以按预期比例分配到处理组。[7]例如,在一项关于乳腺癌的临床试验中,应该有 4 或 8 个层次,其中年龄和淋巴结状态是两个预后因素(prognostic factors),每个因素分为两个水平。 可以通过多种方式将不同的区块分配给样本,包括随机列表(random list)和计算机编程。[8][9]
区块随机试验通常用于样本量较大的实验,以避免具有重要特征的样本分配不平衡。 在某些对随机试验有严格要求的领域,如临床试验,当没有对导体(conductors)进行盲法处理且区块块大小有限时,分配是可预测的。 分层中的块置换随机试验可能会随着分层数量的增加和样本量的限制而导致分层之间的样本不平衡,例如,有可能找不到符合某些分层特征的样本[10]。
最小化方法 Minimization method
为了保证每个处理组的相似性,尝试了“最小化”方法,这比分层内的随机排列块更直接。在最小化方法中,根据每个处理组中的样本总和将每个层中的样本分配到处理组中,这使得受试者数量在组间保持平衡。[7] 如果多个治疗组的总和相同,则将进行简单的随机化以分配治疗。在实践中,最小化方法需要根据预后因素(prognostic factors)跟踪治疗分配的每日记录,这可以通过使用一组索引卡进行记录来有效完成。最小化方法有效地避免了组间不平衡,但比块随机化涉及的随机过程更少,因为随机过程仅在治疗的总人数相同时进行。一个可行的解决方案是应用额外的随机列表,这使得具有较小边际总数的总和的治疗组具有更高的机会(例如 ¾),而其他治疗具有较低的机会(例如 ¼)。[11]
应用 Application
分层随机试验在需要对特定层进行不同权重的情况下非常有用且富有成效。 通过这种方式,研究人员可以操纵每个层次的选择机制,以放大或最小化调查结果中所需的特征。[12]
当研究人员打算寻找两个或多个层次之间的关联时,分层随机化很有帮助,因为简单的随机抽样会导致更大的可能出现目标群体的不平等代表性。当研究人员希望消除观察性研究中的 混杂因素 Confounder 时,它也很有用,因为分层随机试验允许调整 协方差 Covariances 和 p 值 p-values 以获得更准确的结果。 [13]
与简单随机抽样相比,分层随机抽样的统计准确度也更高,因为选择代表总体的元素具有高度相关性。[5]与分层之间的差异相比,分层内的差异要小得多。因此,随着样本间差异的最小化, 标准差 Standard deviation 也会随之收紧,从而导致最终结果的准确性更高,误差更小。当研究资金紧张时,这有效地减少了所需的样本量并提高了抽样的 成本效益 Cost-effectiveness 。
在现实生活中,分层随机试验可应用于选举投票结果、社会群体收入差距调查或各国教育机会的衡量。 [1]
临床试验中的分层随机试验 Stratified randomization in clinical trials
在 临床试验 Clinical trials 中,根据患者的社会和个人背景或与研究相关的任何因素对患者进行分层,以匹配整个患者群体中的每个组。 这样做的目的是建立临床/预后因素(prognostic factor)的平衡,因为如果研究设计不平衡,试验将不会产生有效的结果。[14] 分层随机化的步骤非常重要,因为它试图确保没有偏见、有意或无意地影响所研究患者样本的代表性。 [15] 它增加了研究能力,尤其是在小型临床试验中(n<400),因为这些已知的临床特征分层被认为会影响干预的结果。[16]它有助于防止在临床研究中受到高度重视的 I 型错误 Type I error 的发生。 [17]它还对主动对照等效试验的样本量产生重要影响,并且在理论上有助于 亚组分析 Subgroup analysis 和 中期分析 Interim analysis 。 [17]
优势 Advantage
分层随机试验的优点包括:
- 分层随机试验可以准确反映一般人群的结果,因为应用影响因素对整个样本进行分层并平衡样本在治疗组之间的重要特征。例如,采用分层随机化从人群中抽取 100 名样本可以保证每个治疗组的男女平衡,而使用简单随机化可能会导致一组只有 20 名男性,而另一组有 80 名男性。[7]
- 分层随机试验比其他抽样方法(例如 整群抽样 Cluster sampling 、简单随机抽样 和 系统抽样 Systematic sampling 或 非概率方法 Non-probability methods )的误差更小,因为可以使分层内的测量具有较低的标准差。在某些情况下,将分割的分层随机试验比简单地随机试验一般样本更易于管理且成本更低。[11]
- 由于分层随机试验本质的精确性,团队更容易接受分层样本的训练。
- 由于这种方法的统计准确性,研究人员可以通过分析小样本得到非常有用的结果。
- 这种抽样技术涵盖了广泛的总体,因为已经对分层划分进行了完整的控制。
- 有时需要分层随机试验来估计总体中各组的总体参数。[11]
缺点 Disadvantage
分层随机试验的限制包括:
- 分层随机试验首先参考预后因素将样本分成若干层,但有可能无法划分样本。在应用中,在某些情况下,预后因素的重要性缺乏严格的认可,这可能进一步导致偏差。这就是为什么在将因素纳入分层之前应该检查因素产生影响的潜力的原因。在某些因素对结果的影响无法得到批准(approved)的情况下,建议进行无分层随机试验。 [18]
- 如果可用数据不能代表整个亚组总体,则认为亚组大小具有相同的重要性。在某些应用中,子组大小是根据可用数据量来决定的,而不是将样本大小缩放到子组大小,这会在因子效应中引入偏差。在某些需要对数据进行方差分层的情况下,子组方差差异显着,使得每个子组的抽样规模无法保证与整个子组总体成正比。[19]
- 如果人口不能完全分配到层中,则不能应用分层抽样,这将导致样本大小与可用样本成正比,而不是与总体子组人口成正比。[7]
- 如果受试者符合多层次的纳入标准,则将样本分配到亚组的过程可能涉及重叠,这可能导致总体的错误陈述。[19]
参考文献
Glass, Aenne; Kundt, Guenther (2014), "Potential Advantages and Disadvantages of Stratification in Methods of Randomization", Springer Proceedings in Mathematics & Statistics, Springer New York, pp. 239–246, doi:10.1007/978-1-4939-2104-1_23, ISBN 978-1-4939-2103-4</ref>
- ↑ 1.0 1.1 1.2 1.3 Nickolas, Steven (July 14, 2019). "How Stratified Random Sampling Works". Investopedia (in English). Retrieved 2020-04-07.
- ↑ "Simple random sample", Wikipedia (in English), 2020-03-18, retrieved 2020-04-07
- ↑ "Stratified sampling", Wikipedia (in English), 2020-02-09, retrieved 2020-04-07
- ↑ 4.0 4.1 Stephanie (Dec 11, 2013). "Stratified Random Sample: Definition, Examples". Statistics How To (in English). Retrieved 2020-04-07.
- ↑ 5.0 5.1 5.2 5.3 "Stratified Random Sampling: Definition, Method and Examples". QuestionPro (in English). 2018-03-13. Retrieved 2020-04-07.
- ↑ Sylvester, Richard (December 1982). "Fundamentals of clinical trials". Controlled Clinical Trials. 3 (4): 385–386. doi:10.1016/0197-2456(82)90029-0. ISSN 0197-2456.
- ↑ 7.0 7.1 7.2 7.3 7.4 Pocock, Stuart J. (Jul 1, 2013). Clinical trials : a practical approach. Chichester: John Wiley & Sons Ltd. ISBN 978-1-118-79391-6. OCLC 894581169.
- ↑ "Sealed Envelope | Random permuted blocks". www.sealedenvelope.com. Feb 25, 2020. Retrieved 2020-04-07.
- ↑ Friedman, Lawrence M.; Furberg, Curt D.; DeMets, David L. (2010), "Introduction to Clinical Trials", Fundamentals of Clinical Trials, Springer New York, pp. 1–18, doi:10.1007/978-1-4419-1586-3_1, ISBN 978-1-4419-1585-6
- ↑ Fundamentals of clinical trials. Friedman, Lawrence M., 1942-, Furberg, Curt,, DeMets, David L., 1944-, Reboussin, David,, Granger, Christopher B. (Fifth ed.). New York. 27 August 2015. ISBN 978-3-319-18539-2. OCLC 919463985.
- ↑ 11.0 11.1 11.2 Pocock, S. J. (March 1979). "Allocation of Patients to Treatment in Clinical Trials". Biometrics. 35 (1): 183–197. doi:10.2307/2529944. ISSN 0006-341X. JSTOR 2529944. PMID 497334.
- ↑ Crossman, Ashley (Jan 27, 2020). "Understanding Stratified Samples and How to Make Them". ThoughtCo (in English). Retrieved 2020-04-07.
- ↑ Hennekens, Charles H. (1987). Epidemiology in medicine. Buring, Julie E., Mayrent, Sherry L. (1st ed.). Boston, Massachusetts: Little, Brown. ISBN 0-316-35636-0. OCLC 16890223.
- ↑ Polit, DF; Beck, CT (2012). Nursing Research: Generating and Assessing Evidence for Nursing Practice, 9th ed.. Philadelphia, USA: Wolters Klower Health: Lippincott Williams & Wilkins..
- ↑ "Patient Stratification in Clinical Trials". Omixon | NGS for HLA (in English). 2014-12-01. Retrieved 2020-04-26.
- ↑ Stephanie (2016-05-20). "Stratified Randomization in Clinical Trials". Statistics How To (in English). Retrieved 2020-04-26.
- ↑ 17.0 17.1 Kernan, W (Jan 1999). "Stratified Randomization for Clinical Trials". Journal of Clinical Epidemiology. 52 (1): 19–26. doi:10.1016/S0895-4356(98)00138-3. PMID 9973070.
- ↑ Murphy, Chris B. (Apr 13, 2019). "Pros and Cons of Stratified Random Sampling". Investopedia (in English). Retrieved 2020-04-07.
- ↑ 19.0 19.1 Glass, Aenne; Kundt, Guenther (2014), "Potential Advantages and Disadvantages of Stratification in Methods of Randomization", Springer Proceedings in Mathematics & Statistics, Springer New York, pp. 239–246, doi:10.1007/978-1-4939-2104-1_23, ISBN 978-1-4939-2103-4