设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2502|回复: 5

干货 | 一致性评价所用统计分析方法辨析

  [复制链接]
发表于 2018-8-14 10:53:19 | 显示全部楼层 |阅读模式
“一致性”是一个广泛使用的概念,不同的领域中含义有一定区别;但其广义上的含义是指趋向一致,没有分;主要指事物的特性或特征相类似,而不是完全相等。从认知的角度看,事物一致性必须经过许多的比较分析和鉴别才能得出结论。

在药品领域中,“一致性”概念的应用也非常广泛,如仿制药一致性评价、生物类似药的相似性评价、2种方法是否可以相互替代的等效性评价、药品活性或疗效的一致性、产品质量控制指标的批间一致性、生产工艺的稳定(一致)性等。当主要是指产品的“质量特性”具有一致性时,即“与要求有关的,产品、过程或体系的固有特性”具有一致。这里主要讨论那些能够进行测量的特性。要真正掌握这些一致性评价的方法,必须了解该概念的本质含义和相应的比较分析方法。

然而,在药品领域的一致性评价中,尤其是在仿制药质量和疗效的一致性评价中,还没有对一致性所需的统计比较方法进行明确的规范。本文拟从“一致性”概念中包含的2个要素出发,即从所比较的特性和该特性所比较的场合(该特性自身比还是与其他特性比)出发,深入阐述该术语的使用范围及其应该选择的统计比较方法。

1. “一致性评价”的概念
所谓“一致性”,本身包含比较的含义,这种比较是对所关注的“对象”,即描述事物的“特性”或“属性”的概念。所谓“特性”或“属性”,是指事物中可以用来区分它与其他事物不同的标志;这些标志分为内在(固有)的(如药品的化学或生物学特性)和后天赋予的(如产品价格、所有者,一些统计特性等)2种;同时,特性也可以是定性或定量的。

由于表达该概念的词汇中,中英文都比较多,如中文中的“特性”、“特征”、“属性”等,英文中有IS09000采用的“characteristic”,VIM中采用的“attribute”和日常常见的“property”等,故在本文后续部分,将统一采用“特性characteristic”进行描述。对于可以进行定量的特性,英文中也可以用“measurand”或“measure”替代使用。

关于药品领域中的“一致性评价”,一般需要具备下列要求:
-   要求所比较的特性是产品的重要质量特性(critical quality characteristics)。
-   所比较的质量特性,是可以使用统计分析的可测量产品特性(measurable quality characteristics)。
-   能确定出这些可测量的产品特性,是在多大范围内没有本质区别(essential difference)的客观或科学标准(objectiveor scientific criteria)。

2. 广义“一致性”比较的分类以及专属术语

在药品领域,一致性评价主要是对产品的某一或几个定量或定性特性进行比较,判断其是否在等效范围。其应用一般可分为下述几种情况。

2.1 同一产品或过程的某一或几个特性,是否在其自身设定的限值或界点内,即与其自身设定的限值或界点是否具有可接受差异的比较

它关注的特性是否符合已有标准,如以下几点:
  • 产品的常规检验,就是判断其是否符合规定的质量标准限度。这时,一般使用“符合性检验或合规性检验”;英语表达为conformance,compliance或compliance assessment 等术语。
  • 还有一种情况是比较产品或过程的均值与所规定的标准之间是否一致。例如,要求药品包装袋开包力在原标准4.2N的10%以内,每次药品投料在标准的10%以内等。
  • 对于一个检验方法,按照IS09000的定义,也属于一个产品;在评价是否达到其规定的使用要求的评价也属于广义中的“一致性”。但这时,一般使用专门的术语——验证(verification),主要是确证各参数标准(准确度、精密度等)是否符合其确认(validation)中规定的标准。

2.2  2种(近似)同质产品或过程的同一特性,是否在可接受的规定限值或界点内,即2种产品的同一特性是否具有可接受差异的比较
它关注的是两者相同特性的一致性问题,其目的是要证明在不同生产工艺中生产出的2个相同或相似产品之间是否具有可接受的差异,或者说要证明一种新处理方式与原有的处理方式没有明显区分。这也是常见的替代研究(alternativeresearch)的一种形式。如化学仿制药品与原研药品的比较,其专用术语为“一致性评价”(equivalenceevaluation);生物类似药与原研生物制品的一致性比较,其专用术语为“相似性评估”(similarityassessment);2种方法的一致性比较,其日常专用术语为“替代研究”(alternativeresearch)等。

2.3  某特性量值在过程或性能行为的前后一致性比较
其目的是为了证明某系统的运行一直如其所规定的要求,这时一般使用前后一致性或连贯性(consistence⁄consistency)。如药品生产工艺的一致性评价(process consistency)、方法稳定性考察(ruggedness)。

2.4 不同特性是无法进行比较的,然而在现实中当2种(近似)同质产品或过程的不同特性具有因果关系或必然联系时,可经过转换(如药品效价单位转换为质量单位)进行比较
这种情况多见于产品(方法)替代研究,以保持溯源上的一致性。这里不讨论该类“一致性”问题。

3. “一致性”评价的统计方法
通过上述对一致性概念在不同场合应用的阐述,可以看到,“一致性评价”的目的是回答所比较的“特性”不存在不可接受的差异,而不是要求完全相等(equal to)。所以,一致性评价的关键是首先确定出一个判定标准(criteria),即一个可以接受的范围或限值点,然后使用合适的统计比较方法进行分析评估。

关于如何确定出判断标准,亦即等效限的问题将另文讨论;这里主要讨论在“一致性”评价中,选用何种统计比较方法更科学合理的问题。

在统计推断中,主要包括2种类型的检验:一类是显著性检验,也叫差异性检验(difference test),如t检验,F检验等;另一种是区间推断检验,如等效性检验(equivalencetest)、非劣效检验和优效检验。
差异性检验起源很早,被广泛使用,而区间推断检验起源较晚;20世纪80年代,美国FDA为了解决专利药过期后仿制的申请需求,首先提出生物等效性(bio-equivalence)评价(当时的目的是为了减少仿制药的临床试验),然后才从统计的角度得到缓慢推广。

我国目前在临床中使用较多,但在非临床领域使用很少,处于探索宣传阶段[美国药典也是近10年才将其首先收载到药典中,如USP36-NF31开始收载的1032,1034(2013年)和USP38-NF33新修订的1010(2015年增加)。欧洲药典也刚刚开始收载其统计方法。中国药典至今少见该类方法。

下面将以两实验组比较的t检验和等效检验为例,通过其分析原理等对两类比较统计分析方法进行论述,来判断使用哪类统计推断方法更适用于“一致性评价”的比较研究。

3.1    差异性检验与等效性检验的统计分析原理

3.1.1 差异性检验
假定T表示待测品,C表示对照品,以均值为例,差异性检验的无效假设和备择假设分别为:
H0:待测品与对照品两者无显著差异,即μT–μc=0;
H1:待测品与对照品两者有显著差异,即μT–μc≠0;
μT表示试验组的总体均值,μc表示对照组的总体均值。

差异性检验的一般公式为(以两组均值比较的t检验为例):
                              
式中,分子反映了对无效假设的偏离程度,分母为标准误。

P <0.05时,可以认为两组差异有统计学意义。其含义为:在无效假设成立的前提下,出现当前两组这么大的差异(甚至更大的差异)的几率是非常低的(低于5%)。因此可以反推认为很可能无效假设是错误的,即两组并不相等。当 P >0.05时,则认为这种几率并不是很低,没有足够的证据认为两组不相等(不能认为:两组相等)。


3.1.2  等效性检验
与差异性检验不同,等效性检验的无效假设和备择假设分别为:
H0:待测品与对照品之间差异不小于规定限值,即不等效,记为|μT–μc|≥δ
H1:待测品与对照品之间差异小于规定限值,即等效,记为|μT–μc|< δ
这一假设可分解2个单侧检验(two one-side test)来表示:
H0(1):μT–μc ≥δ
H1(1):μT–μc< δ
H0(2):μT–μc ≤ -δ
H1(2):μT–μc > -δ
其中-δδ分别表示等效界值的下限和上限。

由于等效性检验包括2个方向的假设,因此等效性检验的一般公式为(以两组均值比较的检验为例)2个,分别为与下限和上限的比较:

与下限比较时,


与上限比较时,

等效性检验除可用单侧t检验外,在实际中还经常采用置信区间,即计算置信区间下限CL和上限CU,分别为

  
当[CL,CU]包含在[–δ, δ]范围内,或者–δ <CL < CU < δ,便可下等效的结论,否则不能认为两组等效。
3.1.3   实例
假定测定某化学药物含量,分别用法定方法和实验室新研制的方法进行测定(数据略),欲比较2种测定方法的结果是否一致。

通过计算获得新研制方法和法定方法测定的均值分别为98.847和98.534,标准误为0.184(自由度为51)。

采用t检验进行差异比较,结果显示,t=1.701,P=0.095,此时结论为:尚无法认为两组差异有统计学意义。但不能认为:两组无差异或2种方法测定结果相等。
采用等效性检验进行比较,设定等效界值为–0.5和0.5,分别进行2个单侧检验,结果显示,两组差值(0.313)与下限(–0.5)相比,t=4.418,P=0.001;与上限(0.5)相比,t=–0.102,P=0.540.
由于上限一侧结果的P >0.05,表明无足够证据认为新研制方法与法定方法之差低于上限,因此尚不能认为2种方法等效。

图1反映了等效性检验的2个单侧检验结果,图中(阴影中右侧)红色竖线反映了2种方法的差值(0.313),该值与下限(–0.5)相比,其单侧P值非常低(左侧分布中红色线右侧部分面积);而与上限(0.5)相比,其单侧P值较高(右侧分布中红色线左侧部分面积)。
图1 等效性检验的2个单侧检验结果

如果用置信区间法,可以计算出90%置信区间为(–0.735,0.108),该区间超出了等效区间(–0.5,0.5)的范围,因此不能认为2种方法等效,与P值结果一致。


3.2   等效性与差异性的主要区别
3.2.1   目的不同  
差异性检验的目的是为了验证在无效假设成立的条件下,出现如此大的差异其几率有多高,侧重的是“差异”,并不能做出“相一致”这一结论。而等效性检验则是根据事先设定的等效界值,分别对两侧界值进行检验,最终判断是否一致或相似。

3.2.2比较的参照点不同
差异性检验是假定总体中两组差异为0,因此其公式反映了样本统计量(两组差值)与总体参数(0)的比较。
而等效性检验是假定两组差异大于某一界值δ或小于另一界值–δ,,即假定两组差值超出设定的界值范围,因此其公式不是与0比较,而是分别与下限界值和上限界值比较,而且均为单侧检验,即双单侧检验。

3.2.3 实际意义不同
差异性检验只能回答两组有无统计学上的差异,无法说明实际差异。因为差异性检验只是为了回答差值是否等于0这一问题,至于距离0有多远,并无明确规定。当例数特别多或标准误足够小的时候,即使细微差别也会导致一个很小的P值。如评价2种药物对高血压降低的效果,当例数达到几千例的时候,即使血压值仅相差0.1mmHg,仍会有统计学差异,但这一差值可能并无临床实际意义。
而等效性检验通过设定一个有专业意义的界值,回答的问题更有针对性,可以说明在一个有实际意义的范围内是否等效。

3.2.4.可能的风险不同
差异性检验一般存在2种风险,如果本来无差异,但由于精密度高(变异小)会产生有差异的结果,从而造成假阳性错误,如将一个合格产品判为不合格,导致生产商损失的风险;如果本来有差异,但由于精密度太低(变异大)而产生无差异的结果,从而造成假阴性错误,如将一个不合格产品判为合格产品,从而导致消费者(患者)的使用风险。

而等效性检验通常只存在一种风险,如果本来是等效,但由于精密度低(变异大)而产生了不等效的结果,此时可造成假阳性错误,从而导致生产商的损失风险。但这种风险可通过减少样品变异进行改进,从而能降低生产商的损失风险。2种方法的风险比较总结见表1。

表1  等效性检验与差异性检验结论及其风险小结

3.3“一致性评价”的统计分析方法选择
从上述的分析可见,对于“2.1”中对“同一产品或过程的某一或几个特性,是否在其自身设定的限值或界点内”和“2.2”中对“2种(近似)同质产品或过程的同一或几个特性,是否在可接受的规定限值或界点内”的统计比较,使用等效性检验更科学、准确。如仿制药与原研药是否一致,如果采用常规的差异性检验,根据P >0.05来做出相似的结论,容易造成假阴性。因此实际中应选择等效性检验更有优势。
对于“2.3”中对“某特性量值在过程或性能行为的前后一致性比较”,一般使用统计控制等过程能力分析技术或时间序列分析技术对其分析更合适。


4.  讨论
本文对“一致性”在药品领域,特别是非临床领域中的不同应用含义及所对应的专业术语进行了探讨,有利于读者理清其具体的含义和如何选择重要特性。同时也对一致性评价所需的统计分析方法选项进行了比较阐述,建议在今后的相关工作中,更多地关注并使用等效性检验的评价方法。对当前国内正在开展的仿制药一致性评价和生物相似性评价中,如何判断其“差异多少”可认为具有一致性或相似性等,提供了指导思路。

目前国内药品质量评价中,仍普遍存在使用差异性检验进行相似性或一致性评价的现象,此时当数据具有太大变异(精密度差)或样本量不足时,很容易得出统计无显著性差异的结论,从而错误地认为“两者具有相似性或一致性”,导致假阴性风险增加。而使用等效性检验,不仅结论更严谨可靠,而且能降低I型错误和II型错误的风险(即降低产品生产企业和消费者的双方风险),从而更好地判断医用产品质量不一致等现象;这也正是近年来美国药典引入该统计分析方法的原因。

因此,作者建议国内药品监管部门从法规上,进一步推广等效性检验在药品检定和质量评价中的应用,同时加快等效检验的方法应用便利性的基础研究,如软件开发等,从而为药品的科学监管提供更好的技术支撑。

本文作者谭德讲老师等,文章首发于《中国新药杂志》2017年Vol.26,No.24,本文经作者授权发布。如需转载,请联系原作者授权。


更多数据分析干货分享、JMP最新活动,敬请关注JMP官方微信公众号:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

 楼主| 发表于 2018-8-21 09:00:46 | 显示全部楼层

欢迎探讨!
回复 支持 反对

使用道具 举报

发表于 2018-8-23 21:54:05 | 显示全部楼层

学习了,谢谢!
回复 支持 反对

使用道具 举报

发表于 2018-9-27 13:46:39 | 显示全部楼层
回复 支持 反对

使用道具 举报

发表于 2022-7-6 11:16:31 | 显示全部楼层
感谢分享。十分用心的文章
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-3-29 05:51 , Processed in 0.431425 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表