您当前的位置:检测资讯 > 法规标准
嘉峪检测网 2025-07-31 20:19
分析方法验证是确保实验结果可靠性的关键环节,中国药典2025年版通则9101进一步与ICH指南接轨,对准确度和精密度的联合验证进行了指导性的规定:“评价准确度和精密度的可选方法是通过建立一个综合性能标准来考虑它们的总体影响......可采用预测区间、容忍区间或置信区间来评价联合的准确度和精密度”。有读者留言希望写一篇关于准确度验证中置信区间计算的文章,希望本文可以解答疑问。预测区间和置信区间作为两类核心统计学工具,分别从单次观测值波动范围和总体参数估计角度提供量化依据。本文以通则9101提出的评价方式的实施为出发点,以案例探讨如何进行准确度和精密度的联合评价。
一、基本概念
1.预测区间(Prediction Interval, PI)
预测区间也称为期望容忍区间,可以被解释为下一个或几个可报告值以一定概率水平落在给定的区间,简单说就是在给定置信水平下,未来单次观测值的预期波动范围,它需要同时考虑预期值估计的不确定性和个体值的随机波动。
95%的预测区间意味着,在总体中随机抽取100个样本,大约有95个样本的观测值会落在这个区间内,换句话说,这个区间包含了大多数可能的观测值。以某样品含量测定为例,假设该样品的95%预测区间为98.5%~101.5%,这表明未来再检测100次会有95次落在该区间内。
2.置信区间(Confidence Interval, CI)
一般指平均值的置信区间,选定一个置信水平(如95%)(注:也有文献中将置信区间称为置信度、置信概率等,意思都是一样的),并在总体平均值的估计值的两端各定出一个界限,称为置信限,两个置信限之间的区间,称为置信区间,这种用置信区间和置信水平来表达分析结果称为区间估计,它是表达分析结果的较好方法。
95%的置信区间则表示,从总体中随机抽取若干样本,这些样本的平均值有95%的概率落在该范围内。置信区间关注的是样本平均值,而不是单个观测值。仍以某样品含量测定为例,假设我们得到的95%置信区间为98.5%~101.5%,这意味着如果我们对该批样品进行大量采样,其总体均值有95%会在该区间内。
从实际意义来看,置信区间更为重要,因为它提供了关于总体参数的可靠估计。而预测区间则是个别值的参考范围,他比置信区间更宽,虽然对实际预测有一定帮助,但并不具备代表性。因此本文以置信区间进行进一步举例分析。而容忍区间则关注数据值在特定区间内的分布情况,常用于质量控制和可靠性的分析,本文不作介绍。
二、如何选择置信水平
在进行统计判断时,置信水平越高,置信区间就越宽;相反,置信水平越低,置信区间就越窄。但置信水平定得过高,判断失误的可能性虽然很小,却往往因为置信区间过宽而实用价值不大。经典分析化学中作统计推断时通常取95%的置信水平,有时根据情况也采用90%、99%等置信水平,但极不常用。取95%置信水平进行准确度与重复性的评价是较为合适的。
三、联合评价的基础
根据通则9101对重复性的规定“取同一浓度的供试品,用至少平行6份的测定结果进行评价;或设计至少3个不同浓度水平,每个浓度水平分别平行制备至少3份供试品溶液进行测定,用至少9个测定结果进行评价。”同时规定了重复性评价的浓度水平选择和设计原则,即根据待测成分的含量或浓度可能的变化范围即报告范围来确定,这与准确度的验证要求的浓度范围是一致的,报告范围在9101中也有明确的推荐范围,如原料药和制剂含量可报告范围的上下限分别为120%和80%。也就是说当我们选择了设计至少3个不同浓度水平,每个浓度水平分别平行制备至少3份供试品溶液进行测定,用至少9个测定结果进行重复性评价时,则可以与准确度进行联合验证,可以提高方法学研究效率,减少重复的验证实验。
四、案例分析
案例1
以下为某化药制剂进行含量测定方法学研究时进行的准确度方法学验证数据,按照3×3进行了设计,回收率可接受范围为98.0%~102.0%,相对标准偏差可接受范围为≤2.0%,其设计符合9101规定的准确度与重复性的联合验证的情形。
95%置信水平的置信区间(μ)计算:
公式:μ= x̄±t0.05,8×S/√n
式中:
x̄:数据平均值;
t:少量样本采用t分布进行处理,查t检验临界值(tα,f)表可得,本例中双侧检验t为2.306;
S:样本标准偏差;
n:本例中为9。
根据公式算得上述数据95%置信水平的置信区间为[98.13%,98.95%],表示有95%的置信度认为总体均值落在此区间内,满足方法回收率应为98.0%~102.0%的要求。
我们注意到即便有一个数据97.9%落在范围外,但当n=9时方法学验证仍能通过。
本例联合验证报告如下:
a.3个浓度共9份测定结果的相对标准偏差为0.53%,小于2.0%,方法精密度良好。
b.平均回收率为98.54%,95%置信水平的置信区间为[98.13%,98.95%],在98.0%~102.2%范围内,方法准确度良好。
案例2
设计同上,数据如下:
同法算得上述数据95%置信水平的置信区间为[97.91%,100.40%],表示有95%的置信度认为总体均值落在此区间内,不能满足方法回收率应为98.0%~102.0%的要求。
我们看到表中有一个“异常”数据96.20%,检查整个实验过程没发现问题,但确实又像是由这个数据引起的结果异常,那么该数据真的异常吗?是方法问题还是数据本身异常的问题呢?当测量次数n在3~10次时,可以采用舍弃商法(Q检验法)对数据进行判断。
1.将数据按照升序或降序排列
96.20% 98.00% 98.50% 98.50% 98.80% 99.80% 100.30% 100.80% 101.50%
2.计算Q值
Q=∣X可疑-X临近∣/(X最大-X最小)
本例算得Q=0.34
3.与临界值比较
Q值比较时置信水平可以根据需要选择90%、95%或99%,一般选择90%即可,以下为Q临界值表:
本例中Q=0.34<0.44,所以数据不应被作为异常数据。
4.处理方式:a.该案例我们需要考虑分析方法本身的问题,在80%浓度水平下回收率偏低,需要解决偏低的问题(如优化提取方式等)。b.进一步增加样本量,药典规定至少三个浓度,每个浓度至少三份,我们可以增加浓度水平和(或)增加每个浓度水平下的份数,增加样本量再次进行统计学分析,进一步锁定原因。
五、总结
通则9101提出的联合验证无疑使得方法学验证更加科学,置信区间从总体参数估计角度识别准确度风险,相对标准偏差实现对精密度的总体把控,这种方式能够建立起衡量准确度和精密度的综合性能标准。
来源:药知晓