设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1626|回复: 5

多元数据分析在生物制药工艺中的应用

  [复制链接]
发表于 2019-8-23 14:35:55 | 显示全部楼层 |阅读模式
生物制药工艺是一个相对比较复杂的过程,比如疫苗,抗生素,基于细胞的治疗方法等等。生物制药生产工艺包括发酵或细胞反应器都会涉及到一些可以控制的参数,比如 pH、温度,同时还有一系列的输出检测,比如生物附载和杂质。另外,一些其他不可控制的因素也可以影响产品质量和生产工艺的重复性。这三个要素在药物的整个生产工艺中产生了大量的数据。


那么,我们用什么战略和思考方式来处理这些数据呢?今天来介绍三个主要的工具:DOE(实验设计),MVDA(多元数据分析,也叫多变量数据分析),PAT(工艺分析技术)与MVDA的结合。

众所周知,QbD(质量源于设计)早在十多年前已经被引入到中国,JMP也早已把QbD功能添加到软件的平台中,并提供业内一流的完整而强大的DOE工具,从而对制药行业的工艺开发提供全面的支持。

无论是化学制药还是生物制药行业,实时放行都是一个理想。由于实时放行在目前存在着一些挑战,因此行业普遍的建议是采用参数放行,而这其中都涉及到PAT技术的应用。DOE和PAT两种技术的结果都是产生大量的数据。如果对数据没有正确的分析,这两项技术的应用将无法实现。

接下来我们看看在实际制药行业中这三项强有力的技术如何大放异彩。

DOE,药物开发重中之重

首先,我们来看DOE实验设计。DOE是药物开发生产过程中非常重要的一个平台,在筛选、特性研究、优化和验证过程中都将产生大量的数据,通过对多变量相关性的分析,产生很多数据。更重要的是,DOE为下一步开展多元数据分析提供了一个很好的平台。在早期QbD理念提出的时候,DOE是一个非常先进和有用的概念。通过DOE可以找到设计空间,通过设计空间可以找到控制空间和控制战略。在控制的过程中,最主要的是要了解数据之间的相关性,变量产生的根源、变量之间的因果关系等。在这种情况下,DOE不是结点,而是起点,它可以让我们继续了解工艺变量产生的原因,找到空间。那么,找到空间的目的是什么呢?是控制。所以在整个过程中,我们需要有监测的技术,更重要的是要产生控制战略。当你制定了关键质量属性,当你找到了关键工艺参数,只要控制了工艺参数,质量一定是符合预期的(达到质量目标),这样就为实时放行、参数放行和真实数据的传输打下基础。因此,更重要的是,通过多元数据分析,最终工艺得到了控制,因此质量就得到了控制。



工艺控制要从工艺监测开始。工艺监测有几个重要战略(工具):MSPC(多变量统计学工艺控制)、BSPC(批统计学工艺控制)、PAT工艺分析技术。
  • BSPC通过判断生产批次和期望批次是否一样,用来做趋势分析。
  • MSPC更多的是观测关键工艺参数和关键质量属性之间的关系,是否满足关键质量的要求。
  • 而PAT工艺分析技术结合多元数据分析,就可以实现Real Time Prediction(实时预测)。目前我们更多的是在出现问题以后进行诊断,而未来更多的是要做预测,也即是在生产工艺过程、生产制造和工艺开发过程中就已经能够预测质量、增加准确性、提高生产效率,从而真正实现质量源于设计(QbD)的理念。

通过这些技术和战略的应用,未来的技术人员将能够在产品的生产过程中就已经预测到产品的质量,这也符合我国药监局推出的“从事后监管向过程监管”的思路,NMPA也推出了智慧监管的总体战略思路,而上述技术都是在此监管过程中所需要的。

接下来,我们来看看多元分析为何如此重要?

多元分析,火眼金睛,工艺偏差全知道

在多元数据分析中,我们既能看到变量与变量之间的相互关系,也能看到变量与变量产生偏差的原因,作为强有力的工具,多元数据分析可以在工艺早期就能观测到偏差的根因。
下图展示了多元数据分析与单变量数据分析的不同。

在这个例子中,温度和pH值看起来是在控制限度内。然而,当两个图像以多变量的形式相对应描绘出来时,我们就可以观察到一个趋势。其中有一个数据点是远离主数据群的。而这个游离的数据点在单变量的控制图中是没有显示出来的。这其中的原因主要在于,在大多数情况下,工艺参数彼此都是相关的。由于这些数据相互之间都具有相关性,多元数据分析可以提供一个强有力的、能够观察到完整画面的工具。通过多元数据分析,一个完整生产批的工艺数据可以被汇总成单一的趋势。同时,每个数据点都包含有每个工艺变量的信息。这些信息可以用来对任何一个特别的变量进行深入的、更加专注的分析和解决问题。我们也可以产生包含限度的多变量图,并被用来跟踪一个生产批次的全过程。

再来看看另外一个多元数据分析的案例研究。为了能进一步了解多元数据分析的应用,科学家们对在青霉素生产过程中公开的工艺数据进行了分析。这个案例是13个生产批次的数据。其中,10批次产生了正常放行、合格的产品,从而被用来做矫正模型。另外,有3批失败了,这些数据被用做测试和验证这个工艺模型。那么,为什么这3批QC没有放行?为什么会产生偏差?

在这个案例中我们可以看到工艺变量是非常完整的,最终产品的质量指标就是生物质。生物质是我们主要观测的数据。通过多元数据分析,数据的结构和各种相关性被清楚地展示在“Loadings Plot 载荷图”中,用来展示工艺变量之间的相关性。


从图中可以发现,在葡萄糖浓度很低的情况下,其他代谢物的浓度是非常高的。而其他工艺变量的相关性,在做单变量分析是看不到的,更加看不到代谢物和营养物质与生物质(Biomass)之间的关系。生物质为什么重要呢?因为它与产品质量是密切相关的。而在多元分析的载荷图上,我们就可以直观地看到生物质与代谢物、营养物质之间相关性的展示。

接下来,通过对10批数据的分析,一个初始模型产生,一个多变量数据控制图就展示出来了。另外,3个用于检测的测试批次被用来观察通过使用这个模型,是否可以检测出任何偏差的存在。从测试中可以看出,偏差是很容易被观察到的。



从上图可以看出:
  • 10批正常放行的批次基本上都在控制范围之内;
  • 在整个在生产工艺化学反应开始的早期阶段,批与批之间的差异相对比较大,随着工艺的进行,在生产结束阶段所有的变量都非常集中,各批也都是在限度内,偏差并不是很大。这里就形成了所谓的金标准。

通过这10批,我们可以观察到整个工艺参数的走向、偏差产生的轨迹。同时也能看到工艺早期和工艺晚期之间变量的发生。
我们再来看看3批不符合质量标准的批次。在没有开展多元分析前,通常我们只知道这3批是不符合质量标准的,但究竟这3批什么时候出现问题?为什么会出现问题?这些就只能通过多元分析来解答了。

通过多元分析可以发现,红色、绿色、蓝色是被拒绝的3个批次,虚线是控制范围。

  • 红色、绿色在控制范围之外,蓝色其中一批压在控制限之内。通过JMP软件的交互式点击可以发现,红色是某个要素的异常,而且是在工艺早期发生的异常,但在工艺晚期已经恢复正常。下面的柱状图更详细地展示在红色线的批次里,哪一个变量引起偏差。如果不用多元数据分析,我们看到代谢物等在工艺过程中都是正常的,但其实在工艺的很早期就先发生了变异,这就导致了这3批最终被拒绝掉了。
  • 绿色这批在工艺早期就已经处在工艺控制范围外。通过多元分析的展示,可以看到在实际生产过程中,很多偏差、根因(Root Cause)的产生远远在工艺的前期就已经开始,如果我们只是做Ending Point检测,是无法检测到这些变异产生的根源,特别是它们出现的时间。同样地,如果在结尾用离线检测的话,会发现结果是很好的,但实际上营养机制、代谢物的偏差在工艺早期就已经出现了。

通过以上可以看出,多元数据分析技术可以帮助我们在生产工艺过程的早期发现偏差,从而让我们能够及时找出解决问题的思路和方法。相反,如果没有这些数据分析技术的支持,我们能获得的唯一信息就是在生产过程的后期,产率下降。同时,通过DOE和多元分析技术的结合,可以改变生物制药企业数据分析的战略,提高药品开发的速度,大幅降低相关成本。


PAT叠加多元分析,强强联合,让在线实时分析更容易

第三个技术——PAT技术,特别是PAT和多元分析技术结合起来应用的话,力量非常强大。PAT技术有很多,通常情况下是在工艺过程中取样,取完样以后到QC实验室或IPC实验室去检测,检测完以后再返回。


PAT技术的应用,可以让整个分析技术实现在线完成。通常来说优势众多:
  • 在线分析的关键优势在于可以控制关键工艺参数(CPP)。为什么要控制CPP呢?因为每一个关键工艺参数和关键质量属性都是相关的。
  • 可以实现实时预测。在上述例子中,如果应用了PAT进行实时预测的话,在工艺早期就已经能够发现这3个批次存在偏差,从而可以更好地预测这3个批次在最后是否存在问题、能否放行等。
  • 多元数据分析能够产生相关性及相关性的模型。
  • PAT广泛的应用,可以在药物工艺的开发、药物生产过程中的各环节应用,远远高于Ending Point的检测等,同时也可以检测很多不采用PAT技术就无法在线检测的要素,包括营养要素水平的测量、杂质的识别等。

那么,PAT技术如何叠加多元分析技术在生物制药领域大放异彩呢?欢迎下载勃林格殷格翰生物制药(中国)有限公司总经理罗家立博士在2019国际医药分析峰会(iPAS)上发表的精彩演讲。

在罗家立博士的演讲中,他通过案例研究进一步展示了先进的PAT技术如何与多元分析技术相结合,打造实时的工作流模型,从而为工程师报警和诊断提供依据。罗家立博士指出,多元数据分析与PAT在线分析技术的结合,可以形成真正的工艺监测和工艺控制。JMP数据分析软件不仅仅是一个独立的统计学工具,更重要的是企业如何将软件所提供的技术平台和工具的应用形成一个强有力的、整体的解决方案,为制药行业实现将现在真正的工艺推到未来的实时放行和连续工艺中提供强大的数据技术支持,从而最终提升产品的质量。


你可以点击这里下载演讲资料或复制以下链接到浏览器下载:

https://www.jmp.com/zh_cn/events/seminars/HLS-paper.html?utm_campaign=exs7013Z000002sCzqQAE&utm_source=wechat&utm_medium=social



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

发表于 2019-8-26 15:30:41 | 显示全部楼层
我想了解一下,这次演讲中所用的PPT,数据文件,.....能否放上来?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-8-27 09:05:11 | 显示全部楼层
Mujahida 发表于 2019-8-26 15:30
我想了解一下,这次演讲中所用的PPT,数据文件,.....能否放上来?

注册可以下载PPT。关于原始数据,演讲嘉宾也没有分享给我们,所以手头上也没有~
回复 支持 反对

使用道具 举报

发表于 2019-9-5 09:06:15 | 显示全部楼层
请问这个讲座会有视频吗?谢谢!
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-9-5 13:25:37 | 显示全部楼层
cccybwhu 发表于 2019-9-5 09:06
请问这个讲座会有视频吗?谢谢!

这位嘉宾不同意公开视频,所以没有分享。下次建议直接去现场听吧~
回复 支持 反对

使用道具 举报

发表于 2022-5-9 23:00:49 | 显示全部楼层
麻烦问下多元数据分析在哪边?没有找到。。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-3-28 22:39 , Processed in 0.407532 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表