设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1624|回复: 1

JMP 15 DOE新功能--组正交超饱和设计

[复制链接]
发表于 2020-4-2 14:58:11 | 显示全部楼层 |阅读模式
2019年10月,JMP 15全新发布。JMP 15新增和改进了许多令大家耳目一新的功能。其中最让小编喜爱的,一个是能够实现企业内数据实时共享的JMP Live, 另一个就是今天我们要介绍的实验设计(DOE)新功能——组正交超饱和设计(GO SSD)了。作为筛选设计中的一员,组正交超饱和设计体现了它在因子筛选上独特的优势。


通常当我们开始一个新系统或新流程的研究,往往会采用头脑风暴的形式列出多达十几到几十个的潜在影响因素,然后希望通过测试筛选出其中重要的因素。 这时如果采用标准筛选设计的话,至少要完成因素数量+1次实验,才可估算每个因素的线性主效应。

许多经验告诉我们,筛选实验中通常一半以上的因素都对响应没有影响,基于帕累托准则也提到通常80%的重要影响是由于20%的潜在原因所致。问题在于,在进行实验之前,我们并不知道哪些是重要因素。


如果实验预算有限(通常都会),并且还希望应用标准筛选设计的话, 实验者通常根据个人经验保留少量潜在因素(一般6-12个)用于设计和执行实验,以节省拟合模型所需的实验次数,而剩下的潜在因素就直接被忽略了。如果其中包含对系统和流程影响重要的因素,则最终的模型很可能会与实际不符,造成后续实验资源的极大浪费,这是我们都不愿意看到的。


这时候你可以考虑超饱和设计啦!超饱和设计是一类实验次数可以少于因素数的设计方法。如果测试的目的是从很多潜在的影响因素中找出少量最显著的因素,应用超饱和设计就有可能极大地节省资源和时间。回顾超饱和实验的历史,1959年Satterthwaite提出应用随机设计实现实验次数小于测试因子数的可能,1962年Boothand Cox正式系统性的提出超饱和设计的理念,并定义了E(s2)作为评估设计优劣的参数。此后更多的统计学家在此基础上不断优化E(s2)的算法。2014年, Jones and Majumdar通过D-最优方法来构建超饱和设计实验,并提出优化后的UE(s2)能更好的评估因素效应。


JMP几年前就在定制设计中添加了超饱和设计的功能。通过选择模型中的所有因子效应并将其可估计性从默认设置“必需”更改为“若可能”,就可以将所需的实验次数减少到少于因子数,但对这种设计的结果实验者仍需要大量的时间和专业知识来分析和解释,从而才能找出影响显著的因素。因此,多年来,JMP一直在寻找一种新的简单方法。


组正交超饱和设计就此应运而生。这种设计构造非常简单,首先利用算法先构建一个Hadamard矩阵和另一个Hadamard矩阵的子集,然后对这两个矩阵求Kronecker积即可。以12个潜在因素的筛选实验为例,采用标准的筛选设计即使在有13次实验的情况下,也没有自由度用来估计误差方差。那么我们来看看如何通过12次实验的组正交超饱和设计来完成筛选呢?

首先,构建一个4X4的Hadamard矩阵 H 和一个4X3的Hadamard矩阵子集T;



接下来,对这两个矩阵求Kronecker积,就可以获得一个12次实验的组正交超饱和设计,如下图所示:
  
最后,对从A到L的12列分别安排潜在筛选因素,对P1到P3列安排假因素即完成设计。


结合上述设计的相关矩阵,我们不难发现组正交超饱和设计的优势:


1.    通过将筛选因素分为几组,并保证不同组中的因素彼此正交,同一组中的因素弱相关的,同时指定第一组为假因素组,从而得到误差方差的无偏估计,即找到了一种将信号与噪声分离的有效方法。
2.    每一个单独区组内的折叠对称结构,实现了每个组内因素的主效应(如A)和同一组内任意两个因素的交互效应(如AB,BC)正交,和本组内任意一个因素与另一个组内任意一个因素的交互效应(如BE)正交,和其他组内任意两个因素的交互效应(如KL)正交。这些正交性的存在,保证了模型拟合中因素不相互混淆,使组正交超饱和设计在最大限度上避免了其他饱和设计显著因素被漏选,不显著因素错选的问题,从而大大提高了筛选效率。

下面我们通过一个真实案例来看个更具体、更有趣的对比。JMP总部研发人员想要了解下定制实验在不同设置情况下的运行速度,从而针对重点设置进一步优化,一共定义了12个潜在因素,具体列表如下图:

  
Quadratic terms
  
Number of starts
Extra factors
Optimality
Extra runs
More extra factors
Random seed
More extra runs
Replicates
Simulate responses
Save X matrix
Use alias terms


采用部分析因设计(IV) , 通过32次实验拟合模型,筛选得到5个最显著的因素(p<0.001)和3个次显著的因素(p<0.05)。


如果用组正交超饱和设计的方法结果又会如何呢?采用12次实验,4区组的正交超饱和设计法,将12个潜在因素分为三个区组进行测试,对测试结果结合JMP内置的自动分析功能,得到如下图的结果,5个最显著的因素同样被准确找出。



32 vs 12,JMP15新推出的这个筛选实验设计方法是不是很有效呢?


接下来我们看看如何在JMP中开展组正交超饱和设计与后续的分析。

对于12个潜在筛选因素,可采用12次测试,16个参数的组正交超饱和设计,多出的4个留给截距项和3个假因素。

1.    打开JMP软件菜单:实验设计 > 特殊目的 > 组正交超饱和 > 组正交超饱和设计。

2.    在实验次数位置输入12, 或者在因子数位置输入16。


3.    在结构部分选择合适的设计方案,通常建议组数越多,设计越可靠。所以本例选择第二个设计方案,此方案能测试16个因素,他们将被分为4个组,每个组包含4个因素。



4.    查看组结构,可以看到组1包括X1,X2,X3 和截距(自动隐藏),X1-X3将指定为假因素。组2包括X4-X7,组3包括X8-X11,组4包括X12-X15,都将设为测试因素。
      
5.    将X1,X2,X3分别改名成fake1,fake2,fake3,该操作让设计看起来更清楚,对设计本身没有影响。

6.    点击设计表格,即可生成设计计划。


测试完成后,实验设计菜单中还提供的内置自动分析功能,方便你进一步开展后续分析:

1. 打开JMP软件菜单:实验设计 > 特殊目的 > 组正交过饱和 > 组正交过饱和拟合。

2. 将上例中的响应值作为Y响应,把fake1-fake3,X4-X15作为X因素。

3. 重要因素将被自动挑选显示,点击运行模型即可用挑选出来的重要因素建模。如果一个区组中有太多有影响的因素,JMP还会告诉您哪些因素需要一个小的后续实验进一步确认。


最后,附上一个手把手操作的小视频让你直观地学起来。


如果你的测试需要筛选很多因素,而测试成本又很高的话,无论是在费用上还是时间上,组正交超饱和设计都将是你首选的工具。如果你也想试试JMP15的这个新功能,不妨下载JMP15 免费试用起来。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

发表于 2020-5-29 16:37:01 | 显示全部楼层
本帖最后由 renzhewudia67 于 2020-5-29 17:08 编辑

谢谢分享!!!!!! 但我有一个问题,对于众多的因素进行筛选实验,就上面提出的这个案例中采用32次的部分析因设计和12次的这个超正交设计,虽然说都找出了5个最重要的因子。但从标准差和p值来看, 32次的结果更为可信。 不知道理解是否正确??
我有一个问题是,如果知道在众多的因素当中,存在不同因素之间的交互作用,是否是不太合适采用上述的实验方法,而要采用确定性筛选设计方法? 望解答!! 谢谢


回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-3-29 07:16 , Processed in 0.392355 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表