在这样的困境下,来自 作者[第一作者单位] 的研究人员决心寻找新的 “地图绘制方法”,于是他们在《BMC Medical Research Methodology》期刊上发表了名为《Evaluating the use of the population stability index to detect sample differences in population - based data》的论文。他们试图探索一种在人工智能研究中常用的评估数据漂移的指标 —— 人口稳定性指数(Population Stability Index,PSI),能否在医疗研究中检测样本差异,尤其是在只能获取汇总数据或面对大规模数据集时,PSI 是否能发挥独特的作用。
研究人员在这项研究中用到了几个关键技术方法。他们从美国国家癌症研究所的监测、流行病学和最终结果(Surveillance, Epidemiology, and End Results,SEER)数据库中提取了美国癌症患者的性别、年龄和癌症类型等数据。然后,使用 PSI 的计算公式(其中代表变量的类别总数,是评分样本中某一类别患者的百分比,是参考样本中某一类别患者的百分比 ),计算每个变量的 PSI 值,以此来比较不同年份样本间的差异。为了验证 PSI 的效果,他们还将 PSI 结果与卡方检验(Chi - Square test)结果进行对比,并使用 Cramér's V 来评估样本间差异的大小。