《新型广义超曲面多维生物系统非稳态动力学预测:一种算法方法》
《BioSystems》:Novel Gaidai hypersurface multidimensional biosystem nonstationary dynamics prognostics: an algorithmic approach
【字体:
大
中
小
】
时间:2026年02月19日
来源:BioSystems 1.9
编辑推荐:
1本研究基于Gaidai超曲面多模态预后评估方法,分析195国未过滤临床数据,构建高维时空关联模型预测癌症/心血管/糖尿病死亡率,提供15/100年预测及95%置信区间,突破传统极值理论二维局限,适用于复杂生物系统可靠性评估。
Oleg Gaidai|Tao Zhang|Shicheng He|Qianlong Ma|Salwa Noureldine
上海海洋大学工程科学与技术学院,中国上海
摘要
目的
预测任何地理区域内未来癌症、心血管疾病和糖尿病的死亡率,在任何给定的时间回归周期内都具有实际意义。本研究采用了先进的Gaidai超表面时空预测概念来分析原始/未经过滤的临床监测数据集。
方法
本研究应用了一种多中心、基于人群的生物统计方法,分析了来自全球195个国家的癌症、心血管疾病和糖尿病的年度死亡率,这些数据属于685维(685D)生物系统。该案例研究评估了一种新开发的多模态方法在评估生物系统可靠性方面的效果。这种方法特别适用于在代表性时间段内监测的多区域公共卫生和生物环境系统。在处理多维、多区域现象的时空观测数据时,现有的统计方案并不总能有效处理广泛的区域/空间维度。将极值理论(EVT)从单变量(1D)扩展到双变量(2D)环境存在挑战。1D EVT无法直接扩展到2D情况,更不用说超出2D维度的系统了。
结果
所提出的方法可以有效应对这一挑战。可以使用现有的原始临床现场/调查数据,在各种公共卫生预测背景下应用这种多模态生物风险评估方法。报告了预测的15年和100年死亡率以及95%置信区间(CI)。
结论
本案例研究的发现可能对公共卫生系统中的数字健康和多模态预测工具具有实际意义,在这些系统中需要高效分析大数据(例如原始临床观测数据)。在评估流行病学风险时,生物系统的故障概率通常很低(例如,小于10^-6)。所提出的多变量生物可靠性概念在底层数据样本量有限时,能够提高生物风险估计的准确性。
引言
本研究解决了多模态公共卫生系统中的预测差距问题,因为现有的回归周期估计主要局限于2D系统。伤残调整生命年(DALYs)表明,在过去十年中,由癌症引起的疾病负担减少了大约10%。本研究使用了纽约州166家公立医院的30年临床数据来估计一个二次长期成本函数[1]。在过去十年中,每位患者的癌症费用有所下降,而处方费用以大约5%的年复合增长率上升。在所研究的突出慢性疾病中,癌症显示出最高的疾病负担,占各种情况下伤残调整生命年(DALYs)的约20%,同时获得的医疗支出仅为总医疗支出的约5%,相比之下,心血管疾病(CVD)、糖尿病和神经/精神疾病的比例要高得多[2]、[4]、[5]、[6]、[7]、[8]、[9]。癌症对患者和国家公共卫生系统产生了财务、人文、死亡率和发病率方面的影响。本案例研究旨在提高对医疗支出动态的理解,重点关注相关的死亡率。图1展示了按疾病划分的医疗支出平均比例[10]、[11]、[12]、[13]、[14]、[15]。在大多数富裕国家中,癌症占总直接医疗支出的比例排名第二低(约5%),仅次于神经疾病(约4%)、糖尿病(约7%)和心血管疾病(约9%)。
心血管疾病(CVD)包括心脏和血管的疾病。这些疾病包括冠心病(例如心肌梗死)、高血压(例如血压升高)、心力衰竭和其他心脏疾病。美国国家癌症研究所(NCI)将恶性肿瘤定义为具有增殖和扩散到周围器官能力的异常细胞所引起的疾病[16]、[17]、[18]、[19]、[20]、[21]、[22]、[23]、[24]。发生在不同解剖区域的恶性肿瘤可以发展成多种形式的癌症。癌症有时会通过淋巴系统和循环系统转移到身体的其他部位。考虑到公共卫生系统的财务限制,研究癌症、心血管疾病和糖尿病的三变量数据是明智的,因为这些是全球三大主要死因。本研究主要关注公共卫生系统,而不是个人健康。在定义的时间框架内,评估各国公共卫生系统的相对财务负担可以支持本案例研究。关于心血管疾病、癌症和糖尿病死亡率的统计属性,以及引起科学界广泛关注的有效的数据处理技术,在[3]中有讨论。有关CVD相关生物统计学的信息,请参见[4]、[5]、[6]、[7]、[8]、[9]、[10]、[11];有关癌症和糖尿病相关生物统计学的信息,请参见[12]、[13]、[14]、[15]、[16]、[17]、[18]、[19]、[20]、[21]、[22]、[23]、[24]。在糖尿病中,身体要么无法有效利用胰岛素,要么无法产生足够的胰岛素。当细胞对胰岛素不再敏感或胰岛素水平不足时,体内会积累过多的葡萄糖。这可能导致严重的健康问题,包括心血管疾病、视力障碍和肾脏疾病。关于糖尿病患者的死亡率研究,请参见[25]。
在使用经典统计方法预测实际多模态疾病情景中的过度死亡率时,同时考虑生物系统的可靠性因素是具有挑战性的。后者问题源于生物系统中的自由度(NDOF)增加以及影响其动态的众多变量[3]。原则上,通过对临床观察的全面分析或直接进行蒙特卡洛模拟(MCS),可以准确直接地评估复杂生物系统的可靠性。受此启发,本研究提出了一种创新的多模态风险评估方法,用于生物和健康系统,以改善死亡率管理并优化公共卫生支出。本案例研究的主要目标是分析全球范围内心血管疾病、癌症和糖尿病相关公共卫生问题的普遍性[26]、[27]、[28]、[29]、[30]、[31]、[32],同时考虑国家间的空间相关性。
在生物医学工程中,寿命数据的统计建模经常依赖于极值理论(EVT)。最近的一项研究揭示了关于预期寿命分布上限的争议[8]。为了统计建模原始数据集中的趋势,这些领域的研究通常采用基于指数型概率密度函数(PDF)的参数化二维寿命分布[5]。在[4]中,数值二维生存分析经常使用条件抽样和幂方差函数(PVF)copula,包括Gumbel、逆高斯、Weibull和Clayton。先进的Gaidai多模态风险评估方法有助于理解疾病的潜在全球传播及其相关的公共卫生成本,同时考虑了关于心血管疾病、癌症和糖尿病的联合死亡风险的有限统计研究。
极值理论(EVT)假设由原始数据估计的广义极值(GEV)渐近概率密度函数(PDF)控制着极端值的分布。参数化的广义帕累托(GP)概率密度函数被认为可以调节超过临界阈值的进程。当前风险评估方法的主要问题是,即使EVT和广义极值(GEV)分布相关,仅凭渐近极值理论(EVT)本身也不足以估计观测数据集中超过所需渐近阈值的部分。因此,EVT假设基础数据集遵循渐近EVT概率密度函数,而这最终取决于信任或便利性。现在可以使用的多维Gaidai多模态风险评估方法可以作为EVT的辅助工具集,作为一种诊断工具。Gaidai多模态风险评估方法采用EVT概率密度函数的非参数版本。这允许分析从基础数据派生的渐近GEV PDF的应用基础。多维Gaidai多模态风险评估方法可用于预测多变量极端值,作为渐近概率密度函数的替代方法。纵向研究需要将Gaidai多模态风险评估方法应用于非平稳时间序列。
本研究调查了心血管疾病、癌症和糖尿病导致的死亡率升高的时空分布,这些之前被视为可能随时在任何国家或地区发生的随机事件。创建了一个缩放无量纲因子来预测未来疾病爆发的概率。各种环境变量以准遍历方式影响生物系统。这一过程可以被视为取决于特定的生物和生态变量,其时间变异性可能表现为一个独特的准遍历过程。一个开源网站包含了1990年至2020年间195个国家的 cardiovascular disease、癌症和糖尿病的发病率数据[3]。该数据集涵盖了全球所有国家,将生物系统描述为一个非平稳的、动态的、多自由度(MDOF)系统,具有显著的空间相关性成分。本研究旨在预测未来由于心血管疾病、癌症和糖尿病导致的死亡率升高事件,尽管它仅分析了年度患者死亡率数据,而没有涉及症状。
研究空白:现有的可靠性和风险评估方法,除了基于蒙特卡洛模拟的方法外,在维度上受到限制,特别是NDOF ≤ 2D。当只提供单个数据样本时,无法使用广泛使用的基于MCS的技术,如显著性抽样,因为基础数据集无法重新采样。在上述情况下,所提出的多变量风险评估方法可能为高级临床和公共卫生决策提供强大且无与伦比的解决方案。
部分摘录
Gaidai超表面多模态风险评估方法,考虑记忆效应
从公共来源下载了195个国家的原始临床数据[3]。这些数据未经过滤,即按原样进行分析。所建议的可靠性方法概述如下:
- ?
这是一种最近开发的通用多模态时空方法,用于评估多维动态系统中的风险。
- ?
该方法可以根据指定的回归周期提供系统故障风险的精确估计。
- ?
置信度
结果
心血管疾病、癌症和糖尿病死亡率的预测长期以来一直吸引着流行病学、数学生物学和生物信息学研究人员的兴趣。众所周知,高度非线性、空间相关性的多维动态系统往往难以分析,特别是考虑到公共卫生动态的非平稳性质。先前的研究采用了各种技术来模拟心血管疾病、癌症和糖尿病的动态模型。
讨论
表2突出了Gaidai多模态生物可靠性方法的实用预测优势。当前的生物可靠性方案通常限于NDOF 2D系统,而所提出的多模态预测方法对NDOF没有限制。
所提出的超表面多模态预测方法的一个潜在局限性是公共卫生系统的分段联合准平稳性假设。当底层系统表现出趋势(例如季节性)时
结论
在复杂系统组分的交叉相关性下,生物系统的动态特性,鉴于系统的高维度,现有的预测和数据分析方法并不总能有效处理,特别是在基于有限观测原始时间序列的健康系统风险评估中。所提出方法的主要设计优势在于其能够评估高维非线性生物系统的动态生存能力。当前研究提供了一种新的CRediT作者贡献声明
Oleg Gaidai:概念化。Salwa Noureldine:软件。Shicheng He:形式分析。Tao Zhang:数据整理。Qianlong Ma:调查
未引用的参考文献
[58]、[59]、[60]、[61]、[62]、[63]、[64]、[65]、[66]、[67]、[68]。
伦理考虑
由于分析的数据是匿名的且来自公共来源,因此不适用数据隐私和患者同意问题。利益冲突声明
? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号