《Methods in Ecology and Evolution》:Complete elliptic Fourier descriptor normalization and its application in quantitative morphological analysis
编辑推荐:
椭圆傅里叶分析(Elliptic Fourier Analysis, EFA)常被用于几何形态测量学(Geometric Morphometrics, GM),但椭圆傅里叶描述子(Elliptic Fourier Descriptor, EFD)的归一化(No
椭圆傅里叶分析(Elliptic Fourier Analysis, EFA)常被用于几何形态测量学(Geometric Morphometrics, GM),但椭圆傅里叶描述子(Elliptic Fourier Descriptor, EFD)的归一化(Normalization)问题长期存在,难以获得唯一且可比较的结果,尤其在基于轮廓的GM方法中,限制了该方法对大量、高变异、多维生物形态的自动化分析。本研究提出一种完全椭圆傅里叶描述子(Complete EFD)归一化方法,经理论推导证明其在所有基本轮廓变换(平移、缩放、旋转、反向、起始点变化及对称变换)下保持不变。在此基础上,研究人员建议使用由完全归一化EFD重构的两形状间的最小欧氏距离(Minimum Euclidean Distance)进行定量形态比较,数学上保证结果唯一且可比。使用基准数据集验证了所提完全EFD归一化流程。应用该定量形态分析方法比较86个物种1338枚叶片形状并构建形态树,结果显示聚类模式与叶片椭圆度(ellipticity)和裂片化程度(lobation)相关。完全归一化EFD及其对应轮廓可进一步用于深度学习数据训练以实现精准形状识别。此外,几何形态测量学与机器学习融合对整合分类学(integrative taxonomy)、生物多样性保护、物种分类及生态系统功能评估具有重要意义,可推动形态大数据驱动的跨尺度生物学研究。
论文解读:《Complete elliptic Fourier descriptor normalization and its application in quantitative morphological analysis》
一、研究背景与立项依据
几何形态测量学(Geometric Morphometrics, GM)是定量研究生物多维形态及其变异的重要数学工具,主要包括基于标志点(Landmark-based)和基于轮廓(Outline-based)两类方法。基于标志点法适用于具有同源可定义点的形态,但对叶片、花瓣等缺乏明确同源点的结构并不适用;基于轮廓法则通过提取物体外边界曲线来描述形状,不依赖同源点,适合自动化处理大量生物形态。椭圆傅里叶分析(Elliptic Fourier Analysis, EFA)可将任意二维闭合曲线转换为椭圆傅里叶描述子(Elliptic Fourier Descriptor, EFD),并能以任意精度重构原始形状,被广泛应用于轮廓法GM中。
然而,传统EFD归一化仅能消除平移、缩放和旋转的影响,无法处理轮廓反向(Reversal)、不同起始点(Starting Point Variation)及对称变换(Symmetry Transformation,含x轴和y轴对称),导致同一轮廓经不同基本变换后得到不同的归一化EFD,无法保证描述的唯一性与跨样本可比性。现有软件(如SHAPE、MASS、Momocs)亦未彻底解决此问题,人工对齐又不适合海量数字化标本(如GBIF、iDigBio、CVH平台数据)。这种缺陷限制了EFA在高通量、高变异生物形态自动化分析中的应用。为此,研究人员开展了EFD完全归一化(Complete EFD Normalization)理论研究,并提出基于完全归一化EFD重构轮廓的最小欧氏距离定量形态比较方法,并开发了集成工具ElliShape。该论文发表于《Methods in Ecology and Evolution》。
二、主要关键技术方法概述
研究人员采用链码(Chain Code)表示闭合轮廓,依Kuhl & Giardina (1982)方法改进直接计算EFD(含直流分量DC与第n阶傅里叶系数an, bn, cn, dn)。完全归一化步骤依次为:(a)平移归一化(DC置零);(b)反向归一化(据一阶椭圆曲线叉积判断走向,调整为逆时针);(c)缩放归一化(按一阶椭圆曲线长轴长度归一);(d)旋转归一化(将一阶椭圆曲线长轴顺时针对齐x轴);(e)起始点归一化(固定一阶椭圆曲线长轴端点中时间夹角θmin对应点为新起点);(f)x轴对称与y轴对称归一化(依据二阶椭圆傅里叶系数符号约束二阶层曲线至α象限)。定量形态比较采用完全归一化EFD重构轮廓间的最小欧氏距离(Minimum Euclidean Distance),通过优化旋转角φ与平移τ实现最优对齐。研究人员使用四套数据验证:Dataset 1为6个典型图形及其8种基本变换构成的基准集;Dataset 2为壳斗科3物种(Castanea dentata 95枚、Fagus sylvatica 84枚、Quercus alba 129枚叶片)原轮廓及变换共2772条链码;Dataset 3为"One-hundred plant species leaves"(86属种1338枚叶片);Dataset 4为含残缺、低对比度、噪声的生物标本图像样本。对比方法包括原始Kuhl & Giardina流程、SHAPE、MASS及Momocs;PCA降维比较归一化效果;基于最小欧氏距离矩阵构建邻接树(Neighbour-Joining Tree)。软件ElliShape用Python实现GUI(含Segment Anything Model即SAM自动分割、Otsu阈值、手动多边形、图像增强、腐蚀/膨胀、链码生成)及命令行与在线版。
三、研究结果
3.1 Comparisons with existing methods for demonstrating the completion of algorithms
研究人员以Dataset 1六个典型图形(含龟形)及其八类基本变换分别用原始方法、SHAPE、MASS、Momocs及所提完全归一化流程处理。结果显示传统方法与三类软件在不同变换下无法始终给出唯一归一化EFD组,尤其遇反向、变起点或对称变换时出现分散;而所提方法对所有基本变换均得到完全一致归一化EFD与重构轮廓。Dataset 2中308枚叶片原轮廓及变换后共2772条链码经PCA降维显示:原始方法和Momocs归一化后同类轮廓散点分散,而所提方法使同轮廓各变换对应点聚为一点,证明完全归一化消除变换歧义,优于现有方法。
3.2 Quantitative analysis of morphology for demonstrating its applications in biology
研究人员对Dataset 3(1338枚叶片)进行完全归一化EFD计算,采用重构轮廓最小欧氏距离(辅以FFT加速,每对约0.015 s,全量约3 h)而非直接比较系数,克服低阶项主导问题并实现数值最优对齐。基于距离矩阵用邻接法(NJ)构建形态树,树分三大支:分支Ⅰ以线形和矩圆形(linear and oblong)为主,分支Ⅱ以圆形和心形(orbicular and cordate)为主,分支Ⅲ再分为掌状裂/深裂(palmatifid-palmatipartite)与羽状裂/深裂(pinnatifid-pinnatipartite)两亚支,聚类模式明显关联叶片椭圆度与裂片化程度,表明最小欧氏距离法可有效量化复杂叶形差异并揭示形态分化。
3.3 Comparisons with existing methods for evaluating the ease of use in contour/outline extraction
研究人员用Dataset 4(含白条纹缺边、低对比、重叠、破损器官图像)测评ElliShape与SHAPE、MASS、DiaOutline、ImageJ。SHAPE仅支持矩形框选取且无编辑功能,长链码失效;DiaOutline自动选取易含非目标且无精修;MASS仅限白底提取;ImageJ需多步手动调参。ElliShape集成SAM自动分割(框选目标)、多边形手动工具(处理重叠/SAM失效情形)、图像增强/反色/腐蚀/膨胀/编辑窗口/链码等功能,能稳健处理标本数字化常见瑕疵,输出边界坐标、链码、面积、周长及标注图像,适合大规模数据集构建。
四、讨论与结论翻译
讨论指出:所提EFA流程经理论证明可实现含平移、缩放、旋转、反向及对称变换下完全EFD归一化,消除变换导致模糊结果,对大规模未知变换轮廓分析至关重要;所建定量形态框架提供客观形状差异度量,支持与分子及环境参数整合,推动整合分类学与生态研究,并为叶片趋同与适应演化提供形态框架;基于轮廓GM虽无真正生物同源点对齐,但本数值对齐给出数学最优近似,中度至高度变异样本不能保证同源结构对应;ElliShape开源工具提供完全归一化与定量比较,兼容命令行批处理、SAM分割GUI及网页版,可嵌入LeafMachine2检测→SAM分割→ElliShape分析流程,提升标本图像(白纹、遮挡、碎裂)处理精度,利于GBIF/CVH等全球资源系统形态计量;未来可融合标志点与轮廓数据及机器学习,扩展至整合分类学、古生物化石重建及医学影像,推动形态大数据跨尺度研究。
结论翻译如下:
研究人员为几何形态测量学提供了涵盖算法改进、定量比较方法及工具实现的综合方案。(1)引入严格的完全EFD归一化数学流程,确保在平面平移、缩放、旋转、反向及对称变换下的不变性,对大批量复杂轮廓分析至关重要;(2)采用优化旋转角与起始位置的最小欧氏距离法标准化形状差异,较常规欧氏距离在处理复杂形状上更优;(3)发布用户友好软件ElliShape,集成轮廓提取、所提完全EFD归一化EFA分析及定量形态比较功能。