流程挖掘分析问题的分类学与问题目录:提升项目规划与问题设计的系统性框架

《Business & Information Systems Engineering》:What Questions Can I Ask? A Taxonomy and Question Catalog for Process Mining Analysis Questions

【字体: 时间:2025年10月25日 来源:Business & Information Systems Engineering 10.4

编辑推荐:

  本研究针对流程挖掘项目中分析问题定义不明确、缺乏系统指导的痛点,开发了一套流程挖掘分析问题的分类学(Taxonomy)和问题目录(Question Catalog)。研究人员通过严谨的设计科学研究方法,构建了包含六个维度(用例、视角、主要目标、认知步骤、上下文、数据级别)的分类体系,并收集整理了405个真实世界分析问题形成目录。评估结果表明,该成果能有效支持用户描述、比较、评估分析问题,并设计新问题,尤其适用于流程挖掘成熟度较低的组织或新手分析师,对提升项目规划质量和分析效果具有重要意义。

  
在现代商业环境中,业务流程是组织运营的核心。随着全球化、标准化和技术创新的发展,企业越来越需要通过理解、监控和优化其业务流程来保持竞争力。流程挖掘(Process Mining)作为一种强大的数据分析技术,能够从信息系统记录的事件日志(Event Logs)中提取知识,帮助组织发现真实的过程模型、检查合规性、分析性能瓶颈,从而实现数据驱动的流程改进。然而,尽管流程挖掘技术和方法论(如L*生命周期模型、PM2方法论)日益成熟,许多项目在规划和执行阶段仍然面临碎片化的挑战。其中一个关键痛点在于项目初期:如何将模糊的业务需求转化为具体、可执行的分析问题(Analysis Questions)。分析师们常常陷入两难境地——问题既要足够具体以指导数据提取和技术选择,又要足够宽泛以避免遗漏有价值的洞察。现有方法论虽强调目标定义的重要性,却很少提供系统性的资源来帮助分析师进行问题分类、澄清和设计。
为了解决这一难题,发表在《Business & Information Systems Engineering》上的研究论文《What Questions Can I Ask? A Taxonomy and Question Catalog for Process Mining Analysis Questions》进行了一项开创性的工作。研究人员遵循信息系统研究领域成熟的分类学设计方法(Nickerson et al., 2013),旨在为流程挖掘分析问题的关键组成部分提供一个清晰的分类体系,并构建一个内容丰富的问题目录,以支持分析师更有效地开展工作。
为了回答“如何系统化地描述和设计流程挖掘分析问题”这一核心问题,研究团队开展了一项严谨的设计科学研究(Design Science Research, DSR)。他们首先明确了三个核心目标:提供流程挖掘分析问题组成部分的概览、提供结构化澄清问题的方法、以及提供结构化设计新问题的方法。研究过程主要包括大规模的问题收集和迭代式的分类学开发。问题收集阶段涵盖了三个来源:对IEEE流程挖掘任务组发布的75份BPIC(Business Process Intelligence Challenges)分析报告和10份案例研究的文献回顾,收集到140个问题;一项针对39名来自14个国家、17个行业的流程挖掘从业者的在线调查,收集到178个问题;以及从领先的流程挖掘供应商Celonis的Business Miner工具中提取的87个问题。最终,一个包含405个独特分析问题的目录被建立起来。
分类学的开发则经历了七个迭代周期,融合了从实证到概念(E2C)和从概念到实证(C2E)的方法。研究人员对收集到的问题进行定性分析(如扎根理论编码),并不断与现有文献(如van der Aalst提出的流程挖掘类型、Gregor的理论类型学)中的概念框架进行对比和整合,最终形成了包含六个维度的稳定分类体系。这套分类学如同一个精密的透镜,透过它,任何一个流程挖掘分析问题都可以从六个角度进行观察和描述:
  1. 1.
    用例(Use Case):问题旨在解决什么类型的业务目标?包括透明度(Transparency,如了解流程结构)、性能(Performance,如识别瓶颈)、合规性(Compliance,如检查偏差)和自动化(Automation,如评估自动化水平)。
  2. 2.
    视角(Perspective):问题关注流程的哪个方面?包括控制流(Control-Flow,活动顺序)、时间(Time,时序和耗时)、资源(Resources,执行者)、数据(Data,案例属性)、成本(Costs)或不明确(Unspecific)。
  3. 3.
    主要目标(Primary Goal):问题的表述暗示了什么样的答案类型?包括描述(Describe,定性和定量)、确认(Confirm,验证假设)、解释(Explain,探究原因)、预测(Predict,未来执行或假设分析)和规定(Prescribe,建议行动)。
  4. 4.
    认知步骤(Cognitive Step):回答问题需要哪种高层级的推理操作?包括识别(Identification,指出特定现象)、比较(Comparison,对比不同元素)和总结(Summary,聚合信息)。
  5. 5.
    上下文(Context):问题是特定于某个领域(Domain-specific)还是通用领域无关的(Domain-agnostic)?
  6. 6.
    数据级别(Data Level):问题主要针对事件日志中的哪个层级?包括日志(Log,整体)、迹线(Trace,单个案例)、事件(Event)或不明确(Unspecific)。
为了确保分类学和问题目录的实用性和有效性,研究团队进行了多轮评估。首先,他们邀请14位流程挖掘和概念设计领域的专家对初步分类法进行评估(Evaluation I),专家们总体上肯定了分类法的价值,同时也提出了关于维度正交性和完整性的改进意见,这些反馈被用于后续迭代 refine。接着,研究人员通过三个示例问题(如“差旅报销流程中的瓶颈在哪里?”)展示了分类法的实际应用(Illustrative Application),证明了其清晰描述和澄清问题内涵的能力。
随后,两项更贴近最终用户环境的评估相继展开。在评估II(Evaluation II)中,研究团队与德国和西班牙的两家流程挖掘成熟度较低的组织合作,举办了互动式研讨会。参与者使用基于分类学和问题目录开发的交互式工具——流程挖掘问题锻造工场(Process Mining Question Forge, PMQF)——来为其特定流程设计分析问题。结果表明,这些资源能有效激发新问题想法,并促进团队内部关于分析目标的讨论,尤其适用于流程尚不成熟或问题不明确的场景。参与者普遍认为该方法有用且易于使用,但也指出在将通用问题适配到特定领域时需要更多指导。
在评估III(Evaluation III)中,研究人员设计了一项在线对照实验,对象是31名学过流程挖掘课程但缺乏实践经验的学生。学生被随机分为两组,测试组使用PMQF,控制组则不使用。结果显示,测试组学生设计的问题在相关性(平均分2.98 vs 2.73)和特异性(平均分2.79 vs 2.44)上均略高于控制组,且问题在主要目标、上下文等维度上展现出更大的多样性。这表明分类学和问题目录能够引导新手分析师思考更全面、更具针对性的问题。
本研究为开展此项研究,主要运用了几个关键的技术方法:遵循Nickerson等人的分类学设计方法论进行系统化的分类体系构建;通过文献回顾、从业者问卷调查和行业工具分析等多种渠道大规模收集真实的流程挖掘分析问题;采用设计科学研究范式的迭代开发与评估循环,包括专家访谈、示例场景应用、与两家组织的案例研究以及针对学生群体的对照调查,以验证分类学和问题目录的有效性与实用性。
研究结果
1. 流程挖掘分析问题分类学的确立
研究最终提出了一个包含六个维度的分类学,为流程挖掘分析问题提供了系统化的描述框架。每个维度都包含明确的类别和子类别,并配有定义和示例。例如,“主要目标”维度下的“规定(Prescribe)”类别,包含了诸如“我们如何改进流程?”(How can we improve the process?)等问题,这些问题旨在寻求具体的行动建议。
2. 涵盖405个问题的综合性问题目录
通过系统收集和筛选,研究建立了一个包含405个流程挖掘分析问题的目录。每个问题都按照上述分类学进行了标注,并注明了来源(如BPIC、用户调查、Celonis)。该目录揭示了当前流程挖掘实践中的问题分布趋势,例如,性能(Performance)和透明度(Transparency)相关的问题占主导地位,而预测(Prediction)和自动化(Automation)相关的问题相对较少。
3. 分类学与问题目录的有效性验证
多层次的评估结果表明,该分类学能够有效地用于对分析问题进行分类和描述。更重要的是,结合问题目录,它能够支持用户(特别是新手和低成熟度组织)设计新的、有意义的分析问题。评估II和评估III证明,使用这些资源能够帮助用户产生更相关、更具体且更多样化的问题。
4. 问题设计方法的初步探索
基于分类学和问题目录,研究还提出并初步验证了一个问题设计方法:用户通过选择相关的分类学类别来过滤问题目录,浏览筛选出的问题作为灵感来源,并对其进行调整和重构以适合自身情境。这为流程挖掘项目的初始规划阶段提供了实用的操作指南。
结论与讨论
本研究成功地开发并验证了一套用于流程挖掘分析问题的分类学和一个综合性问题目录。这两项贡献为研究和实践提供了重要的资源。分类学作为一个描述性理论框架,帮助用户系统化地理解、比较和澄清分析问题。问题目录则作为一个宝贵的实践资源库,不仅展示了问题的多样性,还通过揭示当前实践的关注点(如性能问题主导)和潜在盲区(如预测性问题较少),为未来研究指明了方向。
其重要意义在于,该研究直接回应了流程挖掘实践中长期存在的挑战——如何定义好的分析问题。通过提供一个结构化的框架和丰富的实例,它降低了项目初期的门槛,有助于确保分析问题与业务目标保持一致,并充分利用流程挖掘技术的潜力。对于学术界,这套分类学为比较不同研究、识别研究空白提供了共同基础。对于实践界,尤其是那些流程挖掘成熟度较低的组织或新手分析师,这些成果可以作为项目启动时的“灵感源泉”和“设计指南”,减少项目失败的风险,提升分析结果的价值。
此外,研究也指出了未来的工作方向。例如,问题目录可以进一步扩展,特别是增加特定领域的问题,并探索利用生成式人工智能(GenAI)等技术辅助问题的跨领域适配和细化。同时,如何定义“好”的问题标准,以及如何将设计好的问题更顺畅地连接到具体的数据需求和分析技术,也是值得深入探索的课题。
总之,这项研究为流程挖掘领域注入了新的方法论活力,通过赋能分析师提出更精准、更深刻的问题,必将推动流程挖掘在实践中发挥更大的价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号