高风险行业对国家基础设施和资源供应至关重要,但其复杂的运营结构、高强度的环境以及紧密耦合的社会技术互动使它们特别容易发生灾难性故障[1,2]。尽管监管不断加强,例如中国的《安全生产法》和第十四个五年安全生产规划,但这些行业的治理实践仍面临三个持续存在的挑战:依赖被动的事故后响应、解读非结构化治理相关信息的有限能力,以及缺乏评估治理可靠性的可比指标。这些挑战强调了应将安全治理理解为复杂社会技术系统(STS)的动态属性[3,4],因为整个系统的可靠性不仅取决于技术组件和运营流程,还取决于治理子系统的连贯性、成熟度和耦合结构。
企业社会责任(CSR)报告已成为企业披露安全文化、职业健康实践和治理结构的重要渠道[5,6]。在高风险行业中,这些披露既传达了合规信息,也反映了管理层对系统安全的关注[7],[8],[9]。从系统安全的角度来看,CSR披露可以被视为治理子系统的受限语义表达,其多期语义结构捕捉了与可靠性相关的属性,如关注稳定性、协调模式和制度成熟度[10,11],而不仅仅是物理系统的运行状态。这些披露受到监管、声誉和制度约束的影响,而非自由形式的叙述。因此,它们的纵向语义结构可以作为诊断信号,有助于减少单期披露偏差和表面的“漂绿”现象。
自然语言处理(NLP)和机器学习的最新进展使得大规模非结构化治理相关文本的系统分析成为可能。主题建模方法(如潜在狄利克雷分配(LDA)以及结合TF-IDF权重和Word2Vec嵌入的混合方法,提高了语义可解释性,并已广泛应用于航空安全、能源政策和技术创新研究[7],[12],[13],[14],[15]。同时,基于生命周期的模型(包括STDE分类法)也被用来描述主题随时间的变化[16,17]。
然而,安全与可靠性研究仍然主要集中在事故上,通过STAP、FRAM、HRA、贝叶斯网络、安全I/II和韧性工程等方法研究技术组件、人为错误和故障链[4],[18],[19],[20]。尽管治理和文化子系统对长期系统可靠性至关重要,但它们很少通过结构化的定量诊断方法进行研究,通常只是定性或描述性地处理。现有的CSR和基于文本的研究通常强调披露强度、情感倾向或静态主题分类[6,21],但很少从结构成熟度、子系统耦合性和风险传播路径的角度探讨治理可靠性。因此,在系统安全研究中,治理动态性仍然难以观察,尤其是在披露叙述是最能反映组织治理实践的行业中[3]。
为了解决这些不足,本研究提出了一个针对社会技术系统中治理子系统的系统级语义诊断框架。CSR披露被视为治理层面的主要和补充性诊断语义信号,而不是直接衡量运营绩效的指标。基于2010年至2023年间372家上市公司的2786份CSR报告,该框架结合了TF-IDF权重、Word2Vec嵌入和LDA主题建模来提取潜在的治理模块。使用STDE分类法进行生命周期分段,以捕捉治理主题的演变,同时利用基于PCA的语义映射和共现网络来诊断话语层面的治理成熟度、结构协调性和治理相关风险扩散的潜在路径,这些在跨行业的语义耦合模式中得到体现。本研究采用以系统为导向的诊断视角,而不是制定具体的可检验假设。
本研究提出了四个研究问题:
RQ1
如何将高风险行业中的安全治理概念化为一个社会技术系统,并将其分解为潜在的治理模块?
RQ2
如何将非结构化的CSR语义转化为可解释的治理子系统可靠性指标?
RQ3
治理模块在不同阶段如何表现出稳定性、转型、解散和出现的生命周期特征?
RQ4
不同行业之间的治理成熟度和语义耦合差异如何支持差异化的监管策略?
本研究的贡献有三方面。首先,它引入了一个以CSR为导向的语义治理诊断框架,量化了治理子系统的成熟度、耦合重要性和风险传播结构,从而与传统的基于事故和物理的可靠性工程方法并列[4,7]。其次,它通过将语义感知、结构分析、生命周期评估和跨行业比较组织到一个连贯的治理层面分析框架中,实现了社会技术系统理论的应用,使得能够系统地研究治理子系统的动态和协调模式[3]。第三,它为监管和组织背景提供了实践导向的分析见解,包括治理监测视角、治理层面的诊断警报信号以及特定行业的诊断参考,支持基于话语的信息驱动和主动的治理评估,与现有的基于事故的方法相结合[9]。