摘要

管理层讨论与分析(MD&A)作为公司年报的重要组成部分,在财务欺诈识别中具有不可或缺作用。选取2019—2020年沪深两市A股制造业中具有财务欺诈行为的上市公司作为研究样本,对年报中MD&A所披露的信息进行度量,实现中文文本信息的量化;并在对结构化文本数据和定量数据进行融合的基础上提出基于Stacking集成算法的财务欺诈识别模型。实验结果表明:Stacking集成分类器在准确率、查准率、F1-score以及AUC这4个评价指标得分上均取得了最优值,识别性能显著优于传统单分类器;相较于使用传统定量数据,MD&A中文文本信息的加入使Stacking集成分类器的识别性能得到显著提升。应充分挖掘年报文本信息,并持续优化模型和算法,以提升财务欺诈识别系统的准确性。

全文