基于集成学习和文本分析的财务欺诈识别研究

刘会醒; 程建华

doi:10.19473/j.cnki.1008-4940.2023.04.012

摘要

管理层讨论与分析（MD&A）作为公司年报的重要组成部分，在财务欺诈识别中具有不可或缺作用。选取2019—2020年沪深两市A股制造业中具有财务欺诈行为的上市公司作为研究样本，对年报中MD&A所披露的信息进行度量，实现中文文本信息的量化；并在对结构化文本数据和定量数据进行融合的基础上提出基于Stacking集成算法的财务欺诈识别模型。实验结果表明：Stacking集成分类器在准确率、查准率、F1-score以及AUC这4个评价指标得分上均取得了最优值，识别性能显著优于传统单分类器；相较于使用传统定量数据，MD&A中文文本信息的加入使Stacking集成分类器的识别性能得到显著提升。应充分挖掘年报文本信息，并持续优化模型和算法，以提升财务欺诈识别系统的准确性。

出版日期2023
单位安徽大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 05:58

基于集成学习和文本分析的财务欺诈识别研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友