摘要

文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency)和多头注意力Transformer模型的文本情感分析模型。在文本预处理阶段,利用TF-IDF算法对影响文本情感倾向较大的词语进行初步筛选,舍去常见停用词及其他文本所属邻域对文本情感倾向影响较小的专有名词。之后,利用多头注意力Transformer模型编码器进行特征提取,抓取文本内部重要的语义信息,提高了模型对语义的分析和泛化能力。该模型在多领域,多类型评论语料库数据集上取得了98.17%的准确率。

全文