摘要

本发明公开了一种面向对比学习的动态课程的句子表示方法,属于自然语言处理领域,其步骤包括:1.对输入的数据通过数据增强的方式构建正样本。2.将经过数据增强后的正样本句子与锚点句子进行相似度计算,作为正样本的难度。3.对增强后的句子的难度进行降序排列。4.计算当前模型的能力来确定训练样本。5.训练中保存并加载最优模型并重新对样本难度进行划分。6.通过对比学习拉近与锚点句子更相似的正样本从而获得更高质量的句子表示。本发明通过利用课程学习的思想来缓解因数据增强导致句子表示质量不一致从而影响对比学习中模型的性能,来对增强后的正样本进行难度排序,从而能生成更高质量的句子表示。