摘要

本发明公开了一种基于上下文感知图神经网络的视觉对话生成方法,包括以下步骤:1、视觉对话中文本输入的预处理和单词表的构建;2、对话图像的特征提取以及对话文本的特征提取;3、获取历史对话上下文特征向量;4、构建上下文感知图;5、迭代更新上下文感知图;6、基于当前问题对上下文感知图节点进行注意力处理;7、多模态语义融合及解码生成答案特征序列;8、基于上下文感知图神经网络的视觉对话生成网络模型的参数优化;9、预测答案生成。本发明在视觉对话上构建了上下文感知的图神经网络,能利用更细粒度的文本语义信息来推理图像中不同对象之间的隐含关系,从而提高智能体对问题所预测生成的答案的合理性和准确性。