摘要

随着机器学习和计算机视觉领域的发展,计算机已经具有分析视频内容的能力。听障人士的交流困难主要是难以理解手语动作的含义,而借助计算机分析手语视频将其转化为文字,则可以解决以上交流难题。因此,提出基于机器学习的手语识别系统,先建立手语视频数据集,借助飞桨AI Studio平台使用时间分段网络(Temporal Segments Networks,TSN)算法框架进行相应的模型训练,再对手语视频进行抽帧,分析图像内容并对其进行预测,最后输出预测结果,从而实现对手语视频的文字转译。