摘要

针对目前HOG提取汉字特征时存在维度过大、特征边缘化的问题,结合汉字网格技术提出一种基于网格的分层HOG特征提取算法。以特征块无重叠的方式提取一层HOG特征,提取底层均匀块的梯度特征,融合两层特征。该算法可有效提取汉字轮廓特征,降低特征维度。在此基础上,提出较为完善的中小学硬笔汉字分类评价框架流程,结合线性PCA降维,采用SVM分类器,实现硬笔汉字的三级分类。通过多个汉字结构的分类实验,验证了该算法的准确性和有效性。

全文