摘要

本文从分析现有的方言词汇相似度计算方法入手,指出王沈计量法和加权平均法均存在不足之处。在此基础上,提出一种新的算法——语素加权法。语素加权法将每个词目权重设定为1,并根据词中语素的重要程度为每个语素加权;在语素加权的基础上,将构词法纳入考虑,计算其相似度。运用语素加权法,统计了普通话、广州话及七个四邑方言点的词汇相似度,并在此基础上为四邑方言做了聚类分析。