摘要

<正>随着Web 2.0网站的不断兴起,不同语种的社会化标签日益增多。社会化标签是互联网用户对网络上的Web资源进行协同标注的结果,是广大用户从自身角度对文本信息内容的揭示,融入了互联网用户的集体智慧。同时,不同语种用户对Web资源进行标注,促使互联网上的多语言社会化标签资源不断丰富。然而,社会化标签质量参差不齐,存在标签噪声问题,对标签的挖掘与应用产生干扰。另外,不同语言类别的