摘要

使用Web数据挖掘技术,在互联网海量的网页数据中,搜集一些包含多语种语言信息的特殊网页,对这些网页中含有的语言信息进行分析,归类,处理,从中提取我们所需要的多语种语料,为一种全新的可视化翻译语言VILA语言建立一个能满足其需要的词汇库。随着互联网数据的快速更新,通过这种方式来获取的语料,更能够提高其时效性和实用性。