摘要

随着科技的进步,互联网已深入群众,我国少数民族如蒙古族等也借助互联网弘扬本民族文化,致力于实现民族语言文字信息数字化处理。蒙古文网站数量快速增多,能够快速、全面、准确的获取蒙古文网站信息,对蒙古文信息处理发挥重要作用。为实现快速、全面、准确的获取蒙古文网站信息,利用元搜索引擎获取包含蒙古文高频语素的网页URL,根据网页文字编码范围判断其是否属于蒙古文网站,再利用各网站之间的链接获取更多的蒙古文网站。