摘要

政务信息在网页中的展示方式不同,导致了政务网站不同页面间的复杂度差异大。常用的文本定位方法在面对不同复杂度的页面时,无法对页面复杂对进行判定,对不同复杂度的页面没有差异化操作。本文在DOM结构的基础上进行页面复杂度判定。并基于页面复杂度不同的页面,实现文本定位的差异化操作。

全文