摘要

从各web站点抽取数据是Deep Web数据集成研究中的重要内容.重点分析数据抽取策略,使用HttpClient工具获取Deep Web页面及其各个分页,并提出了基于样式的定位方法处理被查询页面.最后,为验证提出的数据抽取方案的可行性,实现了一个Deep Web实际应用系统,运行效果表明方案有效可行,较好地解决了数据抽取准确性的问题.