摘要

研究了Deep Web数据源自动分类,分析了其研究的内容和面临的问题,提出了Deep Web数据源分类模型,描述了表单特征的提取、预处理和基于向量空间的相似度计算,最后运用优化的KNN分类器对待分类的Deep Web数据源进行领域分类,实验表明该模型具有良好的分类效果,具有一定的实用价值.