摘要

为解决西装定制企业中用户定制款式信息未充分利用这一问题,结合关联规则FP-growth算法对多维大型数据集进行挖掘时,存在内存资源消耗较大以及执行效率不高的问题,本文提出一种改进FP-growth融合K-means算法的西装定制搭配挖掘方法,对FP-growth算法从使用哈希表建立项头表、有序FP-tree代替传统FP-tree建树过程和新增不平衡比评价指标3个角度对其进行改进.实验结果表明,与其他关联规则算法对比,改进FP-growth算法的内存资源使用减少了约6.7%、执行效率提高了15%左右;通过人工审核实验结果得出,该算法将挖掘出用户感兴趣且有意义的关联规则,验证该算法提出的可行性.

全文