摘要

通过将相同事务压缩成一行,对原始事务矩阵进行约简,利用事务矩阵与候选项集-项集矩阵相乘得到候选项集-事务矩阵,从而得到候选项集的支持度数;在连接步时采用事先剪枝的策略,减少参与连接的频繁项集;设计实现改进的基于布尔映射矩阵的Apriori算法,并将其应用于医院诊疗数据的挖掘分析。实验结果表明,算法挖掘获得妊娠期糖尿病的危险因素有:年龄≥35岁、身体质量指数(BMI)≥30、孕次≥3、引产次数≥3以及产次≥3。