摘要

大数据在当代社会越来越流行,在计算机领域已经成为一门重要学科。然而,互联网上产生的海量数据正以图像和文本的形式存在,变得越来越非结构化和非数字化。因此,越来越需要开发更高效的算法来处理大数据中的混合数据,以实现有效的决策。具体运用到K-means算法,在大数据平台用到该算法的2个属性,分别是数值属性和分类属性,基于这2个属于,提出一种新的数据处理模型,那就是混合数据的算法,将该算法与具体的实例相结合。这为我们利用大数据进行更有针对性的决策和研究提供坚实的基础。因此,决策者将能够处理混合数据、数值数据和分类数据,解释和预测大数据生态系统中的现象。在算法的实现方面,主要运用到端到端的案例,然后是该案例的实现。这表明它的能力和优势,使它能够通过将组织的业务需求定位于基于增强结果的特定集群/概要文件来改进决策。