数据挖掘是在海量的数据中寻找模式或规则的过程。数据聚类则是数据挖掘中的一项重要技术,是人们认识和探索事物之间内在联系的有效手段,它既可以作为独立的数据挖掘工具,从知识库中获取数据分布的一些深入信息,也可以作为其它数据挖掘算法的预处理步骤,且广泛应用于商务管理、市场分析、工程设计和科学探索等领域。聚类就是将数据对象划分到不同的类或者簇中,使得属于同簇的数据对象相似性尽量小,而不同簇的数据对象相异性尽量大。蚁群算法和粒子群优化算法是群智能理论研究领域的两种主要算法。蚁群算法源于蚂蚁堆积他们的尸体和分类它们的幼体的研究,粒子群算法源于鸟群群体运动行为的研究。作为新兴的演化计算技术,群智能算法已成为越来越多研究者的关注焦点,并被引进到数据聚类领域里且发挥了巨大的作用。但由于蚁群算法和粒子群算法还不够完善,在数据聚类的处理过程中存在智能算法自身的缺陷,导致聚类效果的差强人意,因而如何设计出行之有效的聚类算法将成为群智能理论在聚类领域发展的一个重要课题。针对基本蚁群聚类算法较长时间开销和易产生冗余聚类数目的缺陷,提出了一种聚类邻域自适应调整的多载蚁群算法。算法通过邻域动态自适应调整寻找纯净的邻域,增强蚂蚁记忆体记忆纯净邻域的大小,蚂蚁之间协同交流进行多载整合相似邻域形成最终聚类结果。实验结果表明新算法能有效提高算法效率且取得较好的聚类效果。针对K-调和均值和混沌粒子群聚类算法的优缺点,本文提出了一种融合K-调和均值的混沌粒子群聚类算法。首先通过K-调和均值方法把粒子群分成若干个子群体,每个粒子根据其个体极值和所在子种群的全局极值来更新位置。其次,算法中引入变尺度混沌变异,抑制了早熟收敛,提高了计算精度。实验证明,该算法可以有效避免算法陷入局部最优,在保证收敛速度的同时增强了算法全局搜索能力,明显改善了聚类效果。