随着信息化技术的迅猛发展,人们的行为越来越多地被记录在相关计算机系统中。例如,证券交易系统,信用卡消费系统和医疗保障系统等等。由于人们日复一日(Day-by-Day)的生活节奏,很多计算机系统的数据记录也是日复一日的进行,因此这种每人每天的行为数据我们就称之为Day-by-Day行为数据集。通过挖掘Day-by-Day行为数据集,能够揭示人们的各种行为方式、现象和规律。本文研究Day-by-Day行为数据集上的数据挖掘问题,重点解决数据对象的相似性计算问题,数据集上的特异群组挖掘以及聚类问题。基于动态规划的策略,本文提出一种发现有日期间隔的共同行为模式的方法,并设计了一个分段指数函数来处理相似性度量问题。在解决相似性问题的基础上,本文提出了基于图的方法来挖掘Day-by-Day行为数据集上的特异群组,并设计了一个相应的图的稀疏化算法,用以加速特异群组挖掘过程。通过实验和现有的Day-by-Day相似性算法、特异群组挖掘算法进行比较,验证了提出的G-PGM算法的效果,解决了之前没有处理的有日期间隔的共同行为模式的发现问题,降低了Day-by-Day数据集上特异群组挖掘的时间复杂度,证实了算法的适用性。最后,本文对Day-by-Day行为数据集上的聚类问题进行研究,给出了Day-by-Day行为数据集上簇的定义,并提出了相应的聚类算法和剪枝策略。