近年来,免疫信息学已经成为一个热门的研究领域。表位是免疫系统识别的主要化学物质,它的准确预测是免疫信息学研究中最主要的挑战之一。B细胞表位是位于抗原表面的,能够被抗体或B细胞抗原受体特异性识别并引发机体免疫应答的区域,它可以是抗原中的线性片段(也称线性B细胞表位)也可以是空间构象性区域(也称构象性B细胞表位)。B细胞表位预测在免疫应答、分子识别和疫苗研制等领域中都有重要的研究价值。然而生物实验的方法鉴定表位需要较高的成本和代价,而采用计算机预测的方法首先找到候选表位区域,再结合实验手段验证和鉴别,会降低成本、提高效率。所以,研究出精准、有效的构象性B细胞表位预测方法具有极高的应用价值。基于模拟表位的构象性B细胞表位预测方法是近年来表位预测研究的一个热点。模拟表位和真实表位一样可以结合单克隆抗体上的对位,并引起免疫响应,因此它被认为与真实表位具有功能等价性。基于模拟表位的表位预测方法的主要思想是,将模拟表位映射到抗原表面相似的区域,进而找到真实表位。该研究的要点是怎样利用模拟表位的序列信息准确的预测出表位。现存的基于模拟表位的B细胞表位预测方法一般都仅仅应用了抗原三维结构和模拟表位的序列信息来预测表位,但是这种方法在性能提高上似乎是遇到了瓶颈。表位在结构和理化特性上有一些特征信息,而模拟表位能模拟表位的功能,也有一些度量属性特征。本文尝试结合一些表位和模拟表位的特征信息来预测构象性B细胞表位,旨在突破这个性能瓶颈。本文从理化特性角度对表位和模拟表位的度量属性特征进行了较全面的比较和统计,旨在挖掘出表位信息和模拟表位序列信息中包含的深层的、可用于表位预测的特征信息。然后利用比较结果并借鉴Mapitope算法思想,我们筛选出了可用的四个特征信息,再结合随机森林分类方法形成了我们的基于表位和模拟表位特征的构象性B细胞表位预测新方法。通过与其他几个经典算法比较发现,我们的算法的敏感性有了较大的提高(敏感性值达到了0.53);并且所有测试样例都有一定数目的正确的表位被预测出来,这是其他方法所不具备的;而且在敏感性/特异性散点图中,我们的方法也表现良好。这也就充分证明了我们的方法的有效性。本文的研究工作不但对B细胞表位预测方法的理论研究具有重大作用,而且也将促进其向实用方向发展。