在多标签分类中,一个样本可能同时包含多个标签,多个标签之间可存在相互重叠。随着数据集的标签维度增高,以及标签稀疏性问题,会导致分类算法的计算复杂度增加,分类性能下降。因此,对标签空间的编码研究是多标签分类中非常重要的过程。标签空间的编码方法,主要分为标签压缩类方法,标签扩张类方法以及标签特征同时压缩的方法。本文从标签压缩的角度,提出了两种用于多标签编码的模型:(1)最大化标签与特征之间依赖度的标签编码模型(LCCMD):该模型采用Hilbert-Schmidt独立性准则来度量特征空间与标签空间的依赖度,通过最大化依赖度求解出标签空间的最优投影,从而实现对标签空间的线性编码与解码;(2)基于对称网络的标签编码模型(LCCSN):该模型构建一个五层的对称自动编码网络,然后采用极限学习机的思想来训练该网络,求解出对称网络的最优权值,从而实现对标签空间非线性的编码与解码。在算法的实验部分,主要收集了10个多标签分类算法的评价准则,12个多标签数据集,与3个常用的标签压缩类代表算法(如CS, PLST和CPLST),进行实验比较。实验结果表明,本文提出的两种标签编码模型具有较好的编码效果,并且提高了分类器性能,尤其是基于对称网络的标签编码模型,明显优于CS、PLST和CPLST算法。