自编码器(autoencoder, AE)是一类在
半监督学习和
非监督学习中使用的
人工神经网络(Artificial Neural Networks, ANNs),其功能是通过将输入信息作为学习目标,对输入信息进行
表征学习(representation learning)。
自编码器在其研究早期是为解决
表征学习中的“编码器问题(encoder problem)”,即基于神经网络的
降维问题而提出的
联结主义模型的学习算法。1985年,David H. Ackley、Geoffrey E. Hinton和Terrence J. Sejnowski在
玻尔兹曼机上对自编码器算法进行了首次尝试,并通过模型权重对其表征学习能力进行了讨论。在1986年
反向传播算法(Back-
Propagation, BP)被正式提出后,自编码器算法作为BP的实现之一,即“自监督的
反向传播(Self-supervised BP)”得到了研究,并在1987年被Jeffrey L. Elman和David Zipser用于语音数据的表征学习试验。自编码器作为一类
神经网络结构(包含编码器和解码器两部分)的正式提出,来自1987年Yann LeCun发表的研究。LeCun (1987)使用
多层感知器(Multi-Layer Perceptron,
MLP)构建了包含编码器和解码器的神经网络,并将其用于数据降噪。此外,在同一时期,Bourlard and Kamp (1988)使用MLP自编码器对数据降维进行的研究也得到了关注。1994年,Hinton和Richard S. Zemel通过提出“
最小描述长度原理(Minimum Description Length principle, MDL)”构建了第一个基于自编码器的
生成模型。
自
编码器是一个输入和
学习目标相同的神经网络,其结构分为编码器和
解码器两部分。给定输入空间和
特征空间,自编码器求解两者的映射使输入特征的重建误差达成最小:
求解完成后,由编码器输出的
隐含层特征,即“编码特征(encoded feature)”可视为
输入数据的表征。按自编码器的不同,其编码特征可以是输入数据的压缩(
收缩自编码器)、稀疏化(
稀疏自编码器)或隐变量模型(
变分自编码器)等。