在大数据时代,数据的膨胀趋势日益加剧。面对纷繁复杂的数据,如何将它们进行有效的分析,让其价值得以体现、得以进行合理地利用,是大数据时代最迫切需要思考和解决的核心问题之一。
也正因此,它成为了人工智能研究极可大展拳脚的一个领域。而近期兴起的深度学习方法正是开启这个黑匣子的一把钥匙。
深度学习是机器学习领域一个新兴的研究方向。它通过模仿人脑结构,建立起了一个深层神经网络,通过输入层输入数据,由低到高逐层提取特征,建立起低级特征到高级语义之间复杂的映射关系。以实现对输入的复杂数据的高效处理,使机器像人一样智能地学习不同的知识,并且有效地解决多类复杂的智能问题。
深度学习研究的主要任务,是设计和开发可以智能地根据实际数据进行“学习”的算法,这些算法可以自动地挖掘隐藏在数据中的模式和规律。
根据深层神经网络的构造方式、训练方法等因素,深度学习可分为3大类别:生成深层结构、判别深层结构以及混合深层结构。
一、
生成深层机构是通过学习观测数据高阶相关性,或观测数据和关联类别之间的统计特征分布来实现模式分类的一类深层结构。其代表模型是深度信任网络(DBN)。
深度信任网络(Deep Belief Networks)
图1 DBN的生成过程
图2 RBM的无向图模型(DBN的结构单元)
二、
判别深层结构是通过直接学习不同类别之间的区分表达能力来实现模式分类的一类深层结构。其代表模型是卷积神经网络(CNN)。
卷积神经网络(Convolutional Neural Network,CNN)
图3 CNN模型
三、
混合深层结构是将生成模式和判别模式相结合而成的一类深层结构。在诸多混合深层模型训练中,生成单元首先将模型参数初始化为近似最优解,再使用判别单元全局微调,以达到有效解决高度复杂问题的建模与推广问题。
在此基础上,研究者不断对各种深度学习模型进行改进或优化学习算法,如使用CRBM代替RBM对连续数据建模,将传统CNN与贪心逐层无监督学习算法结合提高有标签数据稀少时特征提取器的训练性能,学习用预训练算法(CD算法)提高RBM的训练效率或全局优化算法解决深层神经网络模型中收敛速度慢、易于过拟合等问题。
随着对深度学习研究的深入,借助深度学习解决多种智能问题逐渐成为机器学习研究的主流,并逐渐占据核心地位,并为各种人工智能产品的研究提供了技术和思路基础。
目前,深度学习已为语音识别(如音乐流派,说话者识别,说话者性别分类,语音分类等)、图像视频识别(如手写体字符识别,人脸识别,图像识别和检索等)、语言处理和信息检索(词性标记,语义角色识别,基于情感分类器的在线评价、舆情分析和自适应学习方法等)等领域取得了多项令人瞩目的研发成果。