Matlab 深度学习工具箱™入门指南(2)

创建简单序列分类网络

本示例说明了如何创建简单的长期短期记忆(LSTM)分类网络。

要训​​练深度神经网络对序列数据进行分类,可以使用LSTM网络。 LSTM网络是一种递归神经网络(RNN),用于学习序列数据的时间步长之间的长期依赖关系。

该示例演示如何:•加载序列数据。
•定义网络体系结构。
•指定训练选项。
•训练网络。
•预测新数据的标签并计算分类准确性。

1)导入数据
如[1]和[2]中所述加载日语元音数据集。 预测变量是一个单元阵列,其中包含长度可变的特征维为12的序列。标签是标签1,2,...,9的分类向量。

[XTrain,YTrain] = japaneseVowelsTrainData; [XValidation,YValidation] = japaneseVowelsTestData;

查看前几个训练序列的大小。 序列是具有12行(每个要素一行)和不同列数(每个时间步长一列)的矩阵。

XTrain(1:5)
  1. 定义网络架构
    定义LSTM网络体系结构。 指定输入层中要素的数量,以及完全连接层中的类的数量。
numFeatures = 12; 
numHiddenUnits = 100; numClasses = 9; 
layers = [ ...
    sequenceInputLayer(numFeatures)                             lstmLayer(numHiddenUnits,'OutputMode','last') fullyConnectedLayer(numClasses) softmaxLayer classificationLayer];

3)训练网络
指定训练选项并训练网络。
由于小批量生产的序列短,因此CPU更适合训练。 将“ ExecutionEnvironment”设置为“ cpu”。 要在GPU上进行训练(如果有),请将'ExecutionEnvironment'设置为'auto'(默认值)。

miniBatchSize = 27; 
options = trainingOptions('adam', ...
    'ExecutionEnvironment','cpu', ...
    'MaxEpochs',100, ...
    'MiniBatchSize',miniBatchSize, ...
    'ValidationData',{XValidation,YValidation}, ...
    'GradientThreshold',2, ...
    'Shuffle','every-epoch', ...
    'Verbose',false, ...
    'Plots','training-progress'); 
net = trainNetwork(XTrain,YTrain,layers,options);
image.png

有关指定训练选项的更多信息,请参见“设置参数和训练卷积神经网络”。

  1. 测试网络
    对测试数据进行分类并计算分类精度。 指定用于训练的相同小批量大小。
YPred = classify(net,XValidation,'MiniBatchSize',miniBatchSize); 
acc = mean(YPred == YValidation)

acc=0.9351
对于下一步,您可以尝试使用双向LSTM(BiLSTM)层或创建更深的网络来提高准确性。 有关更多信息,请参见“长短期存储网络”。

有关显示如何使用卷积网络对序列数据进行分类的示例,请参见“使用深度学习的语音命令识别”。

References

1 M. Kudo, J. Toyama, and M. Shimbo. "Multidimensional Curve Classification Using Passing-Through Regions." Pattern Recognition Letters. Vol. 20, No. 11–13, pages 1103–1111.

2 UCI Machine Learning Repository: Japanese Vowels Dataset. https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels

See Also
lstmLayer | trainNetwork | trainingOptions
More About
• “Long Short-Term Memory Networks”
• “Try Deep Learning in 10 Lines of MATLAB Code” on page 1-12
• “Classify Image Using Pretrained Network” on page 1-15
• “Get Started with Transfer Learning” on page 1-18
• “Transfer Learning with Deep Network Designer”
• “Create Simple Image Classification Network” on page 1-22

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容