深度学习开发篇(二):使用PaddlePaddle创建属于你的第一个深度学习程序

本篇主要内容:
1、深度学习非专业介绍
2、简单的线性回归

一、准备工作

1、打开PaddlePaddle官方文档方便学习
2、打开你最拿手的IDE
3、准备好PaddlePaddle环境,可以在PaddlePaddle官网上获得最新版安装方案
4、调整好坐姿开始复制代码

二、深度学习来自生活

相信大家都经历过很多考试了,即使没有也没关系,你肯定有一套自己的学习方法。
深度学习跟日常的应试流程也颇为相似,都是需要在考试(测试)前不断的刷题(训练)更正错误(反向传播)、最后通过考试得到自己真正的分数。
下面的一个流程图就是对比了一下应试的刷题部分,可以参考一下。

生活中应试流程与深度学习过程对比

左侧的流程你可能会比较熟悉,而右边的会比较陌生,因为右侧的机器"学习"的过程。

看不懂没有关系的,这不就开始介绍了吗[滑稽]
在下方术语解释部分 看不懂没有关系,直接跳过就行了,实战之后相信你就能理解了

1、小学数学题--数据

在生活中要想应试获取好的成绩,自然需要获取一些信息来辅助应试,以增加自己的经验
在深度学习中这一个环节也是必不可少的,一个好的模型也是需要大量、高质量的数据集支持才可以的。

模型

可以理解为记录神经网络各种结构、参数的文件,每个人的脑子都可以看做一个独特的模型。

数据集

分为训练集、验证集、测试集。其中训练集就相当于练习题,写的越多收获的经验也就越多。验证集相当于模拟考试,用来评估模型收敛情况,也就是平时练习小学数学题的情况。测试集相当于高考,评估模型总体情况,因为在数据集划分上验证集和测试集很相似,而且都不参与反向传播的过程,往往在实际操作中将两者合并操作来提升调试模型的效率。

2、Reader--数据读取器

有了数据之后就得想方设法把它塞入神经网络里面。
在PaddlePaddle框架中,需要把原始数据转换成Numpy的数组对象后方可让数据转换成Tensor(张量)

Tensor

深度学习框架中的一种数据格式,可以提供给机器运算的一种通用数据形式。

3、机器的大脑--神经网络

得到Tensor之后,就可以把它放入机器的大脑中来计算了,在深度学习中有很多网络结构(CNN、RNN...),本节将会搭建一个非常小的神经网络,用一个全连接层(FC)来完成"小学考试任务"(线性回归任务)。

全连接层(FC)

全连接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来 。[摘自百度百科]

4、计算损失

数据经过神经网络的思考之后就一定是正确的吗?就像在做数学题一样,遇到陌生的题,很难确定自己的答案是否正确。
计算损失就是对比自己的答案与正确答案之间的差距,知道自己的得分情况之后也就能明确下一步自己要强化的方向了。
本节将会使用均方差损失函数来计算损失。

均方差

均方差表示的就是样本数据的离散程度。标准差就是样本平均数方差的开平方,标准差通常是相对于样本数据的平均值而定的,通常用M±SD来表示,表示样本某个数据观察值相距平均值有多远。 [摘自百度百科]

5、优化器

优化器并不是可有可无的东西。
在你得知自己练习题的测试成绩(损失)后,是不是要发奋图强了?那么该怎样去提升成绩呢?
优化器就是为了提升成绩而设定的,这里会牵扯到反向传播,你也可以去了解反向传播的具体步骤,但在这篇文章中你只需要了解反向传播是可以让"学习成绩"逐渐变好的一种策略就够了,相当于"查看错题集"->"对错题进行思考、纠正"

反向传播

反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代,直到网络的对输入的响应达到预定的目标范围为止。 [摘自百度百科]

三、实战部分

本次实战就拿一个乘法和加法的简单计算题为题库(数据集),在不告诉机器计算步骤的情况下,让它自己去摸索解题方案,并对它进行期末考核,从而完成线性回归任务。

简略步骤是:定义数据->定义张量、网络等组件->输入数据->开始学习(训练)->期末考核(预测)

注意!输入数据这一个部分是在定义张量、网络等组件之后才进行的!

1、导入PaddlePaddle框架和必要的第三方库

import paddle.fluid as fluid
import numpy as np

2、定义数据集(小学数学题题库)

这里定义形如y = 10x + 3的题目,已知x的值为某个数值,让机器求出y的值。

data_X = [[1], [2], [3], [5], [10]]  # 相当于练习题
data_Y = [[13], [23], [33], [53], [103]]   # 相当于练习题答案

先给他5道题作为练习题吧。

3、定义张量格式

定义张量格式是什么鬼?刚刚没有介绍这个东西啊!
定义张量的格式,只是为了方便让框架知道我们想给机器喂什么样的数据,提前做一下心理准备。
我们只要把数据的格式、类型等信息定义好,框架就会明白该怎样把原始的数据转换成张量了。
但需要注意的是,这里并不是立即转化的,这些只是定义,只有输入数据之后才会转换(上面定义的data是不是还没有与下方的代码建立联系呢?对,他们还没有建立联系,还只是个陌生人)

x = fluid.layers.data(name="x", shape=[1], dtype="float32")
y = fluid.layers.data(name="y", shape=[1], dtype="float32")

name="x"这个参数可能不太好理解,下面贴出一个示例代码,可别把这个示例代码也给copy到py文件里啊!
张某人 = fluid.layers.data(name="老张", shape=[1], dtype="float32")
在Python中,你喊出张某人,那么Python就知道对应的那个对象就是上面定义的那一行代码。
但在框架内部,如果想得到刚刚的那个x对象,有时候可能不太容易,毕竟那么多张某人,万一你手滑了让变量名冲突了可咋办,要是PaddlePaddle叫错人就尴尬了。所以在定义这个张某人变量时就把他独一无二的外号也给定义下来,以后在框架内部直接喊外号就可以避免这个问题了。

shape=[1]则是定义数据的形状,[1]代表是一维数据,且第一维只有一个值,[3,9]代表是二维数据,第一维有3组数据,每组数据中又含有9个数据。一个RGB彩色图片的shape就可以定义为三维数据[通道数(R、G、B),长,宽],例如[3,32,32]是一个RGB三通道宽高均为32像素的图片。这里因为我们每次只会给机器提供一道数学题,所以x的形状自然为[1],又因为一道题只对应一个答案,所以y的形状也是[1]。

至于dtype="float32"这个参数,就是定义张量的数据类型,为了方便训练,这里就全部定义为浮点型。

4、定义神经网络

神经网络也是深度学习中比较重要的一个部分,它的设计决定了机器的思路。
这里我们定义一个全连接层作为机器的"大脑"。

out = fluid.layers.fc(input=x, size=1)

input的意思是输入,那我们就把刚刚定义为x的张量传递给它,等传入"数学题"的时候,数据就会先变成x这个张量,然后通过input这个参数加载到这个全连接层,out是这个全连接层的计算结果。注意,此时还没有传入数据!

size这个参数就是神经元的个数,就像脑细胞一样,越多思考的就越多,精度上去了,速度却下来了。这里因为是小学题,所以一个神经元就够用了。

5、定义计算损失策略

loss = fluid.layers.square_error_cost(input=out, label=y) # 使用均方差损失函数进行计算损失
avg_loss = fluid.layers.mean(loss)  # 对损失求平均(至于为什么要定义这句,下一节会介绍这个问题)

input=outlabel=y,分别是刚刚神经网络思考后的结果和练习题的答案,它们两个做对比之后就可以计算出损失值了。

6、定义优化器

opt = fluid.optimizer.SGD(learning_rate=0.01)  # 使用随机梯度下降策略进行优化,学习率为0.01
opt.minimize(avg_loss)  #拿到损失值后,进行反向传播

7、初始化PaddlePaddle训练环境

place = fluid.CPUPlace()  # 初始化CPU运算环境
start = fluid.default_startup_program()  # 初始化训练框架环境
exe = fluid.Executor(place)  # 初始化执行器
exe.run(start)  # 准备执行框架

这里使用CPU运算,至于为什么用CPU而不是GPU(这就一个简单的线性回归任务,要什么GPU,要什么自行车啊!)

fluid.default_startup_program()这句代码可能会让很多人一脸懵逼,这节不做介绍,知道有这一句就可以了。

8、开始做练习题(训练)

for i in range(100): # 把刚才的5道题的题库,练习100遍!
    for x_, y_ in zip(data_X, data_Y):  #从题库里每次抽出一道题
        x_ = np.array(x_).reshape(1, 1).astype("float32")  # 将抽出的题目转换成numpy对象
        y_ = np.array(y_).reshape(1, 1).astype("float32") # 将抽出的答案转换成numpy对象
        info = exe.run(feed={"x": x_, "y": y_}, fetch_list=[loss]) 
        if i % 10 == 0:
            print(info[0])

这里解释一下为什么要转换成Numpy对象,因为数据种类实在是太多了,为了有一个较统一的方案来读取数据,这里就使用Numpy作为一种通用数据格式(这个解释有些片面,实际与性能之类都有关系)

exe.run(feed={"x": x_, "y": y_}, fetch_list=[loss])中feed就是数据输入的入口,"x"就是刚刚定义的外号"老张"而非张某人,而x_是刚才转换为Numpy对象的那个变量名,也就是带有练习题数据的Numpy对象。

fetch_list里则是填写你想要获得哪些神经网络的输出。这里因为是训练解读,我们并不关心他每道题的结果,只关心做题的情况是好还是不好,所以这里就只获取loss损失值即可。

训练输出

这里我们可以看到,损失已经降到非常低了,但我们还少了一步,就是保存模型。

fluid.io.save_inference_model(dirname="infer.model", feeded_var_names=["x"], target_vars=[out], executor=exe)

保存模型的方法也是非常简单,dirname不多说就是模型要保存的文件夹路径,infer.model就是我随便起的文件夹名了,这里大家可以随意发挥,只要符合命名规范即可。

feeded_var_names里的"x"还是刚刚定义的外号"老张",为什么要有这个参数呢?因为在预测的时候我们依旧需要对数据进行转换(原始数据->Numpy对象->所定义好的张量格式->张量),在预测时我们一般只会有原始数据,原始数据转换为Numpy的格式也是非常简单的。但我们可能不知道在训练模型时,用途为输入数据的那个张量格式是什么,所以这里把刚刚定义为输入的x给保存进去,方便预测时使用。

既然保存神经网络的输入格式了,那也把输出格式也给保存进去呗,target_vars既然没要求"叫外号",那就直接把变量名out给放进去就可以了。

executor不解释了,就是框架执行器

9、开始考试(预测)

我们要新建一个全新的Python文件,因为要想把训练和预测写在一起,还需要特殊的写法,至于该怎么写会在下一节说明。
这里需要你新建一个全新的Python文件
想必你也非常想知道自己训练的模型效果了,那就直接贴上代码吧!

import paddle.fluid as fluid
import numpy as np

# 定义测试数据
test_data = [[100], [567], [20]]

# 初始化预测环境
exe = fluid.Executor(place=fluid.CPUPlace())

# 读取模型
Program, feed_target_names, fetch_targets = fluid.io.load_inference_model(dirname="infer.model",
                                                                          executor=exe)
# 开始预测
for x_ in test_data:
    x_ = np.array(x_).reshape(1, 1).astype("float32")
    out = exe.run(program=Program, feed={feed_target_names[0]: x_}, fetch_list=fetch_targets)
    print(out[0])

这里除了Program, feed_target_names, fetch_targets其它的相信你应该都已经比较熟悉了。
Program是用做预测的程序,当然你也可以翻译为是项目。只需要把它放入exe.run中,执行器就知道这是一个预测项目了。

feed_target_names就是刚刚定义的神经网络输入入口x,因为刚刚保存时候是["x"],是个列表(list)形式,所以这里就使用索引( feed_target_names[0]: x_)来获得刚才的输入入口xfetch_targets`不解释了,就是神经网络的输出,也是你在保存预测模型时候定义的。

完成了这些,那就开始考试吧!


考试结果

可以看到100对应的结果是1003.0194,与题型y = 10x + 3的结果还是非常吻合的,模型效果可以!

至此,你已经完成了你的第一个深度学习程序。
如果你有什么建议也可以在评论区留言,遇到问题还可以在这篇文章的顶部获取官方交流2群的信息。

当然,如果想一次性获取全部代码,可以点击下方GitHub链接,希望看到你的Star哟~
https://github.com/GT-ZhangAcer/DLExample/tree/master/easy01_Hi_AI

文章不定期更新,欢迎关注!
点击进入简书PaddlePaddle入门专题页面,获取完整教程信息
点击进入往期PaddlePaddle文章、极简入门专题页面

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容