2.1 TensorFlow2实战一：单变量线性方程

一、目标

训练一个单变量线性方程：

y = w * x + b

来拟合一系列根据随机分布人工生成的点集

二、人工生成目标训练集

1. 方案

在如下线性方程

y = 2.0 *x +1.0

的基础上添加振幅为0.4的噪声来生成训练集（也暗示了我们的训练结果应该接近w=2.0, b=1.0）

2. 代码实现

载入库并显示TensorFlow版本

import matplotlib.pyplot as plt #载入matplotlib
import numpy as np #载入numpy
import tensorflow as tf #载入TensorFlow

print(tf.__version__)

设置随机种子

np.random.seed(5) #设置随机种子

设置随机种子的目的是为了让任何人每次生成的随机数总是固定的，以便于对照结果（本质上不是必须的，只是练习的一种手段）
在-1至1之间生成100个等间距的值作为特征集

x_data = np.linspace(-1, 1, 100)

注：np.linspace生成的是双闭区间，即第一项是-1，最后一项是1
然后按 y = 2.0 *x +1.0 并添加噪声来生成对应的标签集

y_data = 2.0 * x_data + 1.0 +np.random.randn(*x_data.shape) * 0.4

np.random.randn(x,y,z...)，其中x,y,z...是整数，这样就可以生成shape为(x,y,z...)numpy张量，其中每一个元素都按标准（normal）正态分布随机取得。x_data.shape等于元组(100,)，前面加“*”是对list或tuple拆包，可以理解为把list或tuple的元素一个个按顺序取出来。也就是说上面这一行的效果等于np.random.randn(100)

3. 用matplotlib可视化

可以用matplotlib可视化上述定义的散点图

plt.scatter(x_data, y_data)

也可以用下面的代码画出我们目标的线性函数，并设颜色为红色定、线宽为3

plt.plot(x_data, 2.0 * x_data  + 1.0, color = 'red', linewidth = 3)

输出

三、构建回归模型

用变量创建训练目标——斜率w和截距b

w = tf.Variable(1.0, name = 'w0')
b = tf.Variable(0.0, name = 'b0')

w和b训练开始的初值分别设为1.0和0.0（随意给的，但并不是所有模型随便给都好，可能影响训练效果），tf.Variable默认trainable为True，意味着w和b可以在训练过程中被改变——我们的目标就是通过训练，自动得到w和b的值。
接着定义模型函数和预测值节点

def model(x, w, b):
  return tf.multiply(x, w) + b

四、训练模型

模型的训练是一个反复迭代的过程，通过当前参数的模型以及标签值来计算损失，根据损失来调整参数然后更新模型原来的参数。

1. 设置超参数

超参数影响模型的训练效果，是训练前设置的，不随训练变化——与被训练参数（本例是w和b）相对。本例中两个主要的超参数是迭代轮数（epochs）和学习率（learning rate）
迭代可以由条件终止。或手动设定轮数，本例我们使用后者，设定轮数为100。学习率影响损失的收敛，是个经验值：太小则收敛慢，太大会发生反复震荡，本例学习率设为0.05

train_epochs=100
learning_rate=0.05

2. 定义损失函数

损失函数（loss function）用于描述预测值与真实值（标签）之间的误差。损失函数减小的方向就是模型收敛的方向。均方差（Mean Square Error, MSE）是最常见的损失函数之一，也称作 $L_2$ 函数

$L_2=\frac{1}{N}\sum^{}_{(x,y)\in D}{(y-prediction(x))^2}$

用代码实现均方差损失函数

def loss(x, y, w, b):
    err = model(x, w, b)-y
    squared_err = tf.square(err)
    return tf.reduce_mean(squared_err)

其中，函数 tf.reduce_mean 可以直接计算数组里所有元素的平均值（输出一个数）。

3. 定义计算梯度

计算样本数据[x, y]在当前参数[w, b]点上的梯度

$\nabla{L_w} = \frac{\partial}{\partial{w}}L(x, y, w, b)$
$\nabla{L_b} = \frac{\partial}{\partial{b}}L(x, y, w, b)$

其中， $L(x, y, w, b)$ 即损失函数， $\nabla{L_w}$ 和 $\nabla{L_b}$ 即损失函数对两个被训练参数 $w$ 和 $b$ 的梯度。
TensorFlow的上下文管理器tf.GradientTape()可以自动计算函数在某点出的梯度——第一个参数是模型函数loss，第二个参数是待优化变量组成的数组[w, b]，输出即为两个梯度值

def grad(x, y, w, b):
    with tf.GradientTape() as tape:
        loss_=loss(x,y,w,b)
        grdt=tape.gradient(loss_, [w,b])
    return grdt

4. 执行训练

更新被训练参数 $w$ 和 $b$ 的算法如下

$w_{new} = w - \alpha\cdot\nabla{L_w}$
$b_{new} = b - \alpha\cdot\nabla{L_b}$

其中， $\alpha$ 即学习率。训练100轮的代码实现如下

plt.figure() #new blank figure
plt.scatter(x_data, y_data)
loss_list=[] 
for epoch in range(train_epochs):
    batch=np.random.randint(0, 100, 10) #随机生成0~99间的十个整数组成的数组
    xs = x_data[batch]
    ys = y_data[batch]
    
    #record loss (not necessary)
    loss_=loss(x_data,y_data,w,b)
    loss_list.append(loss_.numpy())
    
    delta_w, delta_b = grad(xs, ys, w, b)
    change_w = delta_w * learning_rate
    change_b = delta_b * learning_rate
    w.assign_sub(change_w) # w -= change_w
    b.assign_sub(change_b) # b -= change_b
    
    plt.plot(x_data, w.numpy() * x_data + b.numpy()) #draw a line each epoch

注意这里使用了小批量梯度下降法（Mini-batch SGD）来训练，即每轮都从训练集随机抽取一定数量的样本参与计算（本例每轮抽10个）。这种方法既可以减少单样本SGD中杂乱样本的数量，效率也比全部样本都参与每轮计算要高。
每轮训练结果都在图中画出，最后输出结果为

可看到直线逐渐靠近散点的中轴。

5. 展示和分析结果

清晰起见，用如下代码输出最后的直线以及w和b的值

# show the final result
plt.figure() #new blank figure
plt.scatter(x_data, y_data)
plt.plot(x_data, w.numpy() * x_data + b.numpy())

print('final: w = %f, b = %f' %(w.numpy(), b.numpy()))

输出

final: w = 1.963482, b = 1.062568

接近我们的目标值w=2.0和b=1.0。
上述代码中，我们还设置了loss_list来记录每轮的损失值（对所有标签的），可以用如下代码可视化

plt.figure() #new blank figure
plt.plot(loss_list)

输出

可见损失值随训练逐渐减小直到趋于稳定，说明结果越来越能描述真实情况。
至此单变量线性方程训练示例结束。

附：完整代码

import matplotlib.pyplot as plt #载入matplotlib
import numpy as np #载入numpy
import tensorflow as tf #载入TensorFlow

print('Tensorflow version: ', tf.__version__)

np.random.seed(5) #设置随机种子

x_data = np.linspace(-1, 1, 100)
y_data = 2.0 * x_data + 1.0 +np.random.randn(*x_data.shape) * 0.4

plt.figure()
plt.scatter(x_data, y_data)
plt.plot(x_data, 2.0 * x_data  + 1.0, color = 'red', linewidth = 3)

#构建回归模型
w = tf.Variable(1.0, name = 'w0')
b = tf.Variable(0.0, name = 'b0')

def model(x, w, b):
  return tf.multiply(x, w) + b

#训练模型
train_epochs=100
learning_rate=0.05

def loss(x, y, w, b):
    err = model(x, w, b)-y
    squared_err = tf.square(err)
    return tf.reduce_mean(squared_err)

def grad(x, y, w, b):
    with tf.GradientTape() as tape:
        loss_=loss(x,y,w,b)
        grdt=tape.gradient(loss_,[w,b])
    return grdt

#执行训练
plt.figure() #new blank figure
plt.scatter(x_data, y_data)

loss_list=[]
for epoch in range(train_epochs):
    batch=np.random.randint(0, 100, 10) #随机生成0~99间的十个整数组成的数组
    xs = x_data[batch]
    ys = y_data[batch]
    
    #record loss (not necessary)
    loss_=loss(x_data,y_data,w,b)
    loss_list.append(loss_.numpy())

    delta_w, delta_b = grad(xs, ys, w, b)
    change_w = delta_w * learning_rate
    change_b = delta_b * learning_rate
    w.assign_sub(change_w) # w -= change_w
    b.assign_sub(change_b) # b -= change_b
    
    plt.plot(x_data, w.numpy() * x_data + b.numpy()) #draw a line each epoch
    
# show the final result
plt.figure() #new blank figure
plt.scatter(x_data, y_data)
plt.plot(x_data, w.numpy() * x_data + b.numpy())

print('final: w = %f, b = %f' %(w.numpy(), b.numpy()))

# show the loss trend
plt.figure() #new blank figure
plt.plot(loss_list)

Reference:
https://www.icourse163.org/learn/ZUCC-1206146808#/learn/content?type=detail&id=1230185511&cid=1248327200

最后编辑于：2021.11.28 17:59:58

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,997评论 6赞 502
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,603评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,359评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,309评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,346评论 6赞 390
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,258评论 1赞 300
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,122评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,970评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,403评论 1赞 313
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,596评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,769评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,464评论 5赞 344
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,075评论 3赞 327
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,705评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,848评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,831评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,678评论 2赞 354