Keras学习(3)——第一个多分类

在实际应用中,遇到最多的还是多分类。如果你已经根据教程(2)实现了二分类,那么本篇几乎不需要花费多少额外的功夫。

1. 概念约定

为方便后续讲解,约定如下:

  • x, y:分别代表整个数据集的特征、类别
  • x_train, y_train:分别代表训练集的特征、类别
  • x_test, y_test:分别代表测试集的特征、类别

2. 分步搭建

  • 数据载入

本例同样采用Scikit-Learn自带的数据集Iris,一个4维输入特征、3-class实数数据集,只不过无需再处理成二分类。数据载入后,除了可以通过.data获取x,通过.target获取y外,还可以通过.feature_names获取特征名,通过.target_names获取类别名(用于翻译模型预测的类别值)。

from sklearn.datasets import load_iris
data_set = load_iris()
print(data_set.feature_names)
print(data_set.target_names)
x = data_set.data
y = data_set.target
  • 数据预处理

数据预处理的操作很多,本篇暂不进行x的预处理,仅处理y。Scikit-Learn已经帮我们把类别编码成了数字,不过是一维数组(None, )(样本的个数不固定,用None表示),而Keras多分类接受的类别输入是一个二维数组,是y的one-hot编码形式。one-hot编码,简单来讲,就是将原来由0开始的类别值转换成向量,比如3个类别0,1,2,那么类别向量长度为3,以原类别值作为位置索引,对应位置置为1,其它位置置为0,即类别0对应:[1, 0, 0],类别1对应[0, 1, 0],类别2对应[0, 0, 1]。全部转换后,y变为二维数组(None,3),可以打印前3行看看。

from keras.utils.np_utils import to_categorical
y = to_categorical(y, 3)
print(y.shape)
print(y[0:3, :])
[[1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]]
  • 定义模型

注意在多分类问题中,输出层的神经元个数定义为类别的个数,激活函数用softmax。

from keras.models import Sequential
model = Sequential()
from keras.layers import Dense
model.add(Dense(units=8, input_dim=4, activation='relu'))
model.add(Dense(units=3, activation='softmax'))
  • 编译模型

多分类问题的损失函数需要用categorical_crossentropy。

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
  • 训练模型
model.fit(x, y, epochs=100, batch_size=10)
  • 评估模型
result = model.evaluate(x, y)
print(result[1])
  • 模型预测

predict输出概率矩阵,每一行对应预测值在三个类别上的概率;predict_classes输出类别值,可以分别打印前三行看一下格式。

proba = model.predict(x)
print(proba[0:3])
classes = model.predict_classes(x)
print(classes[0:3])
[[9.6998018e-01 2.9562058e-02 4.5775421e-04]
 [9.3596870e-01 6.2290531e-02 1.7408483e-03]
 [9.6063405e-01 3.8569074e-02 7.9696754e-04]]
[0 0 0]
  • 类别翻译
target_names = data_set.target_names
classes_names = [target_names[index] for index in classes]
print(classes_names)

3. 完整代码

# /usr/bin/env python
from sklearn.datasets import load_iris
from keras.utils.np_utils import to_categorical
from keras.models import Sequential
from keras.layers import Dense

data_set = load_iris()
print(data_set.feature_names)
print(data_set.target_names)
x = data_set.data
y = data_set.target

y = to_categorical(y, 3)
print(y.shape)
print(y[0:3, :])

model = Sequential()
model.add(Dense(units=8, input_dim=4, activation='relu'))
model.add(Dense(units=3, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

model.fit(x, y, epochs=100, batch_size=10)

result = model.evaluate(x, y)
print(result[1])

proba = model.predict(x)
print(proba[0:3])
classes = model.predict_classes(x)
print(classes[0:3])

target_names = data_set.target_names
classes_names = [target_names[index] for index in classes]
print(classes_names)

4. 代码规整

上述代码主要是为了方便大家理解,所有操作一条线顺下来。在以后的教程中会陆续涉及Keras模型包装、多核并行等内容,到时需要将主程序以及模型定义等代码独立函数出来,下面演示一下比较规范的代码样例。

# /usr/bin/env python
from sklearn.datasets import load_iris
from keras.utils.np_utils import to_categorical
from keras.models import Sequential
from keras.layers import Dense


def load_data():
    data_set = load_iris()
    x_names = data_set.feature_names
    y_names = data_set.target_names
    x = data_set.data
    y = data_set.target
    y = to_categorical(y)
    return x, y, x_names, y_names


def create_model(input_dim, output_dim, units_list, activation = 'relu', optimizer = 'adam'):
    model = Sequential()
    model.add(Dense(units=units_list[0], input_dim=input_dim, activation=activation))
    for units in units_list[1:]:
        model.add(Dense(units=units, activation=activation))
    model.add(Dense(units=output_dim, activation='softmax'))

    model.compile(loss='categorical_crossentropy', optimizer=optimizer, metrics=['accuracy'])

    model.summary()
    
    return model


def main():
    x, y, x_names, y_names = load_data()
    print(x_names)
    print(y_names)

    model = create_model(input_dim=4, output_dim=3, units_list=[12, 6])

    model.fit(x, y, epochs=100, batch_size=10)

    result = model.evaluate(x, y)
    print(result[1])

    proba = model.predict(x)
    print(proba[0:3])
    classes = model.predict_classes(x)
    print(classes[0:3])

    classes_names = [y_names[index] for index in classes]
    print(classes_names)


if __name__ == '__main__':
    main()
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,193评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,306评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,130评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,110评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,118评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,085评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,007评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,844评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,283评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,508评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,395评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,985评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,630评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,797评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,653评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,553评论 2 352

推荐阅读更多精彩内容