scikit-learn的基本用法(二)——数据集的使用

文章作者:Tyan
博客:noahsnail.com  |  CSDN  |  简书

本文主要是演示scikit-learn自带的数据集的一些用法。本文介绍两种sklearn构建数据集的方式,一种是直接加载已有的数据集,另一种是通过工具构建一个数据集。

  • Demo
import matplotlib.pyplot as plt

from sklearn import datasets
from sklearn.linear_model import LinearRegression

# 直接加载数据集
loaded_data = datasets.load_boston()
data_X = loaded_data.data
data_y = loaded_data.target

# 定义模型
model = LinearRegression()
# 学习参数
model.fit(data_X, data_y)
# 计算预测值
result = model.predict(data_X)


# 创造一些线性回归的数据点
X, y = datasets.make_regression(n_samples = 100, n_features = 1, n_targets = 1, noise = 5)
# 绘制创造的数据集的散点图
plt.scatter(X, y)
plt.show()
  • 结果
[ 30.00821269  25.0298606   30.5702317   28.60814055]
[ 24.   21.6  34.7  33.4]
image

参考资料

  1. https://www.youtube.com/user/MorvanZhou
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容