1 定义
从已有数据(经验E)中,提出数学模型(假设h),完成任务T,并达到性能度量值P。
2 分类
3 回归代码演示--波士顿房价数据
#采用sklearn自带的数据库
from sklearn import datasets
boston = datasets.load_boston()
X = boston.data
y = boston.target
feature_cols = boston.feature_names
df = pd.DataFrame(X, columns=feature_cols)
df['Price'] = y
df.head()
sns.scatterplot(df['NOX'], df['Price'], color='r', alpha=0.4) #alpha设置点的透明度,适当的透明度可以更方便的看到数据分布
plt.title("NOX~Price")
plt.show()
4 分类代码演示--鸢尾花分类数据
from sklearn import datasets
iris = datasets.load_iris()
X = iris.data
y = iris.target
feature_cols = iris.feature_names
df = pd.DataFrame(X, columns=feature_cols)
df['Species'] = y
df.head()
marker = ['s','x','o']
for index,c in enumerate(np.unique(y)):
plt.scatter(x=df.loc[y==c,"sepal length (cm)"],y=df.loc[y==c,"sepal width (cm)"],alpha=0.8,label=c,marker=marker[c])
plt.xlabel("sepal length (cm)")
plt.ylabel("sepal width (cm)")
plt.legend()
plt.show()
5 无监督学习--随机数据生成
from sklearn import datasets
x, y = datasets.make_moons(n_samples=2000, shuffle=True, noise=0.05, random_state=None)
for index,c in enumerate(np.unique(y)):
plt.scatter(x[y==c,0],x[y==c,1],s=7)
plt.show()
x, y = datasets.make_circles(n_samples=2000, noise=0.1, factor=0.2)
for index,c in enumerate(np.unique(y)):
plt.scatter(x[y==c,0],x[y==c,1])
plt.show()