![240](https://cdn2.jianshu.io/assets/default_avatar/11-4d7c6ca89f439111aff57b23be1c73ba.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP属地:香港
做one-hot编码有时候过于稀疏pd.factorize(): factorize是因式分解的意思,在这里是把常见的字符型变量分解为数字。 转...
分别对两个表中的特征做labelencoder可能出现不一致问题如train中['item_id', 'store_id', 'dept_id'...
np.concatenate 可以对array操作pd.concat对series操作data.flatten() 降为一维数组
参考:https://mp.weixin.qq.com/s/7nyNhtfUtJGVdwNcMOVQsQ学习总结 figure是画布axes是坐...
plt.style.use('fivethirtyeight') # 流行的数据可视化主题
商业模式一:电子商务 (模式没有好坏之分) 1.用户获取模式(重复购买率不足40%) 此时经营中心应放在新用户的获取上销售水下呼吸器或者攀岩设备...
转换成datetime 查看时间数据的年月日 将datetime转换成字符串 str()即可 但是会带有秒 比如 2016-02-15 转换成s...