版权归作者所有,任何形式转载请联系作者。 作者:花生(来自豆瓣) 来源:https://book.douban.com/review/9070958/ 1月7日参加了陈海涛老...
版权归作者所有,任何形式转载请联系作者。 作者:花生(来自豆瓣) 来源:https://book.douban.com/review/9070958/ 1月7日参加了陈海涛老...
自从2018年初给自己定了个规矩,凡看书,必写书评。 看这本书的初衷,和大多数人一样,为了印证“看大腿”、“混蛋教授”之流的说法是否属实。看完之后,可以很肯定的说,嗯!这些完...
《审判》,这是迄今为止读的最痛苦的一本书。但看完后,我诚心认为这是本好书。 现在看来我究竟是哪里不对了,居然敢读卡夫卡。这个站在欧洲现代文学顶端的人。 现在已经完全忘记,当时...
前言 今天突然想了想这事,后面正好也在群里有了讨论。所以这篇文章大体是做个总结。 夜间漫谈 目前来看,从数据本身进行各种转换和查询,大致分成三个类型: 明细查询 聚合统计 关...
社区发现(Community Detection)算法用来发现网络中的社区结构,也可以看做是一种聚类算法。 分层聚类 两两对比,最相似的两个聚类为一个中间态,中间态再参与两两...
统计学有两大主要分支,分别是描述性统计学和推断统计学。描述性统计学用于描述和概括数据的特征以及绘制各类统计图表。总体数据,往往因为数据量太大而难以被获取,所以就有了通过较小的...
《WestWorld》第一季第二集有一句很有意思的台词:游客William来到西部世界公园,遇到一个美女接待员,但无法区分对方是否是人类,于是产生了如下对话: 对于很多编写机...
当特征选择完成后,可以直接训练模型了,但是可能由于特征矩阵过大,导致计算量大,训练时间长的问题,因此降低特征矩阵维度也是必不可少的。但不要盲目降维,当你在原数据上跑到了一个比...
谢谢余博的指导,Daisy同学的作业也有所启发。 第5课 中心极限定理 & 区间估计 本课基本作业 用t分布求房屋平均面积在95%的置信区间,数据为house_size.cs...
接着上一篇:《机器学习实战-数据探索》介绍,机器学习更多内容可以关注github项目:machine learning《机器学习实战-数据探索》介绍了1、变量识别;2、单变量...
《机器学习实战-数据探索(1、变量识别;2、单变量分析;3、双变量分析)》 机器学习实战-数据探索(缺失值处理) 机器学习实战-数据探索(异常值处理)上面三篇文章介绍了数据探...
前言 这个月做的事情还是蛮多的。上线了一个百台规模的ES集群,还设计开发了一套实时推荐系统。 标题有点长,其实是为了突出该推荐系统的三个亮点,一个是实时,一个是基于用户画像去...