- 处理彩色图像时,对所有点减去局部平均色,降低光照的影响
Kaggle做了一个Scripts板块,可以不用搭建本地环境也不用下载数据,就可以写代码Run模型,目前提供三种语言R/RMarkdown/Python。Kaggle Scripts
今日头条的公司叫字节跳动,Bytedance。
XGBoost再三出现在Kaggle的获奖者访谈中。
TF-IDF,一下来自百度百科:TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。
Feature Engineering似乎很重要。
一些想法
Data Science很深,是整个industry的挺细的一个部分。我觉得我的兴趣不在做深,而是什么都玩一点,感受人类发展的前沿或者次前沿,这样当未来降临时我已经准备好了。
在一段时间内不要自己去写算法,多了解和使用已有的包。