240 发简信
IP属地:江苏
  • 无标题文章

    我的博客即将入驻“云栖社区”,诚邀技术同仁一同入驻。

  • Resize,w 360,h 240
    [kaggle]DC比赛进程5

    本周开始试了下高德的路径规划导航,虽然效果很差,但其中有一些借鉴意义,可以作为备选的特征放到后期的model中。例如,路径的导航距离、预估时间等...

  • [kaggle]DC比赛进程4

    本次提交的个人观点: 对GIS的依赖程度 ,是否要接入postgresql进行GIS方面的计算(之前有一点点研究,并不深入); 关键的特征应该是...

  • [kaggle]DC比赛进程3-参考资料

    本次比赛可借鉴的比赛有: NYC taxi:因为数据开源NYC Open Data,所以网上有大量的研究。 ECML/PKDD 15: Taxi...

  • Resize,w 360,h 240
    [kaggle]DC比赛进程2

    周末公司计算系统崩了。也没想好用什么怎么进行数据处理。 周一和经理汇报工作时,得到了支持。适当可以申请,使用生产环境。 公司测试环境基本够用,1...

  • Resize,w 360,h 240
    [kaggle]DC比赛进程

    数据量不算小,压缩包7个GPaste_Image.png 赛题分析: 明天试着把下载好的数据demo放到亚马逊云的Rstudio里,考虑一下 大...

  • Resize,w 360,h 240
    1.Writing R data frames returned from SparkR:::map

    stack overflow原文地址弱鸡小白在使用SparkR处理大规模的R dataframe时想使用map的方式进行数据操作。数据都是结构化...

  • [hadoop]常用命令

    启动Hadoop进入HADOOP_HOME目录。执行sh bin/start-all.sh 关闭Hadoop进入HADOOP_HOME目录。执行...

  • [R]文件处理

    合并csv 批量修改文件名(ps:修改锁屏壁纸到本地)