IP属地:浙江
分析目的: 通过分析训练数据集分析出什么类型的人更可能生存,并预测出数据集中乘客的生还概率 1.获取数据 2.数据探索 PassengerIdS...
业务背景: 随着我国市场经济的发展,企业之间的竞争加剧,市场环境变化多端,粗放型营销不再满足企业的发展需求。企业需要精准营销,能够更高效的获取目...
分析目的: 我们使用Boston房价数据集,利用线性回归模型建立房价与各变量之间的关系 1.获取数据集 CRIMZNINDUSCHASNOXRM...
介绍 利用主成分分析原理,将原来的变量重新组合成一组互相无关的几个综合变量,而这些变量尽可能的保留原有的信息,从而达到降维的目的,低维的数据让人...
聚类是非监督学习的一种算法,我们使用k-means聚类算法,实现客户细分,以及营销战略如何在实际业务中应用。 1.导入数据 2.数据探索 Cus...
分析目的: 根据时间序列反映出来发展过程和趋势,建立ARIMA模型,预测下一段时间可能达到的水平。 字段说明 date:时间co2: 二氧化碳 ...
TPC-DS是与真实场景非常接近的一个测试集,它包含7张事实表,17张纬度表,平均每张表含有18列。用这个数据集能够很好的模拟企业数据查询、报表...
0 分析逾期情况 1 数据清洗 1.1 查看所有字段 1.2 查看年龄分布 总结:1.客户年龄分布呈正偏态分布,客户群体偏年轻化,其中20-35...