1. 我们现在这样存储的日志,可以如何使用,发挥效益?确认我们是否需要优化日志存储,分析和使用的流程,如果需要,最需要的是哪一方面的?
思考: 借用当下流行的数据分析功能,达到从数据体现出有用价值的目的:比如,帮助运营,媒介直观反映运营状态。
或者,对我们自己而言,每天的日志意味着什么?
日志中包含渠道,活动的计数统计。类似于再用的报表。
此外,包含请求的原始信息,点击的规律,转化的规律。--感觉这一部分我们都还没有再做。
2. spark,storm(turple和DStream) 流式计算,达到实时计算的效果。补充了hdoop离线计算,高延时的不足.spark的drpc,数据源的广泛支持,多语言支持
3. hdoop和hbase的区别:
4. 基于mongo做mapReduce,做数据分析?分析s1
效果类广告可以在mongo上做聚合分析就够了。