Hive调优

宏观调优思路

1.资源充足加内存

2.数据接入慢调优接入工具Sqoop/Datax

3.Hive参数调优

4.sql调优

5.调整模型,提高模型质量和复用度。减少join

6.调度链路优化,实时性要求高的模型先产出,调整调度顺序

具体问题调优

1.数据倾斜问题的确认,排查

2.小文件的影响、初现场景与处理办法

3.表join原则

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容