//
java hbase 查询某一时间段的数据?有什么好的方案,前提保证效率 - 开源中国社区
https://www.oschina.net/question/727646_167953
好的方案应该挺多的,比如:可以将【日、周、月】以3,2,1来表示(拼接到ROW_KEY中){离线跑job时候,可以分为月job(每月末run一下,周job(每周末run一下),日job(每天run一下)};然后在服务端对请求过来的日期时间段,做下计算:根据两个日期,计算出START_ROW_KEY以及END_ROW_KEY,比如:2014-09-15~2014-09-23(这个是跨周的,先计算出整周的那个周末日期,该日期类型为2;然后剩余的两个日期22及23号,作为天,类型为3;
最后分别进行查询,然后在程序里Merge下,最终的查询只有3次
我一直用的是上述的方式,说得有些啰嗦,不知道说明白没有
//
HBase条件查询(多条件查询) - 胡同里的庇护所(Pirate Leo's Shelter) - 博客频道 - CSDN.NET
http://blog.csdn.net/pirateleo/article/details/7956965
我们在设计RowKey时可以这样做:采用UserID + CreateTime + FileID组成rowKey,这样既能满足多条件查询,又能有很快的查询速度。
需要注意以下几点:
1、每条记录的RowKey,每个字段都需要填充到相同长度。假如预期我们最多有10万量级的用户,则userID应该统一填充至6位,如000001,000002...
2、结尾添加全局唯一的FileID的用意也是使每个文件对应的记录全局唯一。避免当UserID与CreateTime相同时的两个不同文件记录相互覆盖。
//
360HBase二级索引方案学习总结 - 博客频道 - CSDN.NET http://blog.csdn.net/wwwxxdddx/article/details/50914667
hbase 二次索引_百度搜索 https://www.baidu.com/s?wd=hbase+%E4%BA%8C%E6%AC%A1%E7%B4%A2%E5%BC%95&ie=UTF-8
//
HBase在标签方面的应用 - 菠萝大数据梦工厂(Free World) - 博客频道 - CSDN.NET http://blog.csdn.net/jiangshouzhuang/article/details/51497188
并导入到HBase表的指定列族(每个列族就当做一个标签)中,查询一个客户信息的一个标签数据时,就只会查询指定的列族数据而不是查询其他列族数据,提升查询性能。
//2017-3-20
scan如何操作
GC延迟导致延迟多久
scan过程的原理
rowkey的设计可以避免hbase的问题,
和ZOOKEEPER的关系,存什么东西在ZK里?
会将-ROOT-表的位置放到ZOOKEEPER中。
HBase总结(十六)HBase原理讲解 - 记录分享每一点进步和成长 - 博客频道 - CSDN.NET http://blog.csdn.net/lifuxiangcaohui/article/details/40077753
如何判断数据是在哪里(memstore和HFile)