mysql和hbase关联查询统计及java8流处理实战

新项目重构,由于数据量太大,采用了mysql存主表和hbase存记录表的方式

(使用的phoenix操作hbase,通过mybatis多数据源连接mysql和phoenix,具体实现移步https://blog.csdn.net/qq_31349087/article/details/88535387)

现有一个需求,分别按老师,班级,校区的维度查询学员的实操合格率,作业达标率,目前老师,班级,校区信息都在mysql,学员的做题记录在hbase,经过分析,按时间先在mysql查询班级列表,每条记录包含该班的学员和计划做题的题目id,然后根据学员id和题目id去hbase里做统计查询,之后在使用java8的分组查出老师和校区维度的数据

@Service
public class JobStatServiceImpl implements JobStatService {
 
    @Autowired
    private ErrorHistoryMapper errorHistoryMapper;
 
    @Autowired
    private HBaseErrorHistoryMapper hBaseErrorHistoryMapper;
 
    @Autowired
    private CacheRedisService cacheRedisService;
 
    @Override
    public List<JobStatResult> getJobStatList(LocalDateTime beginDate, LocalDateTime endDate) {
        List<JobStatResult> jobStatList = errorHistoryMapper.getJobStatList(beginDate, endDate);
        if (jobStatList != null && !jobStatList.isEmpty()) {
            jobStatList.parallelStream().iterator().forEachRemaining(jobStatResult -> {
                List<Integer> studentIds = strToList(jobStatResult.getStudentIds(), true);
                List<String> sectionCodes = strToList(jobStatResult.getSectionCodes(), false);
                Map<String, Long> jobTrueCount = hBaseErrorHistoryMapper.getJobTrueCount(studentIds, sectionCodes);
                jobStatResult.setPlanNumber(getPlanNumber(jobStatResult.getSectionCodes()));//计划做题数
                jobStatResult.setDoneNumber(jobTrueCount.get("DONENUMBER"));//完成数
                jobStatResult.setTrueNumber(jobTrueCount.get("TRUENUMBER"));//正确数
            });//班级达标率
 
            System.err.println(JSON.toJSONString(jobStatList));
 
 
            Collection<JobStatResult> values = jobStatList.parallelStream().filter(Objects::nonNull)
                .collect(Collectors.groupingBy(JobStatResult::getTeacherId,
                Collectors.reducing(new JobStatResult(), (obj1, obj2) -> {
                    JobStatResult jobStatResult = new JobStatResult();
                    BeanUtils.copyProperties(obj2, jobStatResult);
                    jobStatResult.setPlanNumber(obj1.getPlanNumber() + obj2.getPlanNumber());
                    jobStatResult.setDoneNumber(obj1.getDoneNumber() + obj2.getDoneNumber());
                    jobStatResult.setTrueNumber(obj1.getTrueNumber() + obj2.getTrueNumber());
                    return jobStatResult;
                }))).values(); //老师达标率
 
            System.err.println(JSON.toJSONString(collect));
 
            Collection<JobStatResult> values = jobStatList.parallelStream().collect(Collectors.groupingBy(JobStatResult::getSchoolCode,
                    Collectors.reducing(new JobStatResult(), (obj1, obj2) -> {
                        obj1.setPlanNumber(obj1.getPlanNumber() + obj2.getPlanNumber());
                        obj1.setDoneNumber(obj1.getDoneNumber() + obj2.getDoneNumber());
                        obj1.setTrueNumber(obj1.getTrueNumber() + obj2.getTrueNumber());
                        return obj1;
                    }))).values();//校区达标率
 
            System.err.println(JSON.toJSONString(values));
 
        }
        return jobStatList;
    }
 
    /**
     * 计划做题数
     * @param str
     * @return
     */
    private Long getPlanNumber(String str) {
        AtomicLong planNumber = new AtomicLong(0);
        if (str == null || str.isEmpty()) {
            return planNumber.get();
        }
        String[] split = str.split(",");
        Arrays.asList(split).parallelStream().filter(s -> {
            if (s == null || s.isEmpty())
                return false;
            return true;
        }).forEach(s -> {
            Long chapterPlanNumber = cacheRedisService.getChapterPlanNumber(s);
            planNumber.addAndGet(chapterPlanNumber);
        });
        return planNumber.get();
    }
 
    /**
     * str转list
     * @param str
     * @param f
     * @return
     */
    private List strToList(String str, boolean f) {
        List list = f ? new ArrayList(){{add(0);}} : new ArrayList(){{add("kckm");}}; //随意设个值,防止为空报错
        if (str == null || str.isEmpty()) {
            return list;
        }
        String[] split = str.split(",");
        if (f) {
            List<Integer> collect = Arrays.stream(split).filter(s -> {
                if (s == null || s.isEmpty())
                    return false;
                return true;
            }).mapToInt(Integer::valueOf).boxed().collect(Collectors.toList());
            list.addAll(collect);
        } else {
            List<String> collect = Arrays.stream(split).filter(s -> {
                if (s == null || s.isEmpty())
                    return false;
                return true;
            }).collect(Collectors.toList());
            list.addAll(collect);
        }
        return list;
    }
}

使用Collectors.groupingBy按字段分组,然后使用Collectors.reducing进行合并,这里的java8的mapReduce和hadoop的mapReduce都是一种编程模型,map(映射)reduce(规约),我这里用的是list.parallelStream(),内部会自己创建多线程跑你自定义的任务()好像是用的jdk7的forkjoin框架),所以需要注意线程安全问题,我这里统计计划做题数的时候定义了一个AtomicLong原子类,可以保证多线程环境下累加的数据正确性

建议,hbase不支持事务,mysql+hbase不能保证数据一致性,最好hbase存一些比较久远的数据,新进的数据还是放mysql,这样关系型数据库也方便操作

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容

  • 1 使用概述 2 环境配置 3 SQL特性详解 1)create:可以创建一张表或视图。表名如果没有用双引号括起来...
    4ea0af17fd67阅读 12,442评论 0 10
  • Zookeeper用于集群主备切换。 YARN让集群具备更好的扩展性。 Spark没有存储能力。 Spark的Ma...
    Yobhel阅读 7,265评论 0 34
  • 我在一个离重庆有一千多公里的候机楼里,周围熙来攘往,一如平常。 在这大约十小时前,我知道了你离开的消息,其实一整天...
    春小妮cc阅读 3,662评论 4 12
  • 思想: 为什么要学习第二技能,周末在“卖桃者说”里读了一篇文章“如果你有两个技能都超过80%的人,你收获的可能是9...
    超级小榨菜阅读 189评论 0 0
  • 大约是早上六点,天蒙蒙亮,水口的街头就有了摆摊的生意人,打破了清晨的宁静。今天是大年三十,一年中最后的一天,做生意...
    昕昕念的美好生活阅读 213评论 0 0