
最近在使用sqlite作为sql计算引擎,表数据量大小为4000万行,空间占用1.5G,计算为和一个小表做join并且group by:使用机器自带的3.2.2等了几分钟没有...
对于zk的原理等有了一定了解,希望能够通过项目来练手一下,都是一些简单的项目zk使用场景 数据发布与订阅(配置中心) 练手项目:对于多个机器实现配置文件集中管理,实现机器自动...
1. elasticsearch 服务安全配置 目前主要通过插件的形式来控制:常用的插件主要包括:elasticsearch-http-basic,search-guard,...
个人在工作中逐渐认识到一些素养对程序员这个职业是非常重要的,后续会把这些素养罗列在这里,主要是提醒自己保持良好的状态,因为自己是主要后端数据处理分析部分,可能会和自己工作内容...
个人在工作中逐渐认识到一些素养对程序员这个职业是非常重要的,后续会把这些素养罗列在这里,主要是提醒自己保持良好的状态,因为自己是主要后端数据处理分析部分,可能会和自己工作内容...
新岗位需要用python,之前没写过python,用循环数组实现一个定长队列玩一下: 想说一下:1、python类中使用成员变量写self好麻烦,简直赶上php的$了2、后面...
新岗位需要用python,之前没写过python,用循环数组实现一个定长队列玩一下: 想说一下:1、python类中使用成员变量写self好麻烦,简直赶上php的$了2、后面...
HQL优化 1. HQL优化 一、避免or操作的不当。如果where子句中有多个条件,并且其中某个条件没有索引,使用or将导致全表扫描。假定在HOUSE表中TITLE有索引,...
IO优化 1、缓存、缓冲技术2、数据组织结构优化3、应用合理的RAID策略提升磁盘I/O。 WEB前端调优 减少网络交互的次数(多次请求合并)减少网络传输数据量的大小(压缩)...
预分区 在创建Hbase表的时候默认一张表只有一个region,所有的put操作都会往这一个region中填充数据,当这个一个region过大时就会进行split。如果在创建...
Stream groupings Shuffle grouping: Tuples 随机分配到bolt中,可以保证bolt负载均匀。Fields grouping: 根据特定...
距离定义 曼哈顿距离可以用来衡量一个十字路口开车到另外一个十字路口的距离;就像在曼哈顿开车一样,这也是曼哈顿距离的由来。 马氏距离: 马氏距离可以消除相关系的干扰,同时也消除...
距离定义 曼哈顿距离可以用来衡量一个十字路口开车到另外一个十字路口的距离;就像在曼哈顿开车一样,这也是曼哈顿距离的由来。 马氏距离: 马氏距离可以消除相关系的干扰,同时也消除...
解决问题 在有向图中对节点重要性进行排序,它的思想是模拟一个悠闲的上网者,上网者首先随机选择一个网页打开,然后在这个网页上呆了几分钟后,跳转到该网页所指向的链接,这样无所事事...
解决问题 在有向图中对节点重要性进行排序,它的思想是模拟一个悠闲的上网者,上网者首先随机选择一个网页打开,然后在这个网页上呆了几分钟后,跳转到该网页所指向的链接,这样无所事事...
简介 在学习kafka如何实现高吞吐量的时候遇到一个技术zero copy,追随kafka文档中的链接深入了解了一下zero copy,在这里mark一下,原文链接https...
安装 下载:wget http://mkt.orientdb.com/CE-2217-linux解压:tar zxvf orientdb.tar.gz启动:cd bin &&...
底层数据结构 redis底层数据结构有:字典、双端链表、压缩链表、整数集合、跳跃表和字典、整数集合、embstr 编码的简单动态字符串、long 类型的整数,redis在应用...