iOS - Sqlite 数据库服务层优化过程

场景

有个SDK的数据库读写挺慢的,写入 1000 条数据耗时 18.5 秒,虽然放在了异步线程做,但感觉还慢了点。另外手机的硬件配置比较低,考虑到电池续航,大小等等因素不可能做得很快。硬件改不了,考虑从代码层面优化。

一个问题,假设写入 1000 条数据时,又触发了读数据,要上传到服务器,还得等 18.5 秒,这个过程中,APP进程可能被 kiil 掉,用户手动关闭 APP 后,其进程 5 秒钟后结束。导致数据没写到库里就被 kill 了,数据丢失。

优化过程

用 FMDB,基于 sqlite 的数据库。

1.改配置

用 WAL 模式

PRAGMA journal_mode = WAL
PRAGMA journal_mode = DELETE

WAL 模式:事务写的时候,若提交,则写到 WAL 文件中,若回滚就直接不写文件了,sqlite 按时把 WAL 的内容合并到数据库中。
DELETE 模式:事务写的时候,先备份一份数据到 old 文件,若提交,则删除 old 文件,若回滚,则把 old 内容还原到原来的位置。
显然 WAL 模式对写的性能更快。读的话得读多个文件。
WAL模式测试结果

用多线程模式

PRAGMA SQLITE_THREADSAFE = 0   // 单线程
PRAGMA SQLITE_THREADSAFE = 1   // 多线程串行
PRAGMA SQLITE_THREADSAFE = 2   // 多线程并发

SQLITE_THREADSAFE = 2 后,FMDB不加锁,性能快了,但需自己保证数据库访问的线程安全。

2.去掉业务层 SQL 注入检查

为了防止 SQL 注入,旧代码检查用户字段和数据库字段是否匹配,用了个 O(n^2) 复杂度的方法,看着就觉得慢。
后来改成了哈希查找的方法,快了一点。
后来发现 FMDB 已经做了 SQL 防注入了。
使用 ? 通配符,让 FMDB 去匹配,如果 name 是个 SQL 语句,它将被当做字符串插入数据库中,不会被执行到。

[db executeUpdate:@"insert into student(name) values(?)", @"hehe"];

不要自己去拼接 SQL 语句,除非自己做了防 SQL 注入检查。
如果是自己拼接的,别人传个 name = " 'a') delete from student --' "

char *name = " 'a')  delete from student --' ";
"insert into student(name) values(%s)", name;
变成 
insert into student(name) values('a')  delete from student --')
整理一下
insert into student(name) values('a')  
delete from student 
--')

整个表都被清空了。

3.多条语句合并成一个事务提交

复习一下事务的四大特性,原子性,一致性,隔离性,永久性

开启和结束事务是比较耗时的。在 WAL 模式下,事务要写 WAL 文件,DELETE 模式下,事务要先复制一份 old 旧数据,然后提交或回滚了,还要删掉或者还原就数据。

能合并成事务提交的语句就合并,性能会高一些。因为每条查询语句,数据库默认会开启一个隐式事务。像下面这样

for (int i=0; i<10000; i++) 
{
    [db beginTransaction];    // 数据库会默认开启,你不写就默认开启
    insert into student(name) values('caokun')
    [db commit];              // 数据库会默认开启
}

自己开启事务,即显式事务

[db beginTransaction];    // 自己手动写的
for (int i=0; i<10000; i++) 
{
    insert into student(name) values('caokun')
}
[db commit];              // 自己手动写的

合并成事务

假设调用层会不定时的发来 SQL 查询语句,我把这些语句加入到一个串行队列,串行的执行。
收到一条查询请求,等待 25 ms,如果 25 ms 内没请求来,那么执行它。
如果 25 ms 内又来了另一个请求,那么重新等待 25 ms,直到超了 25 ms,然后合并成一个事务执行。

如果一直来请求,不就永远也执行不了了?
设置最大条数,比如超过 1000 个请求了,就把前 1000 个打包成一个事务执行。
或者超过一定时间,比如 2 秒,就打包事务执行。

或者提供批量查询的接口。业务层有些频繁写库,但是又没办法用批量写库的。比如当用户快速滑动屏幕,显示一个 cell,就插入一条记录,没办法用批量查询的接口。

4.读与读并发

第3步说了用个串行队列去管理所有请求。请求只有 select-读, update-写, delete-写, insert-写,所以要么是读,要么是写。
所以队列里是这样的:读读写写读写读写读读读读...

读跟读之间都是串行的。但读不改变数据完整性,所以读跟读是可以并发的。进一步提高了读的效率。

由于业务需求要保证一致性,即写了,要马上能读出来,不能有延迟,所以没办法把读跟写做成并发的了,必须等写完,才能读,不然很可能读不到刚刚写入的。

所以要做成这样的:写跟写同步,写跟读同步,读跟读并发。

这就变成了多个读者写者的问题

允许多个读者读,多个写者写,但是有写者在写的时候,是不能读的,有读者在读的时候,是不能写的。
读者写者已有解决的办法。

定义 sem_cache 是同步共享区访问的信号量,应用中共享区即是数据库
定义 count 读者的计数,记录有几个读者在读
定义 sem_count 是同步计数器的访问的信号量

// 多个写者线程
void writer() 
{
    while (1) 
    {
        P(sem_cache);    // 尝试进入共享区写
        write_data();    // 写共享区
        V(sem_cache);    // 释放信号
    }
}

// 多个读者线程
void reader() 
{
    while (1)
    {
        P(sem_count);  // 读者尝试修改 count 进入共享区
        if (count == 0) 
        {
            // count == 0 说明是第一个读者进来,那么把共享区锁住,不让其他人访问
            P(sem_cache);
        }
        count++;    // 加上自身
        V(sem_count);  // count 访问完了,释放

        read_data();  // 读共享区

        P(sem_count);  // 读者尝试修改 count 进入共享区       
        count--;  // 自身离开
        if (count == 0) 
        {
            // count == 0 说明是最后一个读者出去,那么把共享区释放,让其他人访问
            V(sem_cache);
        }
        V(sem_count);  // count 访问完了,释放 
    }
}

把数据库看成共享区,然后按照读者写者方法管理线程访问数据库,即实现了读跟读并发,进一步提高速度。

但是业务层有读写顺序的要求,就是一定要按照业务层的调用顺序进行读写,用一个GCD的串行队列,保证读写顺序,遇到读的时候,开个新线程去并发执行,或者把读任务加入到并发队列中,遇到写的时候,就在串行队列中做。

5.小细节

比如,减少频繁创建和销毁对象。
频繁查询的字段缓存在内存中,并注意内存中与数据库中的数据的一致性问题
iOS 没有 Memcache 之类的框架,所以缓存状态得自己维护,还好移动端不是特别多要缓存的数据。

对比:

优化前:itouch 5, iOS 8 的环境,1000条写数据用时 18.7 秒
优化后:itouch 5, iOS 8 的环境,1000条写数据用时 370 ms
笔记本 SSD 环境,iOS虚拟机中,1000条写数据用时 18 ms
笔记本没装 sqlite,在虚拟机中测的,直接装物理机上估计会更快。

参考文献:
【Dev Club 分享第七期】微信iOS SQLite源码优化实践
sqlite 数据库性能调优

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352

推荐阅读更多精彩内容