SimpleDB

SImpleDB 包含:

Classes that represent fields, tuples, and tuple schemas;
A catalog that stores information about available tables and their schemas.
One or more access methods (e.g., heap files) that store relations on disk and provide a way to iterate through tuples of those relations;
A buffer pool that caches active tuples and pages in memory and handles concurrency control and transactions
Classes that apply predicates and conditions to tuples;
A collection of operator classes (e.g., select, join, insert, delete, etc.) that process tuples;

不包括

Views.
Data types except integers and fixed length strings.
Indices.
DDL

储存

Catalog 储存了所有表的信息。每个表的信息包括：name，schema，相应的 DbFile，以及 primary key。

SImpleDB 只支持两种 field，Interger 和 fixed length string。

每个表的 schema 用 TupleDesc 定义，其储存每个 filed 的 type 和 name。其除了支持用 index (offset) 获得 field 的 type 或 name，用 name 获得 field 的 index，还提供一个静态方法用于 merge 两个 TupleDesc 获得一个新的 TupleDesc （Join operator 使用）

tuple 用来储存 field，其除了提供第 i 个 field 的 getter/setter，还提供了所有 field 的 iterator。
tuple 有一个 record id 标志其在磁盘中的位置。

HeapPage 实现了 Page 接口。用一个 PageId 唯一标志，用来储存 tuples，其用一个 byte[] header 作为bitmap。
其支持在该 page 上插入/删除 tuple，标志该 page 为 dirty。还提供了迭代器用来迭代 page 中所有的tuple。
其支持将 page 实例序列化为 byte[] 和由 byte[] 构建 page 实例。

HeapFile 实现了 DbFile 的接口，其提供唯一的 ID，以及获得文件系统 File，table schema 的 API。
其支持从从磁盘获取数据(byte []), 并构建相应 page 实例。和将 page 序列化到磁盘。

buffer pool 存放了当前所有的 page 实例，如果已满，则会剔除某个page(如果 page 为 dirty，则 flush 到磁盘)。
所有对数据(都是以 page，也就是构建 HeapPage 实例)的访问都要经由 buffer pool （调用 getPage API）

这里必须要理清：
数据是储存在磁盘中的（支持序列化），当需要访问时，都会通过 bufferpool 获得。后者调用相应的 HeapFile 从磁盘中获得数据并生成 HeapPage 实例放入 bufferpool。
当 bufferpool 已满，会 kick out 一个page，如果那个 page 是 dirty 的，会先 flush 到磁盘（通过调用 HeapFile 的 writePage API）。

Operator

Operator 就是迭代器的连接，其实现 DbIterator 接口，其接受 child DbIterator。
SimpleDB 实现了 SeqScan，project, filter, join, aggregate, order_by。
除了 SeqScan，其他都由子 DbIterator 获得 tuples。
SeqScan 由 DbFileIterator (所有 DbFile 都要实现，用于获得 file 的所有数据) 获得 tuples

Transaction

Lab3 是实现 Transaction 功能
代码的变动不大，只要在 BufferPool read page 时添加获得锁的代码就行。
这是因为 SimpleDB 设计上所有对磁盘文件的获取都要经由 BufferPool。
所以 BufferPool 特别适合用来获得锁保证线程同步。
OS 中针对 IO 慢的问题也有类似的 Block Cache，其往往也是在这里实现同步。

关键是如何以正确的姿势获得锁和释放锁。
我这里添加了个 LockManager 类专门用来管理锁。
如果对性能要求不高，可以对获得锁的方法(accquireLock)专门上个锁，保证一个时间所有事务只有一个能使用该方法获得锁。
但这里我是保证要求同一个page 的多个事务只有一个能调用方法（通过 Java 中 synchronized (Object)）。
这里我犯了一个错误，我误认为所有 PageId 对象都是相同的，就用 synchronized (pid) 来保证同步化，但实际上每次访问 page 时会生成一个新的 PageId 对象，他们相等但不相同 (定义了 equals 和 hashcode 保证相等，但他们是不同对象)，所以使用 synchronized (pid) 并没有起到同步化的作用。正确的姿势是用一个Map，Map相等的 PageId 到同一个对象。

死锁检测没有什么好说的，就是检测 wait-lock-graph 有没有环的问题。

在 lab3 时，并没有使用 log 进行 recovery
其使用 NO-STEAL/FORCE

You shouldn't evict dirty (updated) pages from the buffer pool if they are locked by an uncommitted transaction (this is NO STEAL).
On transaction commit, you should force dirty pages to disk (e.g., write the pages out) (this is FORCE).
假设数据库在执行 transactionComplete 命令时不会崩溃，
以上三点使得不需要 log-based recovery，因为 you will never need to undo any work (you never evict dirty pages) and you will never need to redo any work (you force updates on commit and will not crash during commit processing).

最后编辑于：2017.12.03 05:54:15

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,402评论 6赞 499
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,377评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,483评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,165评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,176评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,146评论 1赞 297
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,032评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,896评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,311评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,536评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,696评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,413评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,008评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,659评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,815评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,698评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,592评论 2赞 353

SimpleDB

储存

Operator

Transaction

推荐阅读更多精彩内容