0x00 为啥要读
如果说是在18年以前阅读比特币代码,是价值投资的基本操作,那今年再去做这个事,绝逼是信仰了。比特币作为虚拟货币的开山鼻祖,运行至今近10年,在没有中心化结构的运营下,几乎没有出现过重大事故,相信BAT的产品也不敢吹这牛逼吧,所以作为技术人员读一读比特币代码是修炼内功的绝佳选择。由于比特币代码相比于我们之前所研发的C(B)/S结构不同,理解起来总会有一些吃力,如果能有一群水平差不多的朋友在一起互开脑洞,共同勉励,那更是一件美妙的事情。机缘巧合认识到国内第一批研读比特币代码的大神@菜菜子,经过几次沟通,他组织发起我们共同去做这个事情,在此特别感谢!
0x01 阅读思路
按照我以前的习惯,如果想去学习一门技术,那首先要去学会使用这门技术。话说学习使用比特币成本还是蛮大的,按照今天的行情BTC一枚也要4W多人民币。不过没有关系,我们还有很多其他的山寨币,操作起来也都是大同小异。利用3个月的时间,我从交易所到钱包,从公链到侧链,从炒币到各种DAPP几乎都玩了一遍。这个时候再去学习区块链的技术,知道自己该如何做信息过滤了,身边的同仁也会越来越多,遇到问题的时候,解决起来也就得心应手了。
在开始阅读代码之前,《比特币白皮书》和《精通比特币》这两份材料是必须要读的,对,必须。即使读不懂也没关系,至少从宏观上对比特币的技术有个大致的了解,脑子里有区块链模糊的样子,这是很重要的,如果一开始就从某个技术细节入手,比如密码学,P2P,很容易就走进一个死胡同,最后无疾而终。
0x02 环境搭建
工欲善其事,必先利其器。首先我们先选个版本,我用的是Bitcoin Core Daemon version v0.16.99.0-b1dc39d。在开始研读代码之前,我们先把环境搭好。由于常年在Windows下面做开发,我尝试过搭建bitcoin的windows环境,网上也能搜索到教程,但我不推荐大家去这么做,因为这是一个巨坑,详细就不多赘述了。我选择的系统环境是Ubuntu 14.04 Server LTS,我不太喜欢用桌面版。具体搭建的教程在互联网上能搜到@菜菜子的教程,讲的很详细,一步一步做下去就是了。IDE我尝试过几个,sublime,vscode,甚至Idea,我觉得都不够好用,最主要的是对“代码引用”这个功能支持的不好,最后只好祭出了江湖杀器Visual Stuio,但VS导入文件夹的功能不是很友好,只好自己先去Create Filter,然后再导入文件。最后我想强调一点的是关于代码的调试,可能很多朋友喜欢用Log调试,我个人还是喜欢debug,我用的是gdb,不过要注意的是,在make文件之前要修改所有目录下的makefile,把编译的优化禁止掉,也就是把g++的编译选项-O2改成-O0,这样就能跟踪代码的完整的执行流程了。
0x03 目录结构&数据结构
整个的项目的目录结构可以参考下图(图片来源于互联网)
读了一下前辈的研读代码,基本都是从函数入口进行介绍的,是基于函数跳转分析的,也就是我们平时调试的callstack。我研读的方式稍有不同,我是从整个比特币的数据结构入手的。我们都知道比特币代码是基于区块链技术的,脑子里都有链表这样的一个概念,一环一环利用指针依次连接起来。如果我们知道每个节点里的数据结构,甚至是内存布局,然后再去分析每个数据结构在代码中扮演的角色,各个数据结构之间的组织方式,是Has-A,还是Is-A,按照这个思路去阅读代码,就轻松愉悦加开心了。
首先来分析chain.h和chain.cpp这两个文件,里面包含了这样的类。
CBlockIndex
CDiskBlockIndex
CChain
类的关系成员变量及关系图如下:
再来分析block.h和block.cpp这两个文件,里面包含如下几个类。
CBlockHeader
CBlock
CBlockLocator
类的关系成员变量及关系图如下:
从上面的分析可以看出CBlockIndex是Block的内存索引,Block的详细数据是懒加载(lazy-load),只有在使用的时候才会用硬盘数据读取。Block在硬盘序列化的数据除了类里的成员变量之外,还有一些额外的数据如下图所示,看到这些是不是很眼熟,在刚开始接触windows PE文件的时候,思路和这个也是类似的。
有网友总结出来的更简单粗暴的图,如下(图片来源于互联网),这个图,我很喜欢,哈哈哈。
0x04 总结
本开篇小节主要讲述了研读BTC代码的动机和方法,立Flag去做一件事情可能会很简单,但能坚持下来是一件很不容易的事情,由于本人能力有限,文中有描述不当的地方,还请大家多多包涵。下一小节,主要讲交易的数据结构,See u then!
本文由区块链研习社源码研读班@Hefe原创,转载请注明出处!