阅读caffe源码已有一段时间,从手足无错,漫无目的地乱调乱看到寻找合理理解目标,按部就班深入理解caffe架构确实是一个research过程.caffe是本人毕业以来认真详细阅读源码的第一个开源代码项目,research的过程比较艰辛,但也颇有些许心得体会,在此总结希望帮助到正在阅读这篇文章的你.
熟悉项目架构
要了解一个开源代码项目,最先要熟悉的是项目架构,明白了整体代码框架,就可以快速确立需要查看的代码范围,可以提高效率.
要了解代码架构,可以通过查看项目的目录结构,此时很多目录名称并不知道是什么意思,你可以在网上搜寻一篇博文对照理解各个目录结构的意思.
即便如此,在这个阶段,我们还是不能深入理解各个目标结构之间的关联,以及他们具体的功能意义.要达到这一步需要进入源码层次理解各个目录中代码的功能作用.关于阅读代码的方法,请看下面小节.
树立理解目标
阅读源码需要给自己寻找一个合适的理解目标,也就是先找到核心代码片断,再围绕这段代码出发,深入各个细节.由于你还是一个项目的初学者,与核心代码片断无关的细节暂时可以忽略,待到有理解需要时再回头理解它.
那么,如何寻找项目中的核心代码呢?结合caffe项目的例子,caffe是一个实现深度学习原理的开源项目,理解深度学习理论最重要的当然是理解神经网络前向计算和反向计算的原理.在阅读代码时,即需要理解net类中的Forward()和Backward()这两个函数的实现原理,也就是数据在这两个函数中是如何演化的.那么,要实现这一理解目标,我们需要如何做?
理解代码数据结构
核心代码片断的理解不仅涉及到了项目相关理论原理的理解,也关系到理解整个项目中的基本数据结构和常用的函数功能介绍.
结合caffe的例子,我们假设大家已经理解了深度学习的理论知识.那么,需要理解的就是代码架构的基本数据结构和常用的函数功能介绍.
caffe中最重要最基本,在Forward(),Backward()这两个函数中出现较多的相关数据结构有三个类:Blob,Layer,Net.在理解这三个类时主要抓住他们的成员变量和常用函数,这些目标的确立仍然可以根据是否出现在Forward(),Backward()这两个函数为导向.此时,对于函数的理解只需要记住不同函数的功能即可,最好不要急着理解函数的实现细节,以免被细节误导失去了整体目标的理解.
在理解数据结构和相关函数时,可以通过搜索网络资料,在代码附近写上适当的注释,帮助自己识记他们的功能作用.同样,也可以根据自己的理解或者网络资料在Forward(),Backward()函数中的每一具体步骤写上注释.
理解数据演化过程
知道了Forward(),Backward()函数的基本流程,此时我们可以回头看看代码目录,这时可以发现这些目录是多么眼熟啊~
不过,这个阶段,我们最好还是调试一下代码,看看具体数据在Forward(),Backward()中的演化过程.此时,我们需要先确立数据的存储位置,需要我们回头温故数据结构中的一些成员变量代表的意义了.然后可以验证每一函数功能相对于数据的变化是否一致,从而进一步理解函数功能.
项目细节进一步理解
演化过程理解以后,此时再看看项目文件目录,可以发现它们之间彼此是有联系的.这时,我们已经理解了项目架构了.
下面我们需要理解的就是一些函数的实现细节了,比如caffe中不同层级setup(),Forward(),Backward(),网络类中的init()具体实现的细节了.在这个过程可以做到胸有成竹了.
总结
这是本人阅读caffe源码后总结的一个过程,是否还有很多不足呢,请在下面留下你的足印吧!