Caffe代码导读（2）：caffe结构分析

caffe目录结构

docs —— 帮助文档
examples —— 代码样例
matlab —— MATLAB接口文件
python —— PYTHON接口文件
models —— 一些配置好的模型参数
scripts —— 一些文档和数据会用到的脚本
核心代码：
- tools —— 保存的源码是用于生成二进制处理程序的，caffe在训练时实际是直接调用这些二进制文件
- include —— Caffe的实现代码的头文件
- src —— 实现Caffe的源文
- gtest —— google test一个用于测试的库. 你make runtest时看见的很多绿色RUN OK就是它，这个与caffe的学习无关，不过是个有用的库
- caffe —— 关键代码:
  - test —— 用gtest测试caffe的代码
  - util —— 数据转换时用的一些代码。caffe速度快，很大程度得益于内存设计上的优化（blob数据结构采用proto）和对卷积的优化（部分与im2col相关）
  - proto —— 即所谓的“Protobuf”，全称“Google Protocol Buffer”，是一种数据存储格式，帮助caffe提速
  - layers —— 深度神经网络中的基本结构就是一层层互不相同的网络了，这个文件夹下的源文件以及目前位置“src/caffe”中包含所有.cpp文件就是caffe的核心目录下的核心代码了。
caffe最核心的代码：
- blob[.cpp .h] —— 基本的数据结构Blob类
- common[.cpp .h] ——　定义Caffe类
- internal_thread[.cpp .h]——　使用boost::thread线程库
- net[.cpp .h] ——　网络结构类Net
- solver[.cpp .h] ——　优化方法类Solver
- data_transformer[.cpp .h] ——　输入数据的基本操作类DataTransformer
- syncedmem[.cpp .h] ——　分配内存和释放内存类CaffeMallocHost，用于同步GPU，CPU数据
- layer[.cpp .h] ——　层类Layer
- layers　——　此文件夹下面的代码全部至少继承了类Layer, 从layer_factory中注册继承

caffe的三级机构（Blobs,Layers,Nets）

Blobs,Layers,Nets关系概述：Caff的net比作一栋大楼，Layer是构成大楼的墙，Blob是构成墙的砖块
功能概括：
- Blob:用于数据的保存、交换和操作，Caffe基础存储结构
- Layer:用于模型和计算的基础
- Net：整合连接layers
具体介绍：
- Blob：是caffe中处理和传递实际数据的数据封装包。是按C风格连续储存的N维数组。
  - 常规的维度为图像数量N通道数C图像高度H*图像宽度W。
  - 主要变量：
    - shared_ptr data_;
    - shared_ptr diff_;
    - shared_ptr shape_data_;
    - vector shape_;
    - int count_;
    - int capacity_;
  - 解释：
    - shared_ptr——是一个数据boost库中的智能指针，主要用来申请内存
    - data_主要是正向传播时候用的，diff_主要是用来储存偏差（主要是反向传播的时候会用到），
    - shape_data和shape_——都是存储Blob的形状
    - count——表示Blob存储的元素个数，也就是个数*通道数*高度*宽度
    - capacity_——表示当前Blob的元素个数（控制动态分配）
  - 主要函数：
    - 构造函数：构造函数开辟一个内存空间来存储数据
    - reshape函数：Reshape函数在Layer中的reshape或者forward操作中来adjust dimension
    - count函数：重载很多个count()函数，主要还是为了统计Blob的容量（volume），或者是某一片（slice），从某个axis到具体某个axis的shape乘积（如 “ inline int count(int start_axis, int end_axis)”）。
    - data_数据操作函数 & 反向传播导数diff_操作函数：这一部分函数主要通过给定的位置访问数据，根据位置计算与数据起始的偏差offset，在通过cpu_data*指针获得地址
    - FromProto/ToProto数据序列化：将数据序列化，存储到BlobProto，这里说到Proto是谷歌的一个数据序列化的存储格式，可以实现语言、平台无关、可扩展的序列化结构数据格式。
    - Update函数：该函数用于参数blob的更新（weight，bias 等减去对应的导数）
    - 其他运算函数：
      - Dtype asum_data() const;//计算data的L1范数(所有元素绝对值之和)
      - Dtype asum_diff() const;//计算diff的L1范数
      - Dtype sumsq_data() const;//计算data的L2范数(所有元素平方和)
      - Dtype sumsq_diff() const;//计算diff的L2范数
      - void scale_data(Dtype scale_factor);//将data部分乘以一个因子
      - void scale_diff(Dtype scale_factor);//将diff部分乘一个因子
- layer：
  - 简介：
    所有的Pooling（池化），Convolve（卷积），apply nonlinearities等操作都在这里实现。在Layer中input data用bottom,表示output data用top表示。每一层定义了三种操作setup（Layer初始化）, forward（正向传导，根据input计算output）, backward（反向传导计算，根据output计算input的梯度）。forward和backward有GPU和CPU两个版本的实现。
  - caffe中已经衍生了很多不同功能作用的layer, 其中常用的五种layer:
    - data_layer（数据层）
      - data_layer主要包含与数据有关的文件。在官方文档中指出data是caffe数据的入口是网络的最低层，并且支持多种格式，在这之中又有5种LayerType：
        
        DATA 用于LevelDB或LMDB数据格式的输入的类型，输入参数有source, batch_size, (rand_skip), (backend)。后两个是可选。
        
        EMORY_DATA 这种类型可以直接从内存读取数据使用时需要调用MemoryDataLayer::Reset，输入参数有batch_size, channels, height, width。
        
        DF5_DATA HDF5数据格式输入的类型，输入参数有source, batch_size。
        
        HDF5_OUTPUT HDF5数据格式输出的类型，输入参数有file_name。
        
        IMAGE_DATA 图像格式数据输入的类型，输入参数有source, batch_size, (rand_skip), (shuffle), (new_height), (new_width)。
      - 其实还有两种WINDOW_DATA, DUMMY_DATA用于测试和预留的接口,不重要。
    - neuron_layer（数据的操作层）
      neuron_layer实现里大量激活函数，主要是元素级别的操作，具有相同的bottom,top size。
    - loss_layer（损失层/计算网络误差层）
    可以看见调用了neuron_layers.hpp，估计是需要调用里面的函数计算Loss，一般来说Loss放在最后一层。caffe实现了大量loss function，它们的父类都是LossLayer。
    - common_layer
      - 这一层主要进行的是vision_layer的连接
      - 声明了9个类型的common_layer，部分有GPU实现：
        
        InnerProductLayer 常常用来作为全连接层
        
        SplitLayer 用于一输入对多输出的场合（对blob）
        
        FlattenLayer 将n * c * h * w变成向量的格式n * ( c * h * w ) * 1 * 1
        
        ConcatLayer 用于多输入一输出的场合
        
        SilenceLayer 用于一输入对多输出的场合（对layer）
        
        (Elementwise Operations) 这里面是我们常说的激活函数层Activation Layers。
        
        EltwiseLayer
        
        SoftmaxLayer
        
        ArgMaxLayer
        
        MVNLayer
    - vision_layer
      - 主要是实现Convolution和Pooling操作, 主要有以下几个类：
        
        ConvolutionLayer 最常用的卷积操作
        
        Im2colLayer 与MATLAB里面的im2col类似，即image-to-column transformation，转换后方便卷积计算
        
        LRNLayer 全称local response normalization layer，在Hinton论文中有详细介绍ImageNet.
        Classification with Deep Convolutional Neural Networks 。
        
        PoolingLayer Pooling操作
- Net
Net由一系列的Layer组成(无回路有向图DAG)，Layer之间的连接由一个文本文件描述。模型初始化Net::Init()会产生blob和layer并调用Layer::SetUp。在此过程中Net会报告初始化进程。这里的初始化与设备无关，在初始化之后通过Caffe::set_mode()设置Caffe::mode()来选择运行平台CPU或GPU，结果是相同的。
- Protocol Buffer
  - Protocol Buffer(PB)是一种轻便、高效的结构化数据存储格式，可以用于结构化数据串行化，很适合做数据存储或 RPC 数据交换格式。它可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。是一种效率和兼容性都很优秀的二进制数据传输格式，目前提供了 C++、Java、Python 三种语言的 API。Caffe采用的是C++和Python的API。

最后编辑于：2017.12.09 09:53:49

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,817评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,329评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,354评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,498评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,600评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,829评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,979评论 3赞 408
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,722评论 0赞 266
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,189评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,519评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,654评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,329评论 4赞 330
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,940评论 3赞 313
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,762评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,993评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,382评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,543评论 2赞 349

Caffe代码导读（2）：caffe结构分析

caffe目录结构

caffe的三级机构（Blobs,Layers,Nets）

推荐阅读更多精彩内容