Caffe代码导读(2):caffe结构分析

caffe目录结构

  • docs —— 帮助文档
  • examples —— 代码样例
  • matlab —— MATLAB接口文件
  • python —— PYTHON接口文件
  • models —— 一些配置好的模型参数
  • scripts —— 一些文档和数据会用到的脚本
  • 核心代码:
    • tools —— 保存的源码是用于生成二进制处理程序的,caffe在训练时实际是直接调用这些二进制文件
    • include —— Caffe的实现代码的头文件
    • src —— 实现Caffe的源文
    • gtest —— google test一个用于测试的库. 你make runtest时看见的很多绿色RUN OK就是它,这个与caffe的学习无关,不过是个有用的库
    • caffe —— 关键代码:
      • test —— 用gtest测试caffe的代码
      • util —— 数据转换时用的一些代码。caffe速度快,很大程度得益于内存设计上的优化(blob数据结构采用proto)和对卷积的优化(部分与im2col相关)
      • proto —— 即所谓的“Protobuf”,全称“Google Protocol Buffer”,是一种数据存储格式,帮助caffe提速
      • layers —— 深度神经网络中的基本结构就是一层层互不相同的网络了,这个文件夹下的源文件以及目前位置“src/caffe”中包含所有.cpp文件就是caffe的核心目录下的核心代码了。
  • caffe最核心的代码:
    • blob[.cpp .h] —— 基本的数据结构Blob类
    • common[.cpp .h] —— 定义Caffe类
    • internal_thread[.cpp .h]—— 使用boost::thread线程库
    • net[.cpp .h] —— 网络结构类Net
    • solver[.cpp .h] —— 优化方法类Solver
    • data_transformer[.cpp .h] —— 输入数据的基本操作类DataTransformer
    • syncedmem[.cpp .h] —— 分配内存和释放内存类CaffeMallocHost,用于同步GPU,CPU数据
    • layer[.cpp .h] —— 层类Layer
    • layers ——  此文件夹下面的代码全部至少继承了类Layer, 从layer_factory中注册继承

caffe的三级机构(Blobs,Layers,Nets)

  • Blobs,Layers,Nets关系概述:Caff的net比作一栋大楼,Layer是构成大楼的墙,Blob是构成墙的砖块

  • 功能概括:

    • Blob:用于数据的保存、交换和操作,Caffe基础存储结构
    • Layer:用于模型和计算的基础
    • Net:整合连接layers
  • 具体介绍:

    • Blob:是caffe中处理和传递实际数据的数据封装包。是按C风格连续储存的N维数组。
      • 常规的维度为图像数量N通道数C图像高度H*图像宽度W。

      • 主要变量:

        • shared_ptr data_;
        • shared_ptr diff_;
        • shared_ptr shape_data_;
        • vector shape_;
        • int count_;
        • int capacity_;
      • 解释:

        • shared_ptr——是一个数据boost库中的智能指针,主要用来申请内存
        • data_主要是正向传播时候用的,diff_主要是用来储存偏差(主要是反向传播的时候会用到),
        • shape_data和shape_——都是存储Blob的形状
        • count——表示Blob存储的元素个数,也就是个数*通道数*高度*宽度
        • capacity_——表示当前Blob的元素个数(控制动态分配)
      • 主要函数:

        • 构造函数:构造函数开辟一个内存空间来存储数据
        • reshape函数:Reshape函数在Layer中的reshape或者forward操作中来adjust dimension
        • count函数:重载很多个count()函数,主要还是为了统计Blob的容量(volume),或者是某一片(slice),从某个axis到具体某个axis的shape乘积(如 “ inline int count(int start_axis, int end_axis)”)。
        • data_数据操作函数 & 反向传播导数diff_操作函数:这一部分函数主要通过给定的位置访问数据,根据位置计算与数据起始的偏差offset,在通过cpu_data*指针获得地址
        • FromProto/ToProto数据序列化:将数据序列化,存储到BlobProto,这里说到Proto是谷歌的一个数据序列化的存储格式,可以实现语言、平台无关、可扩展的序列化结构数据格式。
        • Update函数:该函数用于参数blob的更新(weight,bias 等减去对应的导数)
        • 其他运算函数:
          • Dtype asum_data() const;//计算data的L1范数(所有元素绝对值之和)
          • Dtype asum_diff() const;//计算diff的L1范数
          • Dtype sumsq_data() const;//计算data的L2范数(所有元素平方和)
          • Dtype sumsq_diff() const;//计算diff的L2范数
          • void scale_data(Dtype scale_factor);//将data部分乘以一个因子
          • void scale_diff(Dtype scale_factor);//将diff部分乘一个因子
    • layer:
      • 简介:
        所有的Pooling(池化),Convolve(卷积),apply nonlinearities等操作都在这里实现。在Layer中input data用bottom,表示output data用top表示。每一层定义了三种操作setup(Layer初始化), forward(正向传导,根据input计算output), backward(反向传导计算,根据output计算input的梯度)。forward和backward有GPU和CPU两个版本的实现。

      • caffe中已经衍生了很多不同功能作用的layer, 其中常用的五种layer:

        • data_layer(数据层)
          • data_layer主要包含与数据有关的文件。在官方文档中指出data是caffe数据的入口是网络的最低层,并且支持多种格式,在这之中又有5种LayerType:

            • DATA 用于LevelDB或LMDB数据格式的输入的类型,输入参数有source, batch_size, (rand_skip), (backend)。后两个是可选。
            • EMORY_DATA 这种类型可以直接从内存读取数据使用时需要调用MemoryDataLayer::Reset,输入参数有batch_size, channels, height, width。
            • DF5_DATA HDF5数据格式输入的类型,输入参数有source, batch_size。
            • HDF5_OUTPUT HDF5数据格式输出的类型,输入参数有file_name。
            • IMAGE_DATA 图像格式数据输入的类型,输入参数有source, batch_size, (rand_skip), (shuffle), (new_height), (new_width)。
          • 其实还有两种WINDOW_DATA, DUMMY_DATA用于测试和预留的接口,不重要。

        • neuron_layer(数据的操作层)
          neuron_layer实现里大量激活函数,主要是元素级别的操作,具有相同的bottom,top size。
        • loss_layer(损失层/计算网络误差层)

        可以看见调用了neuron_layers.hpp,估计是需要调用里面的函数计算Loss,一般来说Loss放在最后一层。caffe实现了大量loss function,它们的父类都是LossLayer。

        • common_layer

          • 这一层主要进行的是vision_layer的连接
          • 声明了9个类型的common_layer,部分有GPU实现:
            • InnerProductLayer 常常用来作为全连接层
            • SplitLayer 用于一输入对多输出的场合(对blob)
            • FlattenLayer 将n * c * h * w变成向量的格式n * ( c * h * w ) * 1 * 1
            • ConcatLayer 用于多输入一输出的场合
            • SilenceLayer 用于一输入对多输出的场合(对layer)
            • (Elementwise Operations) 这里面是我们常说的激活函数层Activation Layers。
              • EltwiseLayer
              • SoftmaxLayer
              • ArgMaxLayer
              • MVNLayer
        • vision_layer

          • 主要是实现Convolution和Pooling操作, 主要有以下几个类:
            • ConvolutionLayer 最常用的卷积操作
            • Im2colLayer 与MATLAB里面的im2col类似,即image-to-column transformation,转换后方便卷积计算
            • LRNLayer 全称local response normalization layer,在Hinton论文中有详细介绍ImageNet.
              Classification with Deep Convolutional Neural Networks 。
            • PoolingLayer Pooling操作
    • Net

    Net由一系列的Layer组成(无回路有向图DAG),Layer之间的连接由一个文本文件描述。模型初始化Net::Init()会产生blob和layer并调用Layer::SetUp。在此过程中Net会报告初始化进程。这里的初始化与设备无关,在初始化之后通过Caffe::set_mode()设置Caffe::mode()来选择运行平台CPU或GPU,结果是相同的。

    • Protocol Buffer

      • Protocol Buffer(PB)是一种轻便、高效的结构化数据存储格式,可以用于结构化数据串行化,很适合做数据存储或 RPC 数据交换格式。它可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。是一种效率和兼容性都很优秀的二进制数据传输格式,目前提供了 C++、Java、Python 三种语言的 API。Caffe采用的是C++和Python的API。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,817评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,329评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,354评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,498评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,600评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,829评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,979评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,722评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,189评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,519评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,654评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,940评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,762评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,993评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,382评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,543评论 2 349

推荐阅读更多精彩内容