ncnn op解读之binaryop

binaryop的解读

binaryop是用来二元计算的op，看binaryop.h的内容：


class BinaryOp : public Layer
{
public:
    BinaryOp();

    virtual int load_param(const ParamDict& pd);
    
    using Layer::forward;
    using Layer::forward_inplace;
    virtual int forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& top_blobs, const Option& opt) const;
    
    virtual int forward_inplace(Mat& bottom_top_blob, const Option& opt) const;
    
    enum OperationType
    {
        Operation_ADD = 0,
        Operation_SUB = 1,
        Operation_MUL = 2,
        Operation_DIV = 3,
        Operation_MAX = 4,
        Operation_MIN = 5,
        Operation_POW = 6,
        Operation_RSUB = 7,
        Operation_RDIV = 8
    };

public:
    // param
    int op_type;
    int with_scalar;
    float b;
};

枚举OperationType下面就是此op的所有计算类型了。

接着看binaryop.cpp的构造函数：

BinaryOp::BinaryOp()
{
    one_blob_only = false;
    support_inplace = false;
}

构造函数里面被初始化成多输入多输出以及不能就地运算。

我们再来看参数装载函数：

int BinaryOp::load_param(const ParamDict& pd)
{
    op_type = pd.get(0, 0);
    with_scalar = pd.get(1, 0);
    b = pd.get(2, 0.f);

    //如果是标量则为单输入单输出且为就地运算
    if (with_scalar != 0)
    {
        one_blob_only = true;
        support_inplace = true;
    }

    return 0;
}

此op共有三个参数：

op_type：计算类型，也就是上面枚举中定义的那些。
with_scalar：是否是标量。
b：标量值。

前面头文件可以看到此op有两个推理的重载，一个是矩阵与矩阵的二元运算，一个是矩阵与标量的二元运算。由于运算类型很多，这里ncnn用了函数模板。我们先来看矩阵与标量的运算：

template<typename Op>
static int binary_op_scalar_inplace(Mat& a, float b, const Option& opt)
{
    //操作，这是一个类，这里面用了一个operator()重载所以，op就是操作函数
    Op op;

    int w = a.w;
    int h = a.h;
    int channels = a.c;
    int size = w * h;
    //openmp指令，用于多线程
    #pragma omp parallel for num_threads(opt.num_threads)
    for (int q = 0; q < channels; q++)
    {
        float* ptr = a.channel(q);
        //对每个通道的所有元素执行与标量b的二元运算
        for (int i = 0; i < size; i++)
        {
            ptr[i] = op(ptr[i], b);
        }
    }

    return 0;
}

矩阵与矩阵的二元运算函数过长，这里面只贴出关键的计算，这里面涉及到一个知识点，就是矩阵和矩阵之间运算需要注意Broadcasting机制。这里推荐一篇别人的文章，也是简书的：　介绍Broadcasting的。

ncnn代码这里up主写了个注释：
broadcasting rule:
https://github.com/Tencent/ncnn/wiki/binaryop-broadcasting

上面链接里内容如下：

broadcasting rule

ncnn BinaryOp accepts blobs with different shape

C = BinaryOp(A, B)

shape notation convention is [w], [w,h], [w,h,c]

type	A	B	C
1	[1]	scalar	[1]
2	[1]	[2]	[2]
3	[1]	[2,3]	[2,3]
4	[1]	[2,3,4]	[2,3,4]
5	[2]	scalar	[2]
6	[2]	[1]	[2]
7	[2]	[2]	[2]
8	[3]	[2,3]	[2,3]
9	[4]	[2,3,4]	[2,3,4]
10	[2,3]	scalar	[2,3]
11	[2,3]	[1]	[2,3]
12	[2,3]	[3]	[2,3]
13	[2,3]	[2,3]	[2,3]
14	[3,4]	[2,3,4]	[2,3,4]
15	[2,3,4]	scalar	[2,3,4]
16	[2,3,4]	[1]	[2,3,4]
17	[2,3,4]	[4]	[2,3,4]
18	[2,3,4]	[3,4]	[2,3,4]
19	[2,3,4]	[2,3,4]	[2,3,4]

some special broadcasting rule exists for model compatibility

special type	A	B	C
1	[2,3,4]	[1,1,4]	[2,3,4]
2	[2,3,4]	[2,3,1]	[2,3,4]
3	[1,1,4]	[2,3,4]	[2,3,4]
4	[2,3,1]	[2,3,4]	[2,3,4]

程序大体上结构是基于if...else...的，底层两个blob作为输入，顶层一个blob作为输出。先来看看a为三维矩阵，b也为三维矩阵时的计算(对于计算过程的分析全部写在注释里)：

            if (w1 == 1 && h1 == 1 && channels1 == channels)
            {
                // special type 1
                //这里面注释是特殊类型１，从表中可以看出矩阵B的wh都是１
                //创造top blob矩阵c,形状和a一致
                c.create(w, h, channels, elemsize, opt.blob_allocator);
                if (c.empty())
                    return -100;
                //openmp指令，用于多线程
                #pragma omp parallel for num_threads(opt.num_threads)
                for (int q = 0; q < channels; q++)
                {
                    const float* ptr = a.channel(q);
                    //矩阵b实际上只有４个元素，分布在四个通道上，这里把b和a的形状补全成一样的，这样每个通道上各自的矩形内所有元素都相等。
                    const float* b0 = b.channel(q);
                    float* outptr = c.channel(q);
                    for (int i = 0; i < size; i++)
                    {
                        outptr[i] = op(ptr[i], b0[0]);
                    }
                }

                return 0;
            }

            if (w1 == w && h1 == h && channels1 == 1)
            {
                // special type 2
                //这里面注释是特殊类型１，从表中可以看出矩阵B的通道数为１
                //创造top blob矩阵c,形状和a一致
                c.create(w, h, channels, elemsize, opt.blob_allocator);
                if (c.empty())
                    return -100;
                //openmp指令，用于多线程
                #pragma omp parallel for num_threads(opt.num_threads)
                for (int q = 0; q < channels; q++)
                {
                    const float* ptr = a.channel(q);
                    //这里通道数为１，意味着必须沿着2号轴就行扩展，使b的形状与a一致，讲矩形内元素复制几份
                    const float* ptr1 = b;
                    float* outptr = c.channel(q);
                    for (int i = 0; i < size; i++)
                    {
                        outptr[i] = op(ptr[i], ptr1[i]);
                    }
                }

                return 0;
            }
            //下面这两种特殊情况与上面两种正好反过来，这里就不详细介绍了
            if (w == 1 && h == 1 && channels1 == channels)
            {
                // special type 3
                c.create(w1, h1, channels1, elemsize, opt.blob_allocator);
                if (c.empty())
                    return -100;

                #pragma omp parallel for num_threads(opt.num_threads)
                for (int q = 0; q < channels1; q++)
                {
                    const float* a0 = a.channel(q);
                    const float* ptr1 = b.channel(q);
                    float* outptr = c.channel(q);
                    for (int i = 0; i < size1; i++)
                    {
                        outptr[i] = op(a0[0], ptr1[i]);
                    }
                }

                return 0;
            }

            if (w1 == w && h1 == h && channels == 1)
            {
                // special type 4
                c.create(w1, h1, channels1, elemsize, opt.blob_allocator);
                if (c.empty())
                    return -100;

                #pragma omp parallel for num_threads(opt.num_threads)
                for (int q = 0; q < channels1; q++)
                {
                    const float* ptr = a;
                    const float* ptr1 = b.channel(q);
                    float* outptr = c.channel(q);
                    for (int i = 0; i < size1; i++)
                    {
                        outptr[i] = op(ptr[i], ptr1[i]);
                    }
                }

                return 0;
            }

            // type 19
            //　这个是大表格里的类型19,形状相等的矩阵进行计算，这个很简单，就不详细说了，需要注意的是我们这里的乘除法不是矩阵乘除法，仅仅是两个矩阵对应元素的乘除。
            c.create(w, h, channels, elemsize, opt.blob_allocator);
            if (c.empty())
                return -100;

            #pragma omp parallel for num_threads(opt.num_threads)
            for (int q = 0; q < channels; q++)
            {
                const float* ptr = a.channel(q);
                const float* ptr1 = b.channel(q);
                float* outptr = c.channel(q);

                for (int i = 0; i < size; i++)
                {
                    outptr[i] = op(ptr[i], ptr1[i]);
                }
            }

            return 0;
        }

写到这里，我想下面应该没有写下去的必要了，就是根据上面表格里的broadcasting rule去计算两个矩阵的运算。

pr内容：

binaryop

This operation is used for binary computation, and the calculation rule depends on the broadcasting rule. broadcasting rule

C = BinaryOp(A, B)

if with_scalar = 1:

one_blob_only
support_inplace

param id	name	type	default	description
0	op_type	int	0	Operation type
1	with_scalar	int	0	1=B is a scalar, 0=B is a matrix
2	b	float	0.f	When B is a scalar, B = b

最后编辑于：2020.11.30 16:22:12

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,591评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,448评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,823评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,204评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,228评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,190评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,078评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,923评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,334评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,550评论 2赞 333
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,727评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,428评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,022评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,672评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,826评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,734评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,619评论 2赞 354

ncnn op解读之binaryop

binaryop的解读

broadcasting rule

binaryop

推荐阅读更多精彩内容