MongoDB查询实现 笛卡尔积,Union All 和Union 功能

此篇文章及以后的文章大部分都是从聚合管道(aggregation pipeline)的一些语法为基础讲解的,如果不理解聚合管道的话,可以先学习一下会比较容易理解.
可以参考 mongoDB Documentation 的 Pipeline Aggregaion Stages.

何为Union All 和 Union

Union All指令的目的是将两个结果放在一起并且不管是否有重复,Union指令则把结果合并且去掉重复结果.


SQL中的实现Union All

在sql中,我们可以很简单的就实现 Union All 的效果.比如在sql中,我们的数据是

tableA id type tableB id type
1 OPEN 1 OPEN
2 CLOSE 2 ISSUE
3 REJECT 3 VOID
4 REQUEST

我们在sql中 Union All 的写法是:

select a.type as type from tableA a Union All select b.type from tableB b;

得到的结果是:

type
OPEN
CLOSE
REJECT
REQUEST
OPEN
ISSUE
VOID

MongoDB 的语法实现

在MongoDB中,对于给我们表联结相关使用的函数,有aggregate中的$lookup函数,
参照我们的官方例子,我们很容易就能理解$lookup函数的作用,相当于我们在sql里面的表联结,如:

select a.*,b.* from tableA a,tableB as b where a._id = b.tableAId;

$lookup函数中,有以下参数为必填:

  • from: <collection to join>, //等价于上面的 tableB
  • localField: <field from the input documents>, // 等价于上面的 a._id
  • foreignField: <field from the documents of the "from" collection>, //等价于上面的 b.tableAId
  • as: <output array field> // 等价于上面as后面的 b

那么如何使用联结作用的函数来实现Union All 的作用呢?其实很简单,在上面的4个参数里面,localFieldforeignField 是必填的,但是在mongo里面,我们可以填写一个无效的field(不存在表里面的field)来实现我们的效果

我们的测试数据如下:

tableA
{"_id":"1","type":"OPEN"}
{"_id":"2","type":"CLOSE"}
{"_id":"3","type":"REJECT"}
{"_id":"4","type":"REQUECT"}
tableB
{"_id":"1","type":"OPEN"}
{"_id":"2","type":"ISSUE"}
{"_id":"3","type":"VOID"}

1. 实现笛卡尔积

首先我们写的查询语句如下,将localFieldforeignField随便填写一个String语句,只要是不在表里面存在的field即可

db.tableA.aggregate([
    {
        $lookup:{
            from:"tableB",
            localField:"invalidField",
            foreignField:"testField",
            as:"tableB"
        }
    }
])

查询结果:

_id type tableB
1 OPEN [3 elements]
1 CLOSE [3 elements]
1 REJECT [3 elements]
1 REQUEST [3 elements]

在MongoDB里面,field的判断是空等于空的,value的判断空是不等于空的. 两个等于空的field去比较,相当于 在sql 里面 where 1=1 的写法.

可以看到,我们tableA的每一条记录都匹配到了tableB的3个元素(所有数据),此时只要我们将tableB的记录 $unwind出来,就实现了笛卡尔积的效果了.

$unwind语法如下:

db.tableA.aggregate([
    {
        $lookup:{
            from:"tableB",
            localField:"invalidField",
            foreignField:"testField",
            as:"tableB"
        }
    },
    {
        $unwind:{
            path:"$tableB"
        }
    },
    {
        $project:{
            _id:1,
            type:1,
            tableBId:"$tableB._id",
            tableBType:"$tableB.type"
            
        }
    }
])

等价于sql语句:

select a.id,a.type,b.id as tableId,b.type as tableBType from 
tableA a,tableB b
where 1=1;

查询结果可以自行测试


2. 实现Union

在MongoDB里面,有一个$setUnion的函数,$setUnion函数被union的参数必需是数组,
在我们tableA lookup tableB之后返回来的结果,tableB已经是一个一个数组了,但是我们的tableA的type是一个字符串值,所以我们需要先将tableA的内容先转为数组,才能进行union.

All operands of $setUnion must be arrays.

将tableA里面的所有记录转为一个数组需要用到$gourp函数里面的$push功能.
查询语法如下:

db.tableA.aggregate([
    {
        $group:{
            _id:"any",
            tableA:{
                $push: "$$ROOT"
            }
        }
    }
])

查询结果:

_id tableA
any [4 elements]

因为$gourp函数里面的_id属性是必选的,但是这里我们不用到,所以填任意字符串或者null都可以.使用$push之后,tableA的所有记录,都被push到了我们命名为tableA的数组里面,
此时我们在$lookup tableB看看结果如何.
查询语法如下:

db.tableA.aggregate([
    {
        $group:{
            _id:"any",
            typeArray:{
                $push: "$$ROOT"
            }
        }
    },
    {
        $lookup:{
            from:"tableB",
            localField:"invalidField",
            foreignField:"testField",
            as:"tableB"
        }
    } 
])

查询结果:

_id tableA tableB
any [4 elements] [3 elements]

可以看到,我们的tableA,和tableB的结果都变成了数组,此时我们已经可以使用$setUnion函数去实现我们的Union效果了

db.tableA.aggregate([
    {
        $group:{
            _id:"any",
            tableA:{
                $push: "$$ROOT"
            }
        }
    },
    {
        $lookup:{
            from:"tableB",
            localField:"invalidField",
            foreignField:"testField",
            as:"tableB"
        }
    },
    {
        $project:{
            _id:0,
            allValue:{
                $setUnion:["$tableA","$tableB"]
            }
        }
    }
])

查询结果:

allValue
[6 elements]

此处只有6个元素在数组里面,已经把重复的去掉了,可以说我们的Union效果已经实现,之后在把结果用$unwind展开即可.
查询语法如下:

db.tableA.aggregate([
    {
        $group:{
            _id:"any",
            tableA:{
                $push: "$$ROOT"
            }
        }
    },
    {
        $lookup:{
            from:"tableB",
            localField:"invalidField",
            foreignField:"testField",
            as:"tableB"
        }
    },
    {
        $project:{
            _id:0,
            allValue:{
                $setUnion:["$tableA","$tableB"]
            }
        }
    },
    {
        $unwind:{
            path:"$allValue"
        }
    },
    {
        $project:{
            _id:0,
            type:"$allValue.type"
            
        }
    },
    
])

3. 实现Union All

实现Union All 的原理与union 的类似,我们可以在把tableA push 成一个数组前,新增一个field,或者只push type,那么在union的时候,因为table A 和 table B field 数量不一致,那么永远不会合并成一行,因为它们任意一行都是不一样的.
查询语法如下:

db.tableA.aggregate([
    {
        $group:{
            _id:"any",
            tableA:{
                $push: {type:"$type"}
            }
        }
    },
    {
        $lookup:{
            from:"tableB",
            localField:"invalidField",
            foreignField:"testField",
            as:"tableB"
        }
    },
    {
        $project:{
            _id:0,
            allValue:{
                $setUnion:["$tableA","$tableB"]
            }
        }
    },
    {$unwind:"$allValue"},
    {
        $project:{
            _id:0,
            type:"$allValue.type"
            
        }
    }
])

Union All 的结果,可以通过group的方式去重来变成 Union 的效果. $group函数在此就不再细讲,可以参考官网.


总结

在我们的MongoDB官方文档里面介绍了一些函数的基本语法,但是功能方面比较Oracle等传统关系型数据库来说还是比较少的,因为一些如本文讲的Union等这些功能,只能根据现有的功能去实现.
而在官网和网上现有的资料里面,是没有实现Union这些功能的介绍的,因此写下了这篇文档.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容