写在前面
最近项目需使用mongoose分页操作,通过度娘发现,很多都是直接用skip+limit实现分页操作。但这样做有个弊端,对于少量的数据来说,完全可行,当数据量大了后,这种方案就不怎么可取了。因为skip需从头开始查找,对于数据量大的数据库,这样的操作很费时间。当然对于mysql等数据库来说,分页操作还有其他的实现方式,但单就mongodb数据库来说,有个简单的优化方式就是通过ObjectId来实现。因为ObjectId是可以比较大小的(不清楚的可自行查看ObjectId的构成方式),因此我们可以操作gt,lt来优化我们的分页效果。为什么说这样会快一点呢?这样操作,我们的查找是从_id数据开始查询,减少遍历数据的时间。
实现原理
首先,我们需要前端传递一个当前页数据的最后一个或第一个_id字段到服务器,服务器通过_id字段查找到数据所在位置,然后从当前位置开始查找数据,如果是向后翻页,那么我们向后查询limit个数据出来,如果向前翻页,我们向前查limit个数据出来。
整个原理其实应该不是很难的,但是在实际操作过程中,有个很蛋疼的问题~~~
实现过程
当我们想明白了原理后,开始用代码实现:
因为踩了比较多的坑,我就直接记录下最后一次正确的思路,其他的,不如为外人道也(啰嗦)。首先我们说前端需要上传的参数(如图1所示):id(记录的本组数据第一个id或最后一个id), preNum(当前所在页 from), nextNum(将要前往的页 to), limit(每组数据的数据量 2),至于为什么传递这几个参数?请看下文。
假设数据库中🈶️5条数据,编号为1-5,前端分页,每页limit(2)条数据,那么我们的数据分组应该是这样的:
54,32,1
也就是说需要分三页,为什么说需要传递第一个数据的id或者最后一条数据的_id呢?因为在我们从第一页切换到第二页的时候,拿到编号为2的数据id开始向后查找,若相邻页数跳转,就可直接向后拿到limit(2)条数据,也就是我们的34数据。当然,如果是第一页直接跳第三页,同理,我们可以直接从编号位2的数据开始向后跳过limit(2)条数据,然后拿到编号为5的数据。正向跳转解决完成。(ps:数据是反向获取的,也就是最新的数据在最前面)
但是反向跳转呢?我们还是可以使用类似的思想来操作。但是要注意,反向跳转时,我们需要获取每组数据的第一条id数据!也就是说假如我们要从第三页跳转到第二页,我们就可以从1开始查找比1的_id大的数据,那肯定会返回(5,4,3,2)四条数据,这个时候如果我们按照从大到小的顺序排列,我们的数据是这样的:
1,54,32
和上面的数据比较会发现,想要从第三页跳转到第二页需要先跳过54两条数据,也就是说如果数据多了,其实还是从头开始查询的,对我们的优化不友好。然后我们按照从小到大的顺序排列呢?数据是这样的:
1,23,45
我们再和开始的数据对比,会发现我们的数据是反着的,我们想要的数据是:1,32,54。这个时候我想到了一个解决办法:假设从第三页跳转第二页。我们拿到从前端传过来的每组数据的第一条_id字段,这个时候我们拿到数据1的_id,然后向后查找limit(2)条数据,这个时候将返回前端的数据是23,这个时候我们可以在返回前做个处理,将获取到的数据重新按照从大到小的顺序排列数据,将数据变为32,这个时候前端拿到的第一个数据就是3,符合我们的数据要求,当从第二页向第一页切换时,我们拿到的将是数据3的_id字段,重复前面的操作,从数据3的_id开始查找,会找到45两条数据,返回前都经过重新排序。当然,如果是跳过多页,我们就只需要计算从_id开始跳过相关数据就行了,这样就会大大减小数据的查询等操作(代码实现请看图2)。
相关说明
- query对象是mongoose的方法,若使用mongodb类似,只需要将参数写到find()内就行
- ObjectId 重新排序是根据时间的高低重排。可以看到其实_id字段其实是有时间戳在里面的,我们使用getTimestamp()方法就可以解析出每个_id的生成时间。
收获:
本次探究让我更加深入的了解了mongodb做分页时的过程,对于query参数的运作有了深入的理解,而在数组排序方面,学习到了自定义字段排序的方法,对数组排序有了更深入的了解。
ps:
以上内容仅为自己的学习过程,欢迎大家取其精华,丢其糟粕。若对以上内容有不同理解或更好的想法,欢迎一起探讨。
企鹅号:1041415167 邮箱地址:zth1041415167@outlook.com