聚合管道优化
最后更新于
在本页面
聚合管道操作具有优化阶段,该阶段试图重塑管道以改善性能。
要查看优化程序如何转换特定聚合管道,请在方法中包含选项。
优化可能会在不同版本之间发生变化。
聚合管道可以确定它是否仅需要文档中的字段的子集来获得结果。如果是这样,管道将只使用那些必需的字段,减少通过管道的数据量。
对于包含投影阶段(或或或)后跟阶段的聚合管道,MongoDB 将阶段中不需要在投影阶段计算的值的任何过滤器移动到投影前的新阶段。
如果聚合管道包含多个投影 and/or 阶段,MongoDB 会为每个阶段执行此优化,将每个过滤器移动到过滤器不依赖的所有投影阶段之前。
考虑以下阶段的管道:
[success] 注意
在优化阶段,优化程序将序列转换为以下内容:
$project
/ $unset
+ $skip
序列优化3.2版本中的新功能。
在优化阶段,优化器将序列转换为以下内容:
如果可能,优化阶段将一个管道阶段合并到其前身。通常,合并发生在任何序列重新排序优化之后。
$sort
+ $limit
合并Mongodb 4.0版本的改变。
例如,如果管道包括以下阶段:
在优化阶段,优化器将序列合并为以下内容:
用
$skip
进行序列优化
$limit
+ $limit
合并$skip
+ $skip
合并$match
+ $match
合并$lookup
+ $unwind
合并3.2版中的新功能。
例如,管道包含以下序列:
止于Mongodb4.0
[success] 可以看看
译者:李冠飞
校对:李冠飞
优化器将阶段分成四个单独的过滤器,一个用于查询文档中的每个键。然后优化器将每个筛选器移动到尽可能多的投影阶段之前,根据需要创建新的阶段。鉴于此示例,优化程序生成以下优化管道:
过滤器{ avgTime: { $gt: 7 } }
取决于阶段来计算avgTime
字段。 阶段是此管道中的最后一个投影阶段,因此avgTime
上的过滤器无法移动。
maxTime
和minTime
字段在阶段计算,但不依赖于阶段。优化器为这些字段上的过滤器创建了一个新的阶段,并将其放在阶段之前。
过滤器{ name: "Joe Schmoe" }
不使用在或阶段计算的任何值,因此它在两个投影阶段之前被移动到新的阶段。
优化后,过滤器{ name: "Joe Schmoe" }
位于管道开头的阶段。这具有额外的好处,即允许聚合在最初查询集合时在name
字段上使用索引。有关更多信息,请参见。
如果序列中带有后跟,则会移动到之前,以最大程度的减少要排序的对象的数量。例如,如果管道包含以下阶段:
如果可能,当管道的阶段紧在阶段之后时,聚合有时可以在阶段之前添加阶段的一部分。如果添加的阶段位于管道的开头,则聚合可以使用索引以及查询集合来限制进入管道的文档数。有关更多信息,请参见。 例如,如果管道包含以下阶段:
优化器可以在阶段之前添加相同的阶段:
当有一个或之后跟有序列时, 会移至之前。例如,如果管道包括以下阶段:
当一个先于,优化器可以聚结到,如果没有中间阶段的修改文件(例如,使用数,)。如果有管道阶段会更改和阶段之间的文档数,则MongoDB将不会合并到 。
这样,排序操作就可以仅在执行过程中保持最高n
结果,这n
是指定的限制,MongoDB仅需要将n
项目存储在内存中 。有关更多信息,请参见。
如果在 和阶段之间有一个阶段,MongoDB将合并 到该阶段并增加该 值。有关示例,请参见 。
当优化仍将适用 allowDiskUse
是true
与n
项目超过 。
当紧接着另一个时 ,两个阶段可以合并为一个阶段 ,其中限制量为两个初始限制量中的较小者。例如,管道包含以下序列:
然后,第二级可以聚结到第一 阶段,并导致在单个 阶段,即限制量10
是两个初始极限的最小100
和10
。
当紧跟另一个,这两个阶段可合并成一个单一的,其中跳过量为总和的两个初始跳过量。例如,管道包含以下序列:
然后,第二阶段可以合并到第一 阶段,并导致单个 阶段,其中跳过量7
是两个初始限制5
和的总和2
。
当一个紧随另一个紧随其后时 ,这两个阶段可以合并为一个单独 的条件 。例如,管道包含以下序列:
然后,第二阶段可以合并到第一 阶段,从而形成一个 阶段
当a 立即紧随其后 ,并且在 领域运行时,优化程序可以将其合并 到阶段中。这样可以避免创建较大的中间文档。as
优化器可以将阶段合并为 阶段。如果使用explain
选项运行聚合,则explain
输出将显示合并阶段:
管道包含一系列交替的和阶段:
反转{ $skip: 5 }
和{ $limit: 10 }
阶段的位置并增加限制量:
然后,优化器将两个阶段合并为一个阶段,将两个阶段合并为一个阶段。结果序列如下:
有关详细信息,请参阅和。
中的选项