聚合管道快速参考
在本页面
有关特定运算符的详细信息,包括语法和示例,请单击特定的运算符以转到其参考页面。
阶段
阶段(db.collection.aggregate)
在db.collection.aggregate方法中,管道阶段出现在数组中。文档按顺序通过各个阶段。除$out, $merge和$geoNear阶段之外的所有阶段都可以在管道中多次出现。
阶段 | 描述 |
---|---|
向文档添加新字段。类似于$project,$addFields重塑了流中的每个文档;具体而言,通过向输出文档添加新字段,该文档包含输入文档和新添加字段中的现有字段。 | |
根据指定的表达式和存储区边界,将传入的文档分组,称为bucket。 | |
根据指定的表达式将传入的文档分类为特定数量的组(称为bucket)。自动确定bucket边界,以便将文档均匀地分配到指定数量的bucket中。 | |
返回有关集合或视图的统计信息。 | |
返回聚合管道此阶段的文档数量计数。 | |
在同一组输入文档的单个阶段内处理多个聚合管道。允许创建能够在单个阶段中跨多个维度或方面描述数据的多面聚合。 | |
对集合执行递归搜索。对于每个输出文档,添加一个新的数组字段,该字段包含该文档的递归搜索的遍历结果。 | |
按指定的标识符表达式对文档进行分组,并将累加器表达式(如果指定)应用于每个组。使用所有输入文档并为每个不同的组输出一个文档。输出文档只包含标识符字段和累积字段(如果指定的话)。 | |
返回有关集合的每个索引的使用情况的统计信息。 | |
将未修改的前 n 个文档传递给管道,其中 n 是指定的限制。对于每个输入文档,输出一个文档(对于前 n 个文档)或零文档(在前 n 个文档之后)。 | |
列出足以传播到 | |
对同一数据库中的另一个集合执行左外连接,从“已连接”集合中过滤文档以进行处理。 | |
过滤文档流以仅允许匹配的文档未经修改地传递到下一个管道阶段。 $match使用标准的 MongoDB 查询。对于每个输入文档,输出一个文档(匹配)或零文档(不匹配)。 | |
将聚合管道的结果文档写入集合。这个阶段可以将结果合并到一个输出集合中(插入新文档、合并文档、替换文档、保留现有文档、操作失败、使用自定义更新管道处理文档)。要使用 | |
将聚合管道的结果文档写入集合。要使用$out阶段,它必须是管道中的最后一个阶段。 | |
返回集合的计划缓存信息。 | |
重新整形流中的每个文档,例如添加新字段或删除现有字段。对于每个输入文档,输出一个文档。 有关删除现有字段,请参见 | |
用指定的嵌入文档替换文档。该操作将替换输入文档中的所有现有字段,包括 | |
用指定的嵌入文档替换文档。该操作将替换输入文档中的所有现有字段,包括 | |
从输入中随机选择指定数量的文档。 | |
向文档添加新字段。与 | |
跳过前 n 个文档,其中 n 是指定的跳过编号,并将其余未修改的文档传递给管道。对于每个输入文档,输出零文档(对于前 n 个文档)或一个文档(如果在前 n 个文档之后)。 | |
按指定的排序键重新排序文档。只有顺序改变;文件保持不变。对于每个输入文档,输出一个文档。 | |
根据指定表达式的值对传入文档进行分组,然后计算每个不同组中的文档计数。 | |
执行两个集合的并集;例如,将来自两个集合的管道结果组合成一个结果集。 version 4.4 中的新功能 | |
从文档中移除/排除字段。 | |
解析输入文档中的数组字段,为每个元素输出一个文档。每个输出文档用一个元素值替换数组。对于每个输入文档,输出n个文档,其中n是数组元素的数量,对于空数组可以为零。 |
阶段(db.aggregate)
从 version 3.6 开始,MongoDB 也提供了db.aggregate方法:
以下阶段使用db.aggregate()方法而不是db.collection.aggregate()方法。
阶段 | 描述 |
---|---|
返回有关 MongoDB 部署的活动 and/or 休眠操作的信息。 | |
阶段可用更新
从MongoDB 4.2开始,你可以使用聚合管道更新:
命令 | mongo Shell 方法 |
---|---|
对于更新,管道可以包括以下阶段:
$addFields
及其别名$set
[success] 也可以看看
表达式
表达式可以包括字段路径,Literals,系统变量,表达对象和表达式操作符。表达式可以嵌套。
字段路径
聚合表达式使用字段路径来访问输入文档中的字段。要指定字段路径,请在字段名或虚线字段名(如果字段在嵌入的文档中)前加上美元符号$。例如,“$user
”指定用户字段的字段路径,“$user.name
”指定“user.name
”字段的字段路径。
"$<field>"
等效于"$$CURRENT.<field>"
,其中CURRENT是系统变量,默认为当前对象的根,除非在特定阶段另有说明。
聚合变量
MongoDB提供了在表达式中使用的各种聚合系统变量。要访问变量,请在变量名前加上$$
。例如:
变量 | 通过$$访问 | 简介/描述 |
---|---|---|
$$NOW | 返回当前的日期时间值,该值在部署的所有成员之间是相同的,并在整个聚合管道中保持不变。(4.2 + 版本中可用) | |
$$CLUSTER_TIME | 返回当前时间戳值,该值在部署的所有成员之间是相同的,并在整个聚合管道中保持不变。仅用于复制集和分片集群。(4.2 + 版本中可用) | |
$$ROOT | 引用根文档,即:顶级文档。 | |
$$CURRENT | 引用字段路径的开始,默认情况下该路径是ROOT,但可以更改。 | |
$$REMOVE | 允许有条件地排除字段。(3.6 + 版本中可用) | |
$$DESCEND |
| |
$$PRUNE |
| |
$$KEEP |
|
有关这些变量的更详细描述,请参阅系统变量。
Literals
Literals 可以是任何类型。但是,MongoDB将以美元符号$
开头的字符串字面值作为字段的路径,并将表达式对象中的数值/布尔字面值作为投影标志。为了避免解析文字,可以使用$literal表达式。
表达式对象
表达式对象具有以下形式:
如果表达式是数值型或 boolean 型文字,MongoDB 将 literals 视为投影标志(例如: 1
或true
包括该字段),仅在$project阶段有效。要避免将数值或 boolean 型文字视为投影标志,请使用$literal表达式来包装数值型或 boolean 文字型。
运算符表达式
在这个部分
运算符表达式与采用带参数的函数类似。通常,这些表达式有一个数组参数 并具有以下形式:
如果操作符接受单个参数,则可以省略指定参数列表的外部数组:
如果参数是文字数组,为了避免解析歧义,必须将文字数组包装在$literal表达式中,或者保留指定参数列表的外部数组。
算数表达式运算符
算术表达式对数字执行数学运算。一些算术表达式也可以支持日期算术。
名称 | 描述 |
---|---|
返回数字的绝对值。 | |
添加 numbers 以返回总和,或添加 numbers 和 date 以返回新的 date。如果添加 numbers 和 date,则将 numbers 视为毫秒。接受任意数量的参数表达式,但最多只能有一个表达式解析为 date。 | |
返回大于或等于指定数字的最小整数。 | |
返回将第一个数除以第二个数的结果。接受两个参数表达式。 | |
将 e 提高到指定的指数。 | |
返回小于或等于指定数字的最大整数。 | |
计算数字的自然对数。 | |
计算指定基数中的数字的对数。 | |
计算以10为底的对数。 | |
返回第一个数字除以第二个数字的余数。接受两个参数表达式。 | |
将数字相乘返回乘积。接受任意数量的参数表达式。 | |
将数字提高到指定的指数。 | |
将数字四舍五入为整数或指定的小数位。 | |
计算平方根。 | |
返回从第一个值中减去第二个值的结果。如果这两个值是数字,返回差值。如果这两个值是日期,则返回差值(以毫秒为单位)。如果这两个值是日期和一个以毫秒为单位的数字,返回结果日期。接受两个参数表达式。如果这两个值是日期和数字,请首先指定 date 参数,因为从数字中减去 date 没有意义。 | |
将数字截断为整数或指定的小数位。 |
数组表达式运算符
名称 | 描述 |
---|---|
返回指定的数组索引处的元素。 | |
将键值对的数组转换为文档。 | |
连接数组以返回连接的数组。 | |
选择 array 的子集以 return array 仅包含 match 过滤条件的元素。 | |
返回第一个数组元素,不同于$first累加器 | |
返回一个 boolean 值,指示指定的值是否在列表中。 | |
搜索列表以查找指定值的出现并返回第一个匹配项的数组索引。如果未找到子字符串,则返回 | |
确定操作数是否为数组。返回 boolean 值。 | |
返回最后一个数组元素,不同于$last累加器。 | |
将子表达式应用于数组的每个元素,并按顺序返回结果值的数组。接受命名参数。 | |
将文档转换为表示键值对的文档的数组。 | |
根据用户定义的输入输出包含整数序列的数组。 | |
将表达式应用于数组中的每个元素,并将它们组合为单个值。 | |
返回元素顺序相反的数组。 | |
返回数组中的元素数。接受单个表达式作为参数。 | |
返回数组的子集。 | |
将两个数组合并在一起。 |
布尔表达式运算符
Boolean 表达式将其参数表达式计算为布尔值,并返回一个boolean值作为结果。
除了false
布尔值之外,Boolean 表达式的计算结果如下:null
,0
和undefined
值。 Boolean 表达式将所有其他值计算为true
,包括非零数值和数组。
名称 | 描述 |
---|---|
仅当其所有表达式求值为 | |
返回与其参数表达式相反的 boolean 值。接受单个参数表达式。 | |
当其表达式的值为 |
比较表达式运算符
比较表达式返回一个布尔值,除了$cmp,它返回一个数字。
比较表达式采用两个参数表达式并对值和类型进行比较,使用指定的 BSON 比较顺序表示不同类型的值。
名称 | 描述 |
---|---|
如果两个值相等则返回 | |
如果值相等,则返回 | |
如果第一个值大于第二个,则返回 | |
如果第一个值大于或等于第二个,则返回 | |
如果第一个值小于第二个,则返回 | |
如果第一个值小于或等于第二个值,则返回 | |
如果值不相等,则返回 |
条件表达式运算符
名称 | 描述 |
---|---|
对一个表达式求值的三元运算符,并根据结果返回另外两个表达式之一的值。接受有序列表中的三个表达式或三个命名参数。 | |
返回第一个表达式的非空结果,如果第一个表达式的结果为空,则返回第二个表达式的结果。Null结果包含未定义值或缺少字段的实例。接受两个表达式作为参数。第二个表达式的结果可以为null。 | |
计算一系列用例表达。当它找到一个计算结果为 |
自定义聚合表达式运算符
名称 | 描述 |
---|---|
定义一个自定义累加器函数 version 4.4 新功能 | |
定义一个自定义函数 version 4.4 新功能 |
数据大小表达式运算符
以下运算符返回数据元素的大小:
名称 | 描述 |
---|---|
返回给定字符串或二进制数据值内容的字节大小。 | |
返回编码为BSON的给定文档(例如:bsontype对象)的字节大小。 |
日期表达式运算符
以下操作符返回 date 对象或 date 对象的组件:
名称 | 描述 |
---|---|
给出日期的组成部分,构造一个 BSON Date 对象。 | |
将 date/time 字符串转换为 date 对象。 | |
返回包含日期组成部分的文档。 | |
将 date 作为格式化的字符串返回。 | |
将 date 的月中某天返回为 1 到 31 之间的数字。 | |
将 date 的星期几返回为 1(星期日)和 7(星期六)之间的数字。 | |
将 date 的年中日期作为 1 到 366(闰年)之间的数字返回。 | |
将 date 的小时数作为 0 到 23 之间的数字返回。 | |
返回 ISO 8601 格式的工作日编号,范围从 | |
返回 ISO 8601 格式的周数,范围从 | |
以 ISO 8601 格式返回年份编号。年份从第 1 周的星期一(ISO 8601)开始,结束于上周的星期日(ISO 8601)。 | |
返回 date 的毫秒数,作为 0 到 999 之间的数字。 | |
将 date 的分钟作为 0 到 59 之间的数字返回。 | |
将 date 的月份返回为 1(1 月)和 12(12 月)之间的数字。 | |
返回 date 的秒数,作为 0 到 60 之间的数字(闰秒)。 | |
将值转换为日期。 version 4.0 中的新功能。 | |
返回日期的周数,该数字介于0(一年的第一个星期日之前的部分周)和53(闰年)之间。 | |
将日期的年份作为数字返回(例: 2014)。 |
以下算术运算符可以使用日期操作数:
名称 | 描述 |
---|---|
添加数字和日期以返回新的日期。如果添加数字和日期,则将这些数字视为毫秒。接受任意数量的参数表达式,但一个表达式最多只能解析一个日期。 | |
返回从第一个值减去第二个值的结果。如果这两个值是日期,则返回差值(以毫秒为单位)。如果这两个值是日期和一个以毫秒为单位的数字,则返回结果日期。接受两个参数表达式。如果这两个值是日期和数字,请首先指定日期参数,因为从数字中减去日期没有意义。 |
文字表达式运算符
对象表达式运算符
名称 | 描述 |
---|---|
将多个文档合并为一个文档。 version 3.6 中的新内容。 | |
将文档转换为表示键值对的文档的数组。 version 3.6 中的新内容。 |
集合表达式运算符
Set 表达式对数组执行 set 操作,将数组视为集合。 Set 表达式忽略每个输入数组中的重复条目和元素的顺序。
如果 set 操作返回一个集合,则该操作会过滤掉结果中的重复项,以输出仅包含唯一条目的数组。输出数组中元素的顺序未指定。
如果集合包含嵌套的数组元素,则 set 表达式不会深入到嵌套的数组中,而是在最外层处计算数组。
名称 | 描述 |
---|---|
如果没有集合的元素计算为 | |
如果集合中的任意一个元素求值为 | |
返回一个集合,其中的元素出现在第一个集合中但不出现在第二个集合中;即:执行第二个集合相对于第一个集合的相对补充。接受两个参数表达式。 | |
如果输入 sets 具有相同的不同元素,则返回 | |
返回一个包含所有输入 sets 中出现的元素的集合。接受任意数量的参数表达式。 | |
如果第一组的所有元素出现在第二组中,包括第一个集合和第二个集合相等时,则返回 | |
返回包含出现在任何输入集合中的元素的集合。 |
字符串表达式运算符
除了$concat之外,字符串表达式只对ASCII字符的字符串具有定义良好的行为。
无论使用哪个字符,$concat行为都是定义良好的。
名称 | 描述 |
---|---|
连接任意数量的 strings。 | |
将 date/time string 转换为 date object。 | |
将 date 作为格式化的 string 返回。 | |
搜索 string 以查找子字符串的出现并返回第一次出现的 UTF-8 字节索引。如果未找到子字符串,则返回 | |
搜索 string 以查找子字符串的出现并返回第一次出现的 UTF-8 code 点索引。如果找不到子字符串,则返回 | |
根据分隔符将 string 拆分为子字符串。返回子字符串的 array。如果在 string 中找不到分隔符,则返回包含原始 string 的 array。 | |
返回 string 中 UTF-8 编码字节的数量。 | |
返回 string 中 UTF-8 code 点的数量。 | |
执行 case-insensitive string 比较并返回:如果两个 strings 相等则返回 | |
已过时。使用$substrBytes或$substrCP。 | |
返回 string 的子字符串。从 string 中指定的 UTF-8 字节索引(zero-based)处的字符开始,并继续指定的字节数。 | |
返回 string 的子字符串。从 string 中指定的 UTF-8 code point(CP)索引(zero-based)处的字符开始,并继续指定的 code 点数。 | |
将 string 转换为小写。接受单个参数表达式。 | |
将 string 转换为大写。接受单个参数表达式。 |
文本表达式运算符
名称 | 描述 |
---|---|
访问文本搜索元数据。 |
角度表达式运算符
名称 | 描述 |
---|---|
返回该字段的 BSON 数据类型。 |
[](s
累加器($group)
可以在$group阶段使用,累加器是 operators,它们在文档通过管道时保持其 state(例: 总计,最大值,最小值和相关数据)。
当在$group阶段用作累加器时,这些 operators 将单个表达式作为输入,为每个输入文档计算一次表达式,并为共享相同 group key 的 group 文档保持其阶段。
名称 | 描述 |
---|---|
返回每个 group 的唯一表达式值的 array。 _Oray 元素的 Order 是未定义的。 | |
返回数值的平均值。忽略 non-numeric 值。 | |
从每个 group 的第一个文档返回一个 value。仅当文档位于已定义的 order 中时才定义 Order。 | |
从每个 group 的最后一个文档返回一个 value。仅当文档位于已定义的 order 中时才定义 Order。 | |
返回每个 group 的最高表达式 value。 | |
返回通过组合每个 group 的输入文档创建的文档。 | |
返回每个 group 的最低表达式 value。 | |
返回每个 group 的表达式值的 array。 | |
返回输入值的总体标准偏差。 | |
返回输入值的 sample 标准偏差。 | |
返回数值的总和。忽略 non-numeric 值。 |
累加器($project 和$addFields)
一些可用作$group阶段累加器的运算符也可用于$project和$addFields阶段,但不能用作累加器。在$project和$addFields阶段使用时,这些 operators 不会维护它们的 state,并且可以将单个参数或多个 arguments 作为输入。
更改了 version 3.2.
以下累加器 operators 也可用于$project和$addFields阶段。
名称 | 描述 |
---|---|
返回每个文档的指定表达式或表达式列表的平均值。忽略 non-numeric 值。 | |
返回每个文档的指定表达式或表达式列表的最大值 | |
返回每个文档的指定表达式或表达式列表的最小值 | |
返回输入值的总体标准偏差。 | |
返回输入值的 sample 标准偏差。 | |
返回数值的总和。忽略 non-numeric 值。 |
变量表达式运算符
名称 | 描述 |
---|---|
定义在子表达式范围内使用的变量,并返回子表达式的结果。接受命名参数。 接受任意数量的参数表达式。 |
表达式运算符的索引
译者:李冠飞
校对:
最后更新于