MongoDB
 sql >> Base de données >  >> NoSQL >> MongoDB

Partitionner les données autour d'une requête de correspondance lors de l'agrégation

Cette agrégation donne le résultat souhaité.

db.posts.aggregate( [
{ $match:  { updatedAt: { $gte: 1549786260000 } } },
{ $facet: {
        FALSE: [
            { $match: { toggle: false } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : 1 } } },
        ],
        TRUE: [
            { $match: { toggle: true, status: "INACTIVE" } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : -1 } } },
        ]
} },
{ $project: { result: { $concatArrays: [ "$FALSE", "$TRUE" ] } } },
{ $unwind: "$result" },
{ $replaceRoot: { newRoot: "$result" } },
{ $group : { _id : "$_id", count: { $sum : "$count" } } },
{ $project:{ _id: 0, iid: "$_id.iid", pid: "$_id.pid", count: 1 } }
] )


Le résultat de la requête utilisant les données d'entrée de la question :

{ "count" : 1, "iid" : "INT123", "pid" : "P789" }
{ "count" : 1, "iid" : "INT123", "pid" : "P123" }
{ "count" : 0, "iid" : "INT789", "pid" : "P789" }
{ "count" : 1, "iid" : "INT456", "pid" : "P789" }


[ MODIFIER AJOUTER 2 ]

Cette requête obtient le même résultat avec une approche (code) différente :

db.posts.aggregate( [
  { 
      $match:  { updatedAt: { $gte: 1549786260000 } } 
  },
  { 
      $unwind : "$interests" 
  },
  { 
      $group : { 
          _id : { 
              iid: "$interests", 
              pid: "$publisher" 
          }, 
          count: { 
              $sum: {
                  $switch: {
                      branches: [
                        { case: { $eq: [ "$toggle", false ] },
                           then: 1 },
                        { case: { $and: [ { $eq: [ "$toggle", true] },  { $eq: [ "$status", "INACTIVE" ] } ] },
                           then: -1 }
                      ]
                  }          
              } 
          }
      } 
  },
  { 
      $project:{
           _id: 0, 
           iid: "$_id.iid", 
           pid: "$_id.pid", 
           count: 1 
      } 
  }
] )


REMARQUE :

La requête de facette exécute les deux facettes (TRUE et FALSE) sur le même ensemble de documents ; c'est comme deux requêtes exécutées en parallèle. Cependant, il existe une duplication de code ainsi que des étapes supplémentaires pour façonner les documents dans le pipeline afin d'obtenir le résultat souhaité.

La deuxième requête évite la duplication de code et il y a beaucoup moins d'étapes dans le pipeline d'agrégation. Cela fera la différence lorsque l'ensemble de données d'entrée a un grand nombre de documents à traiter - en termes de performances. En général, moins d'étapes signifie moins d'itérations des documents (car une étape doit numériser les documents qui sont sortis de l'étape précédente).