MongoDB
 sql >> Base de données >  >> NoSQL >> MongoDB

Comment regrouper par différents champs

Ça était difficile !

Tout d'abord, la simple solution :

db.test.aggregate([
 { "$match": { "user": "Hans" } },
 // duplicate each document: one for "age", the other for "childs"
 { $project: { age: "$age", childs: "$childs",
               data: {$literal: ["age", "childs"]}}},
 { $unwind: "$data" },
 // pivot data to something like { data: "age", value: "40" }
 { $project: { data: "$data",
               value: {$cond: [{$eq: ["$data", "age"]},
                               "$age", 
                               "$childs"]} }},
 // Group by data type, and count
 { $group: { _id: {data: "$data", value: "$value" }, 
             count: { $sum: 1 }, 
             value: {$first: "$value"} }},
 // aggregate values in an array for each independant (type,value) pair
 { $group: { _id: "$_id.data", values: { $push: { count: "$count", value: "$value" }} }} ,
 // project value to the correctly name field
 { $project: { result: {$cond: [{$eq: ["$_id", "age"]},
                               {age: "$values" }, 
                               {childs: "$values"}]} }},
 // group all data in the result array, and remove unneeded `_id` field 
 { $group: { _id: null, result: { $push: "$result" }}},
 { $project: { _id: 0, result: 1}}
])

Production :

{
    "result" : [
        {
            "age" : [
                {
                    "count" : 3,
                    "value" : "40"
                },
                {
                    "count" : 1,
                    "value" : "50"
                }
            ]
        },
        {
            "childs" : [
                {
                    "count" : 1,
                    "value" : "1"
                },
                {
                    "count" : 3,
                    "value" : "2"
                }
            ]
        }
    ]
}

Et maintenant, quelques explications :

L'un des principaux problèmes ici est que chaque document entrant doit faire partie de deux des sommes différentes. J'ai résolu cela en ajoutant un tableau littéral ["age", "childs"] à vos documents, puis en les déroulant par ce tableau. Ainsi, chaque document sera présenté deux fois à un stade ultérieur.

Une fois cela fait, pour faciliter le traitement, je change la représentation des données en quelque chose de beaucoup plus gérable comme { data: "age", value: "40" }

Les étapes suivantes effectueront l'agrégation des données proprement dite. Jusqu'au troisième $project étape qui mappera les champs de valeur à l'age correspondant ou childs champ.

Les deux dernières étapes envelopperont simplement les deux documents en un seul, en supprimant le _id inutile champ.

Pfff !