Si vous souhaitez obtenir une liste d'identiques (sauf pour le _id
domaine, évidemment) des documents de votre collection, voici comment procéder :
collection.aggregate({
$project: {
"_id": 1, // keep the _id field where it is anyway
"doc": "$$ROOT" // store the entire document in the "doc" field
}
}, {
$project: {
"doc._id": 0 // remove the _id from the stored document because we do not want to compare it
}
}, {
$group: {
"_id": "$doc", // group by the entire document's contents as in "compare the whole document"
"ids": { $push: "$_id" }, // create an array of all IDs that form this group
"count": { $sum: 1 } // count the number of documents in this group
}
}, {
$match: {
"count": { $gt: 1 } // only show what's duplicated
}
})
Comme toujours avec le cadre d'agrégation, vous pouvez essayer de donner un sens à ce qui se passe exactement à chaque étape en commentant toutes les étapes, puis en réactivant tout étape par étape.