MongoDB
 sql >> Base de données >  >> NoSQL >> MongoDB

Valeurs distinctes d'une clé dans un sous-document MongoDB (100 millions d'enregistrements)

J'ai essayé la solution que j'ai trouvée ici et ça a bien fonctionné :) .. Je vais garder le fil et ajouter mon code au cas où quelqu'un en aurait besoin.

var SOURCE = db.sample;
var DEST = db.distinct;
DEST.drop();
map = function() {
  emit( this.user.screen_name , {count: 1});
}

reduce = function(key, values) {
  var count = 0;

  values.forEach(function(v) {
    count += v['count'];   
  });

  return {count: count};
};

res = SOURCE.mapReduce( map, reduce, 
    { out: 'distinct', 
     verbose: true
    }
    );

print( "distinct count= " + res.counts.output );
print( "distinct count=", DEST.count() );

Cordialement