L'idée est d'améliorer les performances des requêtes d'agrégation en utilisant MapReduce sur une base de données partitionnée distribuée sur plusieurs machines.
J'ai fait quelques comparaisons des performances de Mapreduce de Mongo avec une instruction group-by-select dans Oracle sur la même machine. J'ai trouvé que Mongo était environ 25 fois plus lent. Cela signifie que je dois répartir les données sur au moins 25 machines pour obtenir les mêmes performances avec Mongo qu'Oracle sur une seule machine. J'ai utilisé une collection/table avec environ 14 millions de documents/lignes.
Exporter les données de mongo via mongoexport.exe et utiliser les données exportées en tant que table externe dans Oracle et effectuer un regroupement dans Oracle était beaucoup plus rapide que d'utiliser le propre MapReduce de Mongo.