MongoDB
 sql >> Base de données >  >> NoSQL >> MongoDB

Quelle base de données choisir (Cassandra, MongoDB, ?) pour stocker et interroger les données événementielles / log / métriques ?

"Grouper par" et "bêtement rapide" ne vont pas ensemble. C'est juste la nature de cette bête... D'où les limites de l'opération de groupe de Mongo; Cassandra ne le prend même pas en charge nativement (bien que ce soit le cas pour les requêtes Hive ou Pig via Hadoop... mais celles-ci ne sont pas censées être stupidement rapides).

Des systèmes comme Rainbird de Twitter (qui utilise Cassandra) effectuant des analyses en temps réel le font en dénormalisant/pré-calculant les décomptes :http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011