Quelle base de données choisir (Cassandra, MongoDB, ?) pour stocker et interroger les données événementielles / log / métriques ?

"Grouper par" et "bêtement rapide" ne vont pas ensemble. C'est juste la nature de cette bête... D'où les limites de l'opération de groupe de Mongo; Cassandra ne le prend même pas en charge nativement (bien que ce soit le cas pour les requêtes Hive ou Pig via Hadoop... mais celles-ci ne sont pas censées être stupidement rapides).