"Grouper par" et "bêtement rapide" ne vont pas ensemble. C'est juste la nature de cette bête... D'où les limites de l'opération de groupe de Mongo; Cassandra ne le prend même pas en charge nativement (bien que ce soit le cas pour les requêtes Hive ou Pig via Hadoop... mais celles-ci ne sont pas censées être stupidement rapides).
Des systèmes comme Rainbird de Twitter (qui utilise Cassandra) effectuant des analyses en temps réel le font en dénormalisant/pré-calculant les décomptes :http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011