Mysql
 sql >> Base de données >  >> RDS >> Mysql

Spark JoinWithCassandraTable sur la clé de partition TimeStamp STUCK

En utilisant :

sc.parallelize(startDate to endDate)

Avec startData et endDate comme Longs générés à partir de Dates par le format :

("yyyy-MM-dd HH:mm:ss")

J'ai créé une étincelle pour créer un énorme tableau (plus de 100 000 objets) à joindre à la table C * et cela ne s'est pas bloqué du tout - C * a travaillé dur pour que la jointure se produise et renvoie les données.

Enfin, j'ai changé ma gamme en :

case class TableKey(created_dh: String)
val data = Array("2015-10-29 12:00:00", "2015-10-29 13:00:00", "2015-10-29 14:00:00", "2015-10-29 15:00:00")
val snapshotsFiltered = sc.parallelize(data, 2).map(TableKey(_)).joinWithCassandraTable("listener","snapshots_tnew")

Et tout va bien maintenant.