Si vos données comme celle-ci
tweets = sc.parallelize(["title1", "", "title2", "title3", ""])
vous pouvez utiliser len(x)
comme condition de filtre :
tweets.filter(lambda x: len(x) > 0).count()
Si vos données comme celle-ci
tweets = sc.parallelize(["title1", "", "title2", "title3", ""])
vous pouvez utiliser len(x)
comme condition de filtre :
tweets.filter(lambda x: len(x) > 0).count()