MongoDB stocke les données dans un format totalement différent, appelé BSON, qui va occuper plus d'espace disque. Non seulement les valeurs doivent être stockées pour chaque champ, mais il faudra également stocker à nouveau les noms de colonne dans chaque document (ligne). Si vous avez de grands noms de colonnes, cela peut certainement augmenter la taille dans MongoDB à 8 à 10 fois celle de votre fichier CSV. Si possible, vous pouvez envisager de raccourcir vos noms de champs si c'est trop pour vous.
MongoDB préalloue également fichiers de données pour vous. Par exemple, le moment où il commence à ajouter des données à taq.2
, il créera taq.3
, et de même lorsqu'il commence à écrire dans taq.4
il crée tag.5
. Donc, dans votre cas, disons que votre fichier de 230 Mo créerait 1,9 Go de données, MongoDB a déjà alloué le taq.5
de taille 2.0G . Ce comportement peut être désactivé en spécifiant --noprealloc
sur la ligne de commande au démarrage de mongod
.