-
Convertissez le fichier XML en fichier CSV. De plus, lors de la conversion, divisez-le en parties de 100 Mo à 1 Go pour faciliter le traitement par lots.
-
Créez le tableau avec les colonnes que vous avez définies dans le fichier CSV.
-
Téléchargez le ou les fichiers dans Postgres avec COPY command.C'est le moyen le plus rapide de télécharger une grande quantité de données que je connais.BTW, cela pourrait aussi être fait à partir de Java, avec CopyManager classe.
Selon le type de requêtes que vous effectuerez, vous aimerez créer des index :
-
Ce sera la partie la plus chronophage. Cependant, vous pouvez utiliser CREATE INDEX CONCURRENTLY . Cela vous permettra de travailler avec votre table pendant que l'index est créé en arrière-plan.
-
Si vous répétez le processus d'importation et que la table et les index ont déjà été créés, supprimez les index avant d'émettre la commande COPY et recréez-les ultérieurement. Cela vous fera gagner beaucoup de temps.
-
Si vous n'êtes toujours pas satisfait de la vitesse de vos requêtes ou de la vitesse de création des index, ce sera peut-être une bonne idée d'utiliser Clickhouse Au lieu. Cependant, cela dépend du type de requêtes que vous effectuez.