PostgreSQL
 sql >> Base de données >  >> RDS >> PostgreSQL

Paramètre de taille de bloc optimal dans pandas.DataFrame.to_sql

Dans mon cas, 3 millions de lignes ayant 5 colonnes ont été insérées en 8 minutes lorsque j'ai utilisé pandas to_sql paramètres de fonction comme chunksize=5000 et method='multi'. C'était une énorme amélioration car l'insertion de lignes 3M en utilisant python dans la base de données devenait très difficile pour moi.