批量数据导入性能的方法(怎么批量导入数据)

关键字：批量数据导入，数据加载，大量插入，加快，提升速度

多元化选择时代，人生里很多事物都是如此，凡事都没有一成不变的方式和方法。不管白猫黑猫，能抓老鼠的就是好猫，适合自己的就是最好的。

提升批量数据导入的方法亦是如此，没有何种方法是最优的，应用任何方法前根据自己的实际情况权衡利弊，做出选择。

批量导入数据之前，无论采取何种方式，务必做好相应的备份。

导入完成后亦需对相应对象进行ANALYZE操作，这样查询优化器才会按照最新的统计信息生成正确的执行计划。

下面正式介绍提升批量数据导入性能的n种方法。

方法1：禁用自动提交。

psql
\setAUTOCOMMIToff

其他
BEGIN;
执行批量数据导入
COMMIT;

方法2：设置表为UNLOGGED。

导入数据之前先把表改成UNLOGGED模式，导入完成后改回LOGGED模式。

ALTERTABLEtablenameSETUNLOGGED;
执行批量数据导入
ALTERTABLEtablenameLOGGED;

优点：

导入信息不记录WAL日志，极大减少io，提升导入速度。

缺点：

1.在replication环境下，表无法设置为UNLOGGED模式。

2.导入过程一旦出现停电死机等会导致数据库不能干净关库的情况，数据库中所有UNLOGGED表的数据将丢失。

方法3：重建索引。

导入数据之前先删除相关表上的索引，导入完成后重新创建之。

DROPINDEXindexname;
执行批量数据导入
CREATEINDEX...;

查询表上索引定义的方法

1select*frompg_indexeswheretablename='tablename'andschemaname='schemaname';

方法4：重建外键。

导入数据之前先删除相关表上的外键，导入完成后重新创建之。

ALTERTABLE...
DROPCONSTRAINT...;
执行批量数据导入
ALTERTABLE...
ADDCONSTRAINT...
FOREIGNKEY...
REFERENCES...;