資料庫批量資料插入問題分析

在資料庫的相關開發中，經常會遇到資料的批量插入問題。本文主要是通過實驗的方式探讨批量資料插入的瓶頸，以及優化建議。

以10w條記錄的插入作為實驗對象，采用下面的幾種方法插入：

1. 普通插入：普通的一條條插入

2. 普通插入+手動送出：setAutoCommit(false)、commit（）

3. 普通插入+手動送出+ prepareStatement方式

4. 批量插入：addBatch、executeBatch

5. 批量插入：insert into tableName (x,xx,xxx) values(x,xx,xxx),(xx,xxx,xxxx)…,

6. 多線程插入。

7. InnoDB引擎和MyISAM引擎的比較。

實驗環境：

資料庫：MySQL 5.0

機器硬體：

記憶體 3G

CPU AMD雙核4400+ 2.3G

首先建立一個簡單的user表：

CREATE TABLE `user` (

`id` varchar(50) NOT NULL,

`seqid` bigint(20) NOT NULL auto_increment,

`name` varchar(50) NOT NULL,

PRIMARY KEY (`seqid`)

) ENGINE=MyISAM DEFAULT CHARSET=utf8

一、普通插入

代碼：

資料庫批量資料插入問題分析

Connection conn=source.getConnection();

資料庫批量資料插入問題分析

Statement s=conn.createStatement();

資料庫批量資料插入問題分析

String sql="";

資料庫批量資料插入問題分析

long start=System.currentTimeMillis();

資料庫批量資料插入問題分析

for(int i=0;i<100000;i++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

sql="insert into user(id,name) value('"+(i+1)+"','chenxinhan')";

資料庫批量資料插入問題分析

s.execute(sql);

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.close();

資料庫批量資料插入問題分析

conn.close();

資料庫批量資料插入問題分析

long end=System.currentTimeMillis();

資料庫批量資料插入問題分析

System.out.println("commonInsert()執行時間為："+(end-start)+"ms"); 輸出結果：

commonInsert()執行時間為：13828ms

二、普通插入+手動送出：setAutoCommit(false)、commit()

代碼： 1

資料庫批量資料插入問題分析

Connection conn=source.getConnection();

資料庫批量資料插入問題分析

conn.setAutoCommit(false);

資料庫批量資料插入問題分析

Statement s=conn.createStatement();

資料庫批量資料插入問題分析

String sql="";

資料庫批量資料插入問題分析

long start=System.currentTimeMillis();

資料庫批量資料插入問題分析

for(int i=0;i<100000;i++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

sql="insert into user(id,name) value('"+(i+1)+"','chenxinhan')";

資料庫批量資料插入問題分析

s.execute(sql);

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

conn.commit();

資料庫批量資料插入問題分析

s.close();

資料庫批量資料插入問題分析

conn.close();

資料庫批量資料插入問題分析

long end=System.currentTimeMillis();

資料庫批量資料插入問題分析

System.out.println("commonInsert()執行時間為："+(end-start)+"ms"); 輸出結果：

commonInsert()執行時間為：13813ms

對比分析：

可以看出，僅僅是這種方式的設定，對性能的影響并不大。

三、普通插入+手動送出+ prepareStatement方式

代碼： 1

資料庫批量資料插入問題分析

Connection conn=source.getConnection();

資料庫批量資料插入問題分析

conn.setAutoCommit(false);

資料庫批量資料插入問題分析

PreparedStatement ps=conn.prepareStatement("insert into user(id,name) value(?,?)");

資料庫批量資料插入問題分析

long start=System.currentTimeMillis();

資料庫批量資料插入問題分析

for(int i=0;i<100000;i++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

ps.setString(1,(i+1)+"");

資料庫批量資料插入問題分析

ps.setString(2,"chenxinhan");

資料庫批量資料插入問題分析

ps.execute();

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

conn.commit();

資料庫批量資料插入問題分析

ps.close();

資料庫批量資料插入問題分析

conn.close();

資料庫批量資料插入問題分析

long end=System.currentTimeMillis();

資料庫批量資料插入問題分析

System.out.println("prepareStatementInsert()執行時間為："+(end-start)+"ms"); 輸出結果：

prepareStatementInsert()執行時間為：12797ms

對比分析：

采用prepareStatement的方式确實可以提高一點性能，因為減少了資料庫引擎解析優化SQL語句的時間，但是由于現在的插入語句太簡單，是以性能提升不明顯。

四、批量插入：addBatch、executeBatch

代碼： 1

資料庫批量資料插入問題分析

Connection conn=source.getConnection();

資料庫批量資料插入問題分析

conn.setAutoCommit(false);

資料庫批量資料插入問題分析

Statement s=conn.createStatement();

資料庫批量資料插入問題分析

String sql="";

資料庫批量資料插入問題分析

long start=System.currentTimeMillis();

資料庫批量資料插入問題分析

for(int j=0;j<100;j++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

for(int i=0;i<1000;i++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

sql="insert into user(id,name) value('"+(i+1)+"','chenxinhan')";

資料庫批量資料插入問題分析

s.addBatch(sql);

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.executeBatch();

資料庫批量資料插入問題分析

conn.commit();

資料庫批量資料插入問題分析

s.clearBatch();

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.close();

資料庫批量資料插入問題分析

conn.close();

資料庫批量資料插入問題分析

long end=System.currentTimeMillis();

資料庫批量資料插入問題分析

System.out.println("batchInsert()執行時間為："+(end-start)+"ms"); 輸出結果：

batchInsert()執行時間為：13625ms

對比分析：

按道理，這種批處理的方式是要快些的，但是測試結果卻不盡人意，有點不解，請高人拍磚。

五、批量插入：insert into tableName (x,xx,xxx) values(x,xx,xxx),(xx,xxx,xxxx)…,

代碼： 1

資料庫批量資料插入問題分析

Connection conn=source.getConnection();

資料庫批量資料插入問題分析

conn.setAutoCommit(false);

資料庫批量資料插入問題分析

Statement s=conn.createStatement();

資料庫批量資料插入問題分析

StringBuilder sql=new StringBuilder("");

資料庫批量資料插入問題分析

long start=System.currentTimeMillis();

資料庫批量資料插入問題分析

for(int j=0;j<100;j++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

sql=new StringBuilder("");

資料庫批量資料插入問題分析

sql.append("insert into user(id,name) values ");

資料庫批量資料插入問題分析

for(int i=0;i<1000;i++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

if(i==999)

資料庫批量資料插入問題分析

sql.append("('").append(i+1).append("',").append("'cxh')");

資料庫批量資料插入問題分析

else

資料庫批量資料插入問題分析

sql.append("('").append(i+1).append("',").append("'cxh'),");

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.execute(sql.toString());

資料庫批量資料插入問題分析

conn.commit();

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.close();

資料庫批量資料插入問題分析

conn.close();

資料庫批量資料插入問題分析

long end=System.currentTimeMillis();

資料庫批量資料插入問題分析

System.out.println("manyInsert()執行時間為："+(end-start)+"ms"); 輸出結果：

manyInsert()執行時間為：937ms

對比分析：

發現采用這種方式的批量插入性能提升最明顯，有10倍以上的性能提升。是以這種方式是我推薦的批量插入方式！

六、多線程插入

在第五種方式的基礎上采用多線程插入。

代碼： 1

資料庫批量資料插入問題分析

final Connection conn=source.getConnection();

資料庫批量資料插入問題分析

for(int j=0;j<3;j++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

Thread t=new Thread(){

資料庫批量資料插入問題分析

@Override

資料庫批量資料插入問題分析

public void run() {

資料庫批量資料插入問題分析

try

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

long start=System.currentTimeMillis();

資料庫批量資料插入問題分析

Statement s=conn.createStatement();

資料庫批量資料插入問題分析

StringBuilder sql=new StringBuilder("");

資料庫批量資料插入問題分析

for(int j=0;j<100;j++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

conn.setAutoCommit(false);

資料庫批量資料插入問題分析

sql=new StringBuilder("");

資料庫批量資料插入問題分析

sql.append("insert into user (id,name) values ");

資料庫批量資料插入問題分析

for(int i=0;i<1000;i++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

if(i==999)

資料庫批量資料插入問題分析

sql.append("('").append(i+1).append("',").append("'cxh')");

資料庫批量資料插入問題分析

else

資料庫批量資料插入問題分析

sql.append("('").append(i+1).append("',").append("'cxh'),");

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.execute(sql.toString());

資料庫批量資料插入問題分析

conn.commit();

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.close();

資料庫批量資料插入問題分析

long end=System.currentTimeMillis();

資料庫批量資料插入問題分析

System.out.println("multiThreadBatchInsert()執行時間為："+(end-start)+"ms");

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

catch(Exception e)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

e.printStackTrace();

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

};

資料庫批量資料插入問題分析

t.start();

資料庫批量資料插入問題分析

//t.join();

資料庫批量資料插入問題分析

} 輸出結果：

multiThreadBatchInsert()執行時間為：2437ms

multiThreadBatchInsert()執行時間為：2625ms

multiThreadBatchInsert()執行時間為：2703ms

注意：上面我采用的是三個線程插入30w條資料。

取最大時間為2703ms，較上面的937ms，基本還是三倍的時間。

是以發現此時多線程也解決不了批量資料插入問題。原因就是，這時候的性能瓶頸不是CPU，而是資料庫！

七、InnoDB引擎和MyISAM引擎的比較

最後，分析一下，這兩個引擎對批量資料插入的影響。

先建立user2資料表：

CREATE TABLE `user2` (

`id` varchar(50) NOT NULL,

`seqid` bigint(20) NOT NULL auto_increment,

`name` varchar(50) NOT NULL,

PRIMARY KEY (`seqid`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

代碼： 1

資料庫批量資料插入問題分析

Connection conn=source.getConnection();

資料庫批量資料插入問題分析

conn.setAutoCommit(false);

資料庫批量資料插入問題分析

Statement s=conn.createStatement();

資料庫批量資料插入問題分析

StringBuilder sql=new StringBuilder("");

資料庫批量資料插入問題分析

long start=System.currentTimeMillis();

資料庫批量資料插入問題分析

for(int j=0;j<100;j++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

sql=new StringBuilder("");

資料庫批量資料插入問題分析

sql.append("insert into user2 (id,name) values ");

資料庫批量資料插入問題分析

for(int i=0;i<1000;i++)

資料庫批量資料插入問題分析

{

資料庫批量資料插入問題分析

if(i==999)

資料庫批量資料插入問題分析

sql.append("('").append(i+1).append("',").append("'cxh')");

資料庫批量資料插入問題分析

else

資料庫批量資料插入問題分析

sql.append("('").append(i+1).append("',").append("'cxh'),");

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.execute(sql.toString());

資料庫批量資料插入問題分析

conn.commit();

資料庫批量資料插入問題分析

}

資料庫批量資料插入問題分析

s.close();

資料庫批量資料插入問題分析

conn.close();

資料庫批量資料插入問題分析

long end=System.currentTimeMillis();

資料庫批量資料插入問題分析

System.out.println("manyInsert2()執行時間為："+(end-start)+"ms"); 輸出結果：

manyInsert2()執行時間為：3484ms

注意：第七項的代碼和第五是一樣的，除了資料表名稱不同（user、user2）

但是，

InnoDB ：3484ms

MyISAM：937ms

是以，MyISAM引擎對大資料量的插入性能較好。

總結：

對于大資料量的插入，建議使用insert into tableName (x,xx,xxx) values(x,xx,xxx),(xx,xxx,xxxx)…,的方式，引擎建議使用MyISAM引擎。

資料庫批量資料插入問題分析

繼續閱讀

有關土木工程項目中的決策技術小議所有決策（DM）技術，通常旨使決策（DM）過程能更好地形式化。在如今的工程領域中，已然引

Eclipse 提示 @Override must override a superclass method 問題解決 [email protected] annotation

幾種 SAP ABAP OData 服務的性能評估和測試工具介紹試讀版

SAP ABAP OData 服務的 $count 操作實作

maven 編譯 maven install 出錯 com.sun.image.codec.jpeg不存在

PWM逆變器提供的雙星同步機的控制摘要PWM逆變器在電力電子領域中被廣泛應用于驅動各種類型的電動機。本論文将深入研究PW

軸上部件的圓周固定方法是指将各種零件或元件固定或連接配接在軸圓周周圍的技術。這種方法通常用于機械和工程應用中，需要将部件緊密

小攻角穩定抖動風力渦輪機的性能評估

測試注解事務方式

成像材料的實體性能如何？其穩定性和國際标準又如何？前言成像材料的實體性能和穩定性對于各種成像應用的成功至關重要。國際标準

ＳoＣ晶片系統級驗證的高效性能評估

switch裡return和break的差別

安裝sdk的 pom

用于工業機器性能評估的多标準計算機輔助系統

高溫熔鹽是許多工業領域廣泛應用的媒體，如核反應堆、太陽能熱能儲存系統等，然而，高溫熔鹽中存在着嚴重的腐蝕問題，對使用的金

SnO2-ZnO-CuO-Sb2O3電極材料是一種重要的能源存儲材料，具有哪些結構特點？前言能源存儲技術在當代社會中扮演