不管是日常業務資料進行中,還是資料庫的導入導出,都可能遇到需要處理大量資料的插入。插入的方式和資料庫引擎都會對插入速度造成影響,這篇文章旨在從理論和實踐上對各種方法進行分析和比較,友善以後應用中插入方法的選擇。
插入分析 MySQL中插入一個記錄需要的時間由下列因素組成,其中的數字表示大約比例:
連接配接:(3) 發送查詢給伺服器:(2) 分析查詢:(2) 插入記錄:(1x記錄大小) 插入索引:(1x索引) 關閉:(1) 如果我們每插入一條都執行一個SQL語句,那麼我們需要執行除了連接配接和關閉之外的所有步驟N次,這樣是非常耗時的,優化的方式有一下幾種:
在每個insert語句中寫入多行,批量插入 将所有查詢語句寫入事務中 利用Load Data導入資料 每種方式執行的性能如下。
Innodb引擎 InnoDB 給 MySQL 提供了具有事務(commit)、復原(rollback)和崩潰修複能力(crash recovery capabilities)的事務安全(transaction-safe (ACID compliant))型表。InnoDB 提供了行鎖(locking on row level)以及外鍵限制(FOREIGN KEY constraints)。
InnoDB 的設計目标是處理大容量資料庫系統,它的 CPU 使用率是其它基于磁盤的關系資料庫引擎所不能比的。在技術上,InnoDB 是一套放在 MySQL 背景的完整資料庫系統,InnoDB 在主記憶體中建立其專用的緩沖池用于高速緩沖資料和索引。
總數100W條資料
插入完後資料庫大小38.6MB(無索引),46.8(有索引)
無索引單條插入 總耗時:229s 峰值記憶體:246KB 有索引單條插入 總耗時:242s 峰值記憶體:246KB 無索引批量插入 總耗時:10s 峰值記憶體:8643KB 有索引批量插入 總耗時:16s 峰值記憶體:8643KB 無索引事務插入 總耗時:78s 峰值記憶體:246KB 有索引事務插入 總耗時:82s 峰值記憶體:246KB 無索引Load Data插入 總耗時:12s 峰值記憶體:246KB 有索引Load Data插入 總耗時:11s 峰值記憶體:246KB MyIASM引擎 MyISAM 是MySQL預設存貯引擎。設計簡單,支援全文搜尋。
總數100W條資料
插入完後資料庫大小19.1MB(無索引),38.6(有索引)
無索引單條插入 總耗時:82s 峰值記憶體:246KB 有索引單條插入 總耗時:86s 峰值記憶體:246KB 無索引批量插入 總耗時:3s 峰值記憶體:8643KB 有索引批量插入 總耗時:7s 峰值記憶體:8643KB 無索引Load Data插入 總耗時:6s 峰值記憶體:246KB 有索引Load Data插入 總耗時:8s 峰值記憶體:246KB 總結 我測試的資料量不是很大,不過可以大概了解這幾種插入方式對于速度的影響,最快的必然是Load Data方式。這種方式相對比較麻煩,因為涉及到了寫檔案,但是可以兼顧記憶體和速度。
測試代碼<?php $dsn = 'mysql:host=localhost;dbname=test';
$db = new PDO($dsn,'root','',array(PDO::ATTR_PERSISTENT => true));//删除上次的插入資料$db->query('delete from `test`');//開始計時$start_time = time();
$sum = 1000000;// 測試選項$num = 1;if ($num == 1){ // 單條插入
for($i = 0; $i
$db->query("insert into `test` (`id`,`name`) values ($i,'tsetssdf')");
}
} elseif ($num == 2) { // 批量插入,為了不超過max_allowed_packet,選擇每10萬插入一次
for ($i = 0; $i
if ($i%100000 == 0){
$values = "($i, 'testtest')";
$db->query("insert into `test` (`id`, `name`) values $values");
} else {
$values .= ",($i, 'testtest')";
$db->query("insert into `test` (`id`, `name`) values $values");
} break;
} if ($i%100000 == 0) { //平常隻有在這個情況下才插入
if ($i == 0){
$values = "($i, 'testtest')";
} else {
$db->query("insert into `test` (`id`, `name`) values $values");
$values = "($i, 'testtest')";
}
} else {
$values .= ",($i, 'testtest')";
}
}
} elseif ($num == 3) { // 事務插入
$db->beginTransaction();
for($i = 0; $i
$db->query("insert into `test` (`id`,`name`) values ($i,'tsetssdf')");
}
$db->commit();
} elseif ($num == 4) { // 檔案load data
$filename = dirname(__FILE__).'/test.sql';
$fp = fopen($filename, 'w'); for($i = 0; $i
fputs($fp, "$i,'testtest'\r\n");
}
$db->exec("load data infile '$filename' into table test fields terminated by ','");
}
$end_time = time();echo "總耗時", ($end_time - $start_time), "秒\n";echo "峰值記憶體", round(memory_get_peak_usage()/1000), "KB\n";?>
免責聲明:本文來源于,由網友提供或網絡搜集,僅供個人研究、交流學習使用,不涉及商業盈利目的。如有版權問題,請聯系本站管理者予以更改或删除。優知網會定期釋出程式開發相關趨勢文章,包括 PHP、 Linux、 Mysql 等領域,敬請關注!最後大家可以掃描下方的贊賞碼支援我,感謝大家!
