天天看點

PDO防注入原理分析以及使用PDO的注意事項

我們都知道,隻要合理正确使用PDO,可以基本上防止SQL注入的産生,本文主要回答以下兩個問題:

為什麼要使用PDO而不是mysql_connect?

為何PDO能防注入?

使用PDO防注入的時候應該特别注意什麼?

一、為何要優先使用PDO?

PHP手冊上說得很清楚:

Prepared statements and stored procedures

Many of the more mature databases support the concept of prepared statements. What are they? They can be thought of as a kind of compiled template for the SQL that an application wants to run, that can be customized using variable parameters. Prepared statements offer two major benefits: 

The query only needs to be parsed (or prepared) once, but can be executed multiple times with the same or different parameters. When the query is prepared, the database will analyze, compile and optimize its plan for executing the query. For complex queries this process can take up enough time that it will noticeably slow down an application if there is a need to repeat the same query many times with different parameters. By using a prepared statement the application avoids repeating the analyze/compile/optimize cycle. This means that prepared statements use fewer resources and thus run faster.

The parameters to prepared statements don't need to be quoted; the driver automatically handles this. If an application exclusively uses prepared statements, the developer can be sure that no SQL injection will occur(however, if other portions of the query are being built up with unescaped input, SQL injection is still possible).

即使用PDO的prepare方式,主要是提高相同SQL模闆查詢性能、阻止SQL注入

同時,PHP手冊中給出了警告資訊

Prior to PHP 5.3.6, this element was silently ignored. The same behaviour can be partly replicated with the ​

​PDO::MYSQL_ATTR_INIT_COMMAND​

​ driver option, as the following example shows.

Warning

The method in the below example can only be used with character sets that share the same lower 7 bit representation as ASCII, such as ISO-8859-1 and UTF-8. Users using character sets that have different representations (such as UTF-16 or Big5) must use the charset option provided in PHP 5.3.6 and later versions.

意思是說,在PHP 5.3.6及以前版本中,并不支援在DSN中的charset定義,而應該使用​

​PDO::MYSQL_ATTR_INIT_COMMAND設定初始SQL, 即我們常用的 set names gbk指令。​

我看到一些程式,還在嘗試使用addslashes達到防注入的目的,殊不知這樣其實問題更多, 詳情請看http://www.lorui.com/addslashes-mysql_escape_string-mysql_real_eascape_string.html

還有一些做法:在執行資料庫查詢前,将SQL中的select, union, ....之類的關鍵詞清理掉。這種做法顯然是非常錯誤的處理方式,如果送出的正文中确實包含 the students's union , 替換後将篡改本來的内容,濫殺無辜,不可取。

二、為何PDO能防SQL注入?

請先看以下PHP代碼:

<?php

$pdo = new PDO("mysql:host=192.168.0.1;dbname=test;charset=utf8","root");

$st = $pdo->prepare("select * from info where id =? and name = ?");

$id = 21;

$name = 'zhangsan';

$st->bindParam(1,$id);

$st->bindParam(2,$name);

$st->execute();

$st->fetchAll();

?>

環境如下:

PHP 5.4.7

Mysql 協定版本 10

MySQL Server 5.5.27

為了徹底搞清楚php與mysql server通訊的細節,我特别使用了wireshark抓包進行研究之,安裝wireshak之後,我們設定過濾條件為tcp.port==3306, 如下圖:

PDO防注入原理分析以及使用PDO的注意事項

如此隻顯示與mysql 3306端口的通信資料,避免不必要的幹擾。

特别要注意的是wireshak基于wincap驅動,不支援本地環回接口的偵聽(即使用php連接配接本地mysql的方法是無法偵聽的),請連接配接其它機器(橋接網絡的虛拟機也可)的MySQL進行測試。

然後運作我們的PHP程式,偵聽結果如下,我們發現,PHP隻是簡單地将SQL直接發送給MySQL Server :

PDO防注入原理分析以及使用PDO的注意事項

其實,這與我們平時使用mysql_real_escape_string将字元串進行轉義,再拼接成SQL語句沒有差别(隻是由PDO本地驅動完成轉義的),顯然這種情況下還是有可能造成SQL注入的,也就是說在php本地調用pdo prepare中的mysql_real_escape_string來操作query,使用的是本地單位元組字元集,而我們傳遞多位元組編碼的變量時,有可能還是會造成SQL注入漏洞(php 5.3.6以前版本的問題之一,這也就解釋了為何在使用PDO時,建議更新到php 5.3.6+,并在DSN字元串中指定charset的原因。

針對php 5.3.6以前版本,以下代碼仍然可能造成SQL注入問題:

$pdo->query('SET NAMES GBK'); 

$var = chr(0xbf) . chr(0x27) . " OR 1=1 /*"; 

$query = "SELECT * FROM info WHERE name = ?"; 

$stmt = $pdo->prepare($query); 

$stmt->execute(array($var)); 

原因與上面的分析是一緻的。

而正确的轉義應該是給mysql Server指定字元集,并将變量發送給MySQL Server完成根據字元轉義。

那麼,如何才能禁止PHP本地轉義而交由MySQL Server轉義呢?

PDO有一項參數,名為PDO::ATTR_EMULATE_PREPARES ,表示是否使用PHP本地模拟prepare,此項參數預設值未知。而且根據我們剛剛抓包分析結果來看,php 5.3.6+預設還是使用本地變量轉,拼接成SQL發送給MySQL Server的,我們将這項值設定為false, 試試效果,如以下代碼:

$pdo = new PDO("mysql:host=192.168.0.1;dbname=test;","root");

$pdo->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);

紅色行是我們剛加入的内容,運作以下程式,使用wireshark抓包分析,得出的結果如下:

PDO防注入原理分析以及使用PDO的注意事項
PDO防注入原理分析以及使用PDO的注意事項

看到了嗎?這就是神奇之處,可見這次PHP是将SQL模闆和變量是分兩次發送給MySQL的,由MySQL完成變量的轉義處理,既然變量和SQL模闆是分兩次發送的,那麼就不存在SQL注入的問題了,但需要在DSN中指定charset屬性,如:

$pdo = new PDO('mysql:host=localhost;dbname=test;charset=utf8', 'root');

如此,即可從根本上杜絕SQL注入的問題。如果你對此不是很清楚,可以發郵件至[email protected], 一起探讨。

三、使用PDO的注意事項

知道以上幾點之後,我們就可以總結使用PDO杜絕SQL注入的幾個注意事項:

1.  php更新到5.3.6+,生産環境強烈建議更新到php 5.3.9+ php 5.4+,php 5.3.8存在緻命的hash碰撞漏洞。

2. 若使用php 5.3.6+, 請在在PDO的DSN中指定charset屬性

3. 如果使用了PHP 5.3.6及以前版本,設定PDO::ATTR_EMULATE_PREPARES參數為false(即由MySQL進行變量處理),php 5.3.6以上版本已經處理了這個問題,無論是使用本地模拟prepare還是調用mysql server的prepare均可。在DSN中指定charset是無效的,同時set names <charset>的執行是必不可少的。

4. 如果使用了PHP 5.3.6及以前版本, 因Yii架構預設并未設定ATTR_EMULATE_PREPARES的值,請在資料庫配置檔案中指定emulatePrepare的值為false。

那麼,有個問題,如果在DSN中指定了charset, 是否還需要執行set names <charset>呢?

是的,不能省。set names <charset>其實有兩個作用:

A.  告訴mysql server, 用戶端(PHP程式)送出給它的編碼是什麼

B.  告訴mysql server, 用戶端需要的結果的編碼是什麼

也就是說,如果資料表使用gbk字元集,而PHP程式使用UTF-8編碼,我們在執行查詢前運作set names utf8, 告訴mysql server正确編碼即可,無須在程式中編碼轉換。這樣我們以utf-8編碼送出查詢到mysql server, 得到的結果也會是utf-8編碼。省卻了程式中的轉換編碼問題,不要有疑問,這樣做不會産生亂碼。

那麼在DSN中指定charset的作用是什麼? 隻是告訴PDO, 本地驅動轉義時使用指定的字元集(并不是設定mysql server通信字元集),設定mysql server通信字元集,還得使用set names <charset>指令。

如果圖檔丢失,可以發郵件至[email protected], 索取PDF版本。

我真想不通,一些新的項目,為何不使用PDO而使用傳統的mysql_XXX函數庫呢?如果正确使用PDO,可以從根本上杜絕SQL注入,我強烈建議各個公司的技術負責人、一線技術研發人員,要對這個問題引起重視,盡可能使用PDO加快項目進度和安全品質。

不要再嘗試自己編寫SQL注入過濾函數庫了(又繁瑣而且很容易産生未知的漏洞)。