天天看點

什麼是CURL,PHP與CURL

一 什麼是CURL

curl是一個利用URL文法在指令行方式下工作的檔案傳輸工具。curl是一個利用URL文法在指令行方式下工作的檔案傳輸工具。

它支援很多協定:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP。curl同樣支援HTTPS認證,HTTP POST方法, HTTP PUT方法, FTP上傳, kerberos認證, HTTP上傳, 代理伺服器, cookies, 使用者名/密碼認證, 下載下傳檔案斷點續傳,

上載檔案斷點續傳, http代理伺服器管道( proxy tunneling), 甚至它還支援IPv6, socks5代理伺服器, 通過http代理伺服器上傳檔案到FTP伺服器等等,功能十分強大。

原來php預設并不進行此項功能的擴充,但還是有的,隻是沒有讓它生效罷了。打開PHP安裝目錄,搜尋以下三個檔案 ssleay32.dll、libeay32.dll和 php_curl.dll,

一一拷貝到系統目錄下的system32檔案夾下,修改php.ini檔案,找到;extension= php_curl.dll行,去掉前面的;号,儲存,重新開機伺服器

網站采集,登陸,COOKIE等

二 PHP中的CURL庫

curl_close - 關閉一個curl會話

curl_copy_handle - 拷貝一個curl連接配接資源的所有内容和參數

curl_errno - 傳回一個包含目前會話錯誤資訊的數字編号

curl_error - 傳回一個包含目前會話錯誤資訊的字元串

curl_exec - 執行一個curl會話

curl_getinfo - 擷取一個curl連接配接資源句柄的資訊

curl_init - 初始化一個curl會話

curl_multi_add_handle - 向curl批處理會話中添加單獨的curl句柄資源

curl_multi_close - 關閉一個批處理句柄資源

curl_multi_exec - 解析一個curl批處理句柄

curl_multi_getcontent - 傳回擷取的輸出的文本流

curl_multi_info_read - 擷取目前解析的curl的相關傳輸資訊

curl_multi_init - 初始化一個curl批處理句柄資源

curl_multi_remove_handle - 移除curl批處理句柄資源中的某個句柄資源

curl_multi_select - Get all the sockets associated with the cURL extension, which can then be "selected"

curl_setopt_array - 以數組的形式為一個curl設定會話參數

curl_setopt - 為一個curl設定會話參數

curl_version - 擷取curl相關的版本資訊

curl_init()函數的作用初始化一個curl會話,curl_init()函數唯一的一個參數是可選的,表示一個url位址。

curl_exec()函數的作用是執行一個curl會話,唯一的參數是curl_init()函數傳回的句柄。

curl_close()函數的作用是關閉一個curl會話,唯一的參數是curl_init()函數傳回的句柄。

三關于CURL_SETOPT()函數的設定

bool curl_setopt (int ch, string option, mixed value)

curl_setopt()函數将為一個CURL會話設定選項。option參數是你想要的設定,value是這個選項給定的值。

下列選項的值将被作為長整形使用(在option參數中指定):

* CURLOPT_INFILESIZE: 當你上傳一個檔案到遠端站點,這個選項告訴PHP你上傳檔案的大小。

* CURLOPT_VERBOSE: 如果你想CURL報告每一件意外的事情,設定這個選項為一個非零值。

* CURLOPT_HEADER: 如果你想把一個頭包含在輸出中,設定這個選項為一個非零值。

* CURLOPT_NOPROGRESS: 如果你不會PHP為CURL傳輸顯示一個程序條,設定這個選項為一個非零值。注意:PHP自動設定這個選項為非零值,你應該僅僅為了調試的目的來改變這個選項。

* CURLOPT_NOBODY: 如果你不想在輸出中包含body部分,設定這個選項為一個非零值。

* CURLOPT_FAILONERROR: 如果你想讓PHP在發生錯誤(HTTP代碼傳回大于等于300)時,不顯示,設定這個選項為一人非零值。預設行為是傳回一個正常頁,忽略代碼。

* CURLOPT_UPLOAD: 如果你想讓PHP為上傳做準備,設定這個選項為一個非零值。

* CURLOPT_POST: 如果你想PHP去做一個正規的HTTP POST,設定這個選項為一個非零值。這個POST是普通的 application/x-www-from-urlencoded 類型,多數被HTML表單使用。

* CURLOPT_FTPLISTONLY: 設定這個選項為非零值,PHP将列出FTP的目錄名清單。

* CURLOPT_FTPAPPEND: 設定這個選項為一個非零值,PHP将應用遠端檔案代替覆寫它。

* CURLOPT_NETRC: 設定這個選項為一個非零值,PHP将在你的 ~./netrc 檔案中查找你要建立連接配接的遠端站點的使用者名及密碼。

* CURLOPT_FOLLOWLOCATION: 設定這個選項為一個非零值(象 “Location: “)的頭,伺服器會把它當做HTTP頭的一部分發送(注意這是遞歸的,PHP将發送形如 “Location: “的頭)。

* CURLOPT_PUT: 設定這個選項為一個非零值去用HTTP上傳一個檔案。要上傳這個檔案必須設定CURLOPT_INFILE和CURLOPT_INFILESIZE選項.

* CURLOPT_MUTE: 設定這個選項為一個非零值,PHP對于CURL函數将完全沉默。

* CURLOPT_TIMEOUT: 設定一個長整形數,作為最大延續多少秒。

* CURLOPT_LOW_SPEED_LIMIT: 設定一個長整形數,控制傳送多少位元組。

* CURLOPT_LOW_SPEED_TIME: 設定一個長整形數,控制多少秒傳送CURLOPT_LOW_SPEED_LIMIT規定的位元組數。

* CURLOPT_RESUME_FROM: 傳遞一個包含位元組偏移位址的長整形參數,(你想轉移到的開始表單)。

* CURLOPT_SSLVERSION: 傳遞一個包含SSL版本的長參數。預設PHP将被它自己努力的确定,在更多的安全中你必須手工設定。

* CURLOPT_TIMECONDITION: 傳遞一個長參數,指定怎麼處理CURLOPT_TIMEVALUE參數。你可以設定這個參數為TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。這僅用于HTTP。

* CURLOPT_TIMEVALUE: 傳遞一個從1970-1-1開始到現在的秒數。這個時間将被CURLOPT_TIMEVALUE選項作為指定值使用,或被預設TIMECOND_IFMODSINCE使用。

下列選項的值将被作為字元串:

* CURLOPT_URL: 這是你想用PHP取回的URL位址。你也可以在用curl_init()函數初始化時設定這個選項。

* CURLOPT_USERPWD: 傳遞一個形如[username]:[password]風格的字元串,作用PHP去連接配接。

* CURLOPT_PROXYUSERPWD: 傳遞一個形如[username]:[password] 格式的字元串去連接配接HTTP代理。

* CURLOPT_RANGE: 傳遞一個你想指定的範圍。它應該是”X-Y”格式,X或Y是被除外的。HTTP傳送同樣支援幾個間隔,用逗句來分隔(X-Y,N-M)。

* CURLOPT_POSTFIELDS: 傳遞一個作為HTTP “POST”操作的所有資料的字元串。

* CURLOPT_REFERER: 在HTTP請求中包含一個”referer”頭的字元串。

* CURLOPT_USERAGENT: 在HTTP請求中包含一個”user-agent”頭的字元串。

* CURLOPT_FTPPORT: 傳遞一個包含被ftp “POST”指令使用的IP位址。這個POST指令告訴遠端伺服器去連接配接我們指定的IP位址。這個字元串可以是一個IP位址,一個主機名,一個網絡界面名 (在UNIX下),或是‘-’(使用系統預設IP位址)。

* CURLOPT_COOKIE: 傳遞一個包含HTTP cookie的頭連接配接。

* CURLOPT_SSLCERT: 傳遞一個包含PEM格式證書的字元串。

* CURLOPT_SSLCERTPASSWD: 傳遞一個包含使用CURLOPT_SSLCERT證書必需的密碼。

* CURLOPT_COOKIEFILE: 傳遞一個包含cookie資料的檔案的名字的字元串。這個cookie檔案可以是Netscape格式,或是堆存在檔案中的HTTP風格的頭。

* CURLOPT_CUSTOMREQUEST: 當進行HTTP請求時,傳遞一個字元被GET或HEAD使用。為進行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request. 注意: 在确認你的伺服器支援指令先不要去這樣做。下列的選項要求一個檔案描述(通過使用fopen()函數獲得):

* CURLOPT_FILE: 這個檔案将是你放置傳送的輸出檔案,預設是STDOUT.

* CURLOPT_INFILE: 這個檔案是你傳送過來的輸入檔案。

* CURLOPT_WRITEHEADER: 這個檔案寫有你輸出的頭部分。

* CURLOPT_STDERR: 這個檔案寫有錯誤而不是stderr。用來擷取需要登入的頁面的例子,目前做法是每次或許都登入一次,有需要的人再做改進了.

四 相關例子

1 例子

$cookie_jar = tempnam('./tmp','cookie');

$ch = curl_init(); curl_setopt($ch,CURLOPT_URL,'http://******');

curl_setopt($ch, CURLOPT_POST, 1);

$request = 'email_address=&password=&action=';

curl_setopt($ch, CURLOPT_POSTFIELDS, $request);

//把傳回來的cookie資訊儲存在$cookie_jar檔案中

curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_jar);

//設定傳回的資料是否自動顯示

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

//設定是否顯示頭資訊

curl_setopt($ch, CURLOPT_HEADER, false);

//設定是否輸出頁面内容

curl_setopt($ch, CURLOPT_NOBODY, false);

curl_exec($ch);

curl_close($ch); //get data after login

$ch2 = curl_init();

curl_setopt($ch2, CURLOPT_URL, 'http://*****');

curl_setopt($ch2, CURLOPT_HEADER, false);

curl_setopt($ch2, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch2, CURLOPT_COOKIEFILE, $cookie_jar);

$orders = curl_exec($ch2);

echo '';

echo strip_tags($orders);

echo '';

curl_close($ch2);

2、刷樓了:

set_time_limit(0);

//設定程式執行時間無限制

$i=10000;

//耍10000次

for($j=0;$j<$i;$j++)

{

$URL="http://www.yoururl.com/bbs/savepost.asp";

//這個位址是回複表單裡面action的url位址

$ch = curl_init();

curl_setopt($ch,CURLOPT_URL,$URL);

curl_setopt($ch,CURLOPT_REFERER,"http://www.hxfoods.com/bbs/dispbbs.asp?boardid=14&replyid=672709&id=127437&page=1&skin=0&Star=53");

//設定來源位址,如果不設定,論壇伺服器有可能有驗證不允許回複

curl_setopt($ch,CURLOPT_COOKIESESSION,true);

//能儲存cookie

curl_setopt($ch,CURLOPT_COOKIE,"DvForum=userid=24122&usercookies=0&userhidden=2&password=w0reu3g775VrY745&userclass=%96%7C&username=%A1%FA%A1%FA%B8%D2%CB%C0%B6%D3%A1%FA&StatUserID=2194783945 ");

//這兒就是設定cookie了

curl_setopt($ch,CURLOPT_POST,1);

curl_setopt($ch,CURLOPT_NOBODY,1);

//不顯示内容,因為有很多論壇回複後要自動跳轉。

curl_setopt($ch,CURLOPT_POSTFIELDS,'Body=gfdfgdfgasdfgdfgdfgdfg& followup=672709&RootID=127437&star=58&TotalUseTable=Dv_bbs3& amp;UserName=→→敢死隊→&signflag=1&total=65535');

//把你分析的回複表單的參數分别指派

curl_setopt ($ch, CURLOPT_HEADER,true);

curl_exec($ch);

if (curl_errno($ch))

{

print curl_error($ch);

}

else

{

curl_close($ch);

}

}