天天看點

Linux Curl常用指令使用【轉】

Curl是Linux下一個很強大的http指令行工具,其功能十分強大。

1)讀取網頁

$ curl linuxidc.com">http://www.linuxidc.com

2)儲存網頁

3)使用的proxy伺服器及其端口:-x

4)使用cookie來記錄session資訊

使用option來把上次的cookie資訊追加到http request裡面去:-b

6)浏覽器資訊

7)referer

8)下載下傳檔案

9)批量下載下傳

……

~zzh/201.JPG ~nick/001.JPG ~nick/002.JPG

~nick/201.JPG

$自定義檔案名的下載下傳

這樣一來就不怕檔案重名啦

9)斷點續傳

舉例說明

或者大家熟悉的

10)上傳的option是-T

比如我們向ftp傳一個檔案:

11)POST和GET模式

而POST模式的option則是-d

一點需要注意的是,POST模式下的檔案上的檔案上傳,比如

https本地證書

---------------------------

1) 二話不說,先從這裡開始吧!

$ curl http://www.linuxidc.com

回車之後,www.linuxidc.com 的html就稀裡嘩啦地顯示在螢幕上了    ~

2) 嗯,要想把讀過來頁面存下來,是不是要這樣呢?

$ curl http://www.linuxidc.com > page.html

當然可以,但不用這麼麻煩的!

用curl的内置option就好,存下http的結果,用這個option: -o

$ curl -o page.html http://www.linuxidc.com

這樣,你就可以看到螢幕上出現一個下載下傳頁面進度訓示。等進展到100%,自然就 OK咯

3) 什麼什麼?!通路不到?肯定是你的proxy沒有設定了。

使用curl的時候,用這個option可以指定http通路所使用的proxy伺服器及其端口: -x

$ curl -x 123.45.67.89:1080 -o page.html http://www.linuxidc.com

4) 通路有些網站的時候比較讨厭,他使用cookie來記錄session資訊。

像IE/NN這樣的浏覽器,當然可以輕易處理cookie資訊,但我們的curl呢?.....

我們來學習這個option: -D <— 這個是把http的response裡面的cookie資訊存到一個特别的檔案中去

$ curl -x 123.45.67.89:1080 -o page.html -D cookie0001.txt http://www.linuxidc.com

這樣,當頁面被存到page.html的同時,cookie資訊也被存到了cookie0001.txt裡面了

5)那麼,下一次通路的時候,如何繼續使用上次留下的cookie資訊呢?要知道,很多網站都是靠監視你的cookie資訊,來判斷你是不是不按規矩通路他們的網站的。

這次我們使用這個option來把上次的cookie資訊追加到http request裡面去: -b

$ curl -x 123.45.67.89:1080 -o page1.html -D cookie0002.txt -b cookie0001.txt http://www.linuxidc.com

這樣,我們就可以幾乎模拟所有的IE操作,去通路網頁了!

6)稍微等等    ~我好像忘記什麼了    ~

對了!是浏覽器資訊

有些讨厭的網站總要我們使用某些特定的浏覽器去通路他們,有時候更過分的是,還要使用某些特定的版本     NND,哪裡有時間為了它去找這些怪異的浏覽器呢!?

好在curl給我們提供了一個有用的option,可以讓我們随意指定自己這次通路所宣稱的自己的浏覽器資訊: -A

$ curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" -x 123.45.67.89:1080 -o page.html -D cookie0001.txt http://www.linuxidc.com

這樣,伺服器端接到通路的要求,會認為你是一個運作在Windows 2000上的 IE6.0,嘿嘿嘿,其實也許你用的是蘋果機呢!

而"Mozilla/4.73 [en] (X11; U; Linux 2.2; 15 i686"則可以告訴對方你是一台 PC上跑着的Linux,用的是Netscape 4.73,呵呵呵

7)另外一個伺服器端常用的限制方法,就是檢查http通路的referer。比如你先通路首頁,再通路裡面所指定的下載下傳頁,這第二次通路的 referer位址就是第一次通路成功後的頁面位址。這樣,伺服器端隻要發現對下載下傳頁面某次通路的referer位址不是首頁的位址,就可以斷定那是個盜連了    ~

讨厭讨厭 ~我就是要盜連    ~!!

幸好curl給我們提供了設定referer的option: -e

$ curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" -x 123.45.67.89:1080 -e "mail.linuxidc.com" -o page.html -D cookie0001.txt http://www.linuxidc.com

這樣,就可以騙對方的伺服器,你是從mail.linuxidc.com點選某個連結過來的了,呵呵呵

8)寫着寫着發現漏掉什麼重要的東西了!——- 利用curl 下載下傳檔案

剛才講過了,下載下傳頁面到一個檔案裡,可以使用 -o ,下載下傳檔案也是一樣。比如,

$ curl -o 1.jpg http://cgi2.tky.3web.ne.jp/~zzh/screen1.JPG

這裡教大家一個新的option: -O 大寫的O,這麼用:

$ curl -O http://cgi2.tky.3web.ne.jp/~zzh/screen1.JPG

這樣,就可以按照伺服器上的檔案名,自動存在本地了!

再來一個更好用的。

如果screen1.JPG以外還有screen2.JPG、screen3.JPG、....、screen10.JPG需要下載下傳,難不成還要讓我們寫一個script來完成這些操作?

不幹!

在curl裡面,這麼寫就可以了:

$ curl -O http://cgi2.tky.3web.ne.jp/~zzh/screen[1-10].JPG

呵呵呵,厲害吧?! ~

9)再來,我們繼續講解下載下傳!

$ curl -O http://cgi2.tky.3web.ne.jp/~{zzh,nick}/[001-201].JPG

這樣産生的下載下傳,就是

~zzh/001.JPG

~zzh/002.JPG

...

~zzh/201.JPG

~nick/001.JPG

~nick/002.JPG

夠友善的了吧?哈哈哈

咦?高興得太早了。

由于zzh/nick下的檔案名都是001,002...,201,下載下傳下來的檔案重名,後面的把前面的檔案都給覆寫掉了 ~

沒關系,我們還有更狠的!

$ curl -o #2_#1.jpg http://cgi2.tky.3web.ne.jp/~{zzh,nick}/[001-201].JPG

—這是.....自定義檔案名的下載下傳? —對頭,呵呵!

這樣,自定義出來下載下傳下來的檔案名,就變成了這樣:原來: ~zzh/001.JPG —-> 下載下傳後: 001-zzh.JPG 原來: ~nick/001.JPG —-> 下載下傳後: 001-nick.JPG

這樣一來,就不怕檔案重名啦,呵呵

9)繼續講下載下傳

我們平時在windows平台上,flashget這樣的工具可以幫我們分塊并行下載下傳,還可以斷線續傳。curl在這些方面也不輸給誰,嘿嘿

比如我們下載下傳screen1.JPG中,突然掉線了,我們就可以這樣開始續傳

$ curl -c -O http://cgi2.tky.3wb.ne.jp/~zzh/screen1.JPG

當然,你不要拿個flashget下載下傳了一半的檔案來糊弄我    别的下載下傳軟體的半截檔案可不一定能用哦 ~

分塊下載下傳,我們使用這個option就可以了: -r

比如我們有一個http://cgi2.tky.3web.ne.jp/~zzh/zhao1.MP3 要下載下傳(趙老師的電話朗誦 :D )我們就可以用這樣的指令:

$ curl -r 0-10240 -o "zhao.part1" http:/cgi2.tky.3web.ne.jp/~zzh/zhao1.MP3 &\

$ curl -r 10241-20480 -o "zhao.part1" http:/cgi2.tky.3web.ne.jp/~zzh/zhao1.MP3 &\

$ curl -r 20481-40960 -o "zhao.part1" http:/cgi2.tky.3web.ne.jp/~zzh/zhao1.MP3 &\

$ curl -r 40961- -o "zhao.part1" http:/cgi2.tky.3web.ne.jp/~zzh/zhao1.MP3

這樣就可以分塊下載下傳啦。不過你需要自己把這些破碎的檔案合并起來如果你用UNIX或蘋果,用 cat zhao.part* > zhao.MP3就可以如果用的是Windows,用copy /b 來解決吧,呵呵

上面講的都是http協定的下載下傳,其實ftp也一樣可以用。用法嘛,

$ curl -u name:passwd ftp://ip:port/path/file

$ curl ftp://name:passwd@ip:port/path/file

10) 說完了下載下傳,接下來自然該講上傳咯上傳的option是 -T

$ curl -T localfile -u name:passwd ftp://upload_site:port/path/

當然,向http伺服器上傳檔案也可以比如

$ curl -T localfile http://cgi2.tky.3web.ne.jp/~zzh/abc.cgi

注意,這時候,使用的協定是HTTP的PUT method

剛才說到PUT,嘿嘿,自然讓老服想起來了其他幾種methos還沒講呢! GET和POST都不能忘哦。

http送出一個表單,比較常用的是POST模式和GET模式

GET模式什麼option都不用,隻需要把變量寫在url裡面就可以了比如:

$ curl http://www.linuxidc.com/login.cgi?user=nickwolfe&password=12345

而POST模式的option則是 -d

比如,

$ curl -d "user=nickwolfe&password=12345" http://www.linuxidc.com/login.cgi

就相當于向這個站點發出一次登陸申請    ~

到底該用GET模式還是POST模式,要看對面伺服器的程式設定。

<form method="POST" enctype="multipar/form-data" action="http://cgi2.tky.3web.ne.jp/~zzh/up_file.cgi">

<input type=file name=upload>

<input type=submit name=nick value="go">

</form>

這樣一個HTTP表單,我們要用curl進行模拟,就該是這樣的文法:

$ curl -F upload=@localfile -F nick=go http://cgi2.tky.3web.ne.jp/~zzh/up_file.cgi

羅羅嗦嗦講了這麼多,其實curl還有很多很多技巧和用法比如 https的時候使用本地證書,就可以這樣

$ curl -E localcert.pem https://remote_server

再比如,你還可以用curl通過dict協定去查字典    ~

$ curl dict://dict.org/d:computer

------------------------------------------------------------------

  一,curl指令參數,有好多我沒有用過,也不知道翻譯的對不對,如果有誤的地方,還請指正。

  -a/--append 上傳檔案時,附加到目标檔案

  - anyauth   可以使用“任何”身份驗證方法

  -b/--cookie <name=string/file> cookie字元串或檔案讀取位置

  - basic 使用HTTP基本驗證

  -B/--use-ascii 使用ASCII /文本傳輸

  -c/--cookie-jar <file> 操作結束後把cookie寫入到這個檔案中

  -C/--continue-at <offset>  斷點續轉

  -d/--data <data>   HTTP POST方式傳送資料

  --data-ascii <data>  以ascii的方式post資料

  --data-binary <data> 以二進制的方式post資料

  --negotiate     使用HTTP身份驗證

  --digest        使用數字身份驗證

  --disable-eprt  禁止使用EPRT或LPRT

  --disable-epsv  禁止使用EPSV

  -D/--dump-header <file> 把header資訊寫入到該檔案中

  --egd-file <file> 為随機資料(SSL)設定EGD socket路徑

  --tcp-nodelay   使用TCP_NODELAY選項

  -e/--referer 來源網址

  -E/--cert <cert[:passwd]> 用戶端證書檔案和密碼 (SSL)

  --cert-type <type> 證書檔案類型 (DER/PEM/ENG) (SSL)

  --key <key>     私鑰檔案名 (SSL)

  --key-type <type> 私鑰檔案類型 (DER/PEM/ENG) (SSL)

  --pass  <pass>  私鑰密碼 (SSL)

  --engine <eng>  加密引擎使用 (SSL). "--engine list" for list

  --cacert <file> CA憑證 (SSL)

  --capath <directory> CA目錄 (made using c_rehash) to verify peer against (SSL)

  --ciphers <list>  SSL密碼

  --compressed    要求傳回是壓縮的形勢 (using deflate or gzip)

  --connect-timeout <seconds> 設定最大請求時間

  --create-dirs   建立本地目錄的目錄層次結構

  --crlf          上傳是把LF轉變成CRLF

  -f/--fail          連接配接失敗時不顯示http錯誤

  --ftp-create-dirs 如果遠端目錄不存在,建立遠端目錄

  --ftp-method [multicwd/nocwd/singlecwd] 控制CWD的使用

  --ftp-pasv      使用 PASV/EPSV 代替端口

  --ftp-skip-pasv-ip 使用PASV的時候,忽略該IP位址

  --ftp-ssl       嘗試用 SSL/TLS 來進行ftp資料傳輸

  --ftp-ssl-reqd  要求用 SSL/TLS 來進行ftp資料傳輸

  -F/--form <name=content> 模拟http表單送出資料

  -form-string <name=string> 模拟http表單送出資料

  -g/--globoff 禁用網址序列和範圍使用{}和[]

  -G/--get 以get的方式來發送資料

  -h/--help 幫助

  --ignore-content-length  忽略的HTTP頭資訊的長度

  -i/--include 輸出時包括protocol頭資訊

  -I/--head  隻顯示文檔資訊

  從檔案中讀取-j/--junk-session-cookies忽略會話Cookie

  - 界面<interface>指定網絡接口/位址使用

  -j/--junk-session-cookies 讀取檔案進忽略session cookie

  --interface <interface> 使用指定網絡接口/位址

  -k/--insecure 允許不使用證書到SSL站點

  -K/--config  指定的配置檔案讀取

  -l/--list-only 列出ftp目錄下的檔案名稱

  --limit-rate <rate> 設定傳輸速度

  --local-port<NUM> 強制使用本地端口号

  -m/--max-time <seconds> 設定最大傳輸時間

  --max-redirs <num> 設定最大讀取的目錄數

  -M/--manual  顯示全手動

  -n/--netrc 從netrc檔案中讀取使用者名和密碼

  --netrc-optional 使用 .netrc 或者 URL來覆寫-n

  --ntlm          使用 HTTP NTLM 身份驗證

  -N/--no-buffer 禁用緩沖輸出

  -o/--output 把輸出寫到該檔案中

  -O/--remote-name 把輸出寫到該檔案中,保留遠端檔案的檔案名

  -p/--proxytunnel   使用HTTP代理

  --proxy-anyauth 選擇任一代理身份驗證方法

  --proxy-basic   在代理上使用基本身份驗證

  --proxy-digest  在代理上使用數字身份驗證

  --proxy-ntlm    在代理上使用ntlm身份驗證

  -P/--ftp-port <address> 使用端口位址,而不是使用PASV

  -Q/--quote <cmd>檔案傳輸前,發送指令到伺服器

  -r/--range <range>檢索來自HTTP/1.1或FTP伺服器位元組範圍

  --range-file 讀取(SSL)的随機檔案

  -R/--remote-time   在本地生成檔案時,保留遠端檔案時間

  --retry <num>   傳輸出現問題時,重試的次數

  --retry-delay <seconds>  傳輸出現問題時,設定重試間隔時間

  --retry-max-time <seconds> 傳輸出現問題時,設定最大重試時間

  -s/--silent靜音模式。不輸出任何東西

  -S/--show-error   顯示錯誤

  --socks4 <host[:port]> 用socks4代理給定主機和端口

  --socks5 <host[:port]> 用socks5代理給定主機和端口

  --stderr <file>

 -t/--telnet-option <OPT=val> Telnet選項設定

  --trace <file>  對指定檔案進行debug

  --trace-ascii <file> Like --跟蹤但沒有hex輸出

  --trace-time    跟蹤/詳細輸出時,添加時間戳

  -T/--upload-file <file> 上傳檔案

  --url <URL>     Spet URL to work with

  -u/--user <user[:password]>設定伺服器的使用者和密碼

  -U/--proxy-user <user[:password]>設定代理使用者名和密碼

  -v/--verbose

  -V/--version 顯示版本資訊

  -w/--write-out [format]什麼輸出完成後

  -x/--proxy <host[:port]>在給定的端口上使用HTTP代理

  -X/--request <command>指定什麼指令

  -y/--speed-time 放棄限速所要的時間。預設為30

  -Y/--speed-limit 停止傳輸速度的限制,速度時間'秒

  -z/--time-cond  傳送時間設定

  -0/--http1.0  使用HTTP 1.0

  -1/--tlsv1  使用TLSv1(SSL)

  -2/--sslv2 使用SSLv2的(SSL)

  -3/--sslv3         使用的SSLv3(SSL)

  --3p-quote      like -Q for the source URL for 3rd party transfer

  --3p-url        使用url,進行第三方傳送

  --3p-user       使用使用者名和密碼,進行第三方傳送

  -4/--ipv4   使用IP4

  -6/--ipv6   使用IP6

  -#/--progress-bar 用進度條顯示目前的傳送狀态

  -A/--user-agent <string>  設定使用者代理發送給伺服器

  -H/--header <line>自定義頭資訊傳遞給伺服器

  - krb4 <級别>啟用與指定的安全級别krb4

  --krb4 <level>  使用指定安全級别的krb4

  --max-filesize <bytes> 設定最大下載下傳的檔案總量

-M/--manual  顯示全手動

  -t/--telnet-option <OPT=val> Telnet選項設定

  二,常用curl執行個體

  1,抓取頁面内容到一個檔案中

  2,用-O(大寫的),後面的url要具體到某個檔案,不然抓不下來。我們還可以用正則來抓取東西

  [root@krlcgcms01 mytest]# curl -O

  3,模拟表單資訊,模拟登入,儲存cookie資訊

  4,模拟表單資訊,模拟登入,儲存頭資訊

  -c(小寫)産生的cookie和-D裡面的cookie是不一樣的。

  5,使用cookie檔案

  6,斷點續傳,-C(大寫的)

  [root@krlcgcms01 mytest]# curl -C -O

  8,顯示抓取錯誤,下面這個例子,很清楚的表明了。

  curl: (22) The requested URL returned error: 404

  <HTML><HEAD><TITLE>404,not found</TITLE>

  。。。。。。。。。。。。

  9,僞造來源位址,有的網站會判斷,請求來源位址。

  10,當我們經常用curl去搞人家東西的時候,人家會把你的IP給屏蔽掉的,這個時候,我們可以用代理

 11,比較大的東西,我們可以分段下載下傳

  content/uploads/2010/09/compare_varnish.jpg

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current

  Dload  Upload   Total   Spent    Left  Speed

  100   101  100   101    0     0    105      0 --:--:-- --:--:-- --:--:--     0

  100   101  100   101    0     0     57      0  0:00:01  0:00:01 --:--:--     0

  100  104k  100  104k    0     0  52793      0  0:00:02  0:00:02 --:--:-- 88961

  [root@krlcgcms01 mytest]# ls |grep part | xargs du -sh

  4.0K    one.part1

  112K    three.part3

  4.0K    two.part2

  用的時候,把他們cat一下就OK了,cat img.part* >img.jpg

  12,不會顯示下載下傳進度資訊

  [root@krlcgcms01 mytest]# curl -s -o aaa.jpg 

  13,顯示下載下傳進度條

  [root@krlcgcms01 mytest]# curl -# -O 

  ######################################################################## 100.0%

  14,通過ftp下載下傳檔案

  101  1934  101  1934    0     0   3184      0 --:--:-- --:--:-- --:--:--  7136

  或者用下面的方式

  [zhangy@BlackGhost ~]$ curl -O ftp://使用者名:密碼@ip:port/demo/curtain/bbstudy_files/style.css

  15,通過ftp上傳

  [zhangy@BlackGhost ~]$ curl -T test.sql ftp://使用者名:密碼@ip:port/demo/curtain/bbstudy_files/

技術改變世界!

--狂詩絕劍

繼續閱讀