天天看點

SNOOPY 實作模拟登陸

采集論壇第一步就是要模拟登陸,由于各個站點登入表單各不相同,驗證方式又是多種多樣,是以直接送出使用者名密碼 到登入頁面就比較繁瑣。

是以我們采用cookie來模拟登陸無疑是最佳捷徑。

對象www.discuz.net

使用者名liuyuntest

密碼123456

一 首先我們手工登入下,記錄下cookie

dznet_cookietime=2592000;dznet_onlineusernum=7816;dznet_sid=QtlC87;

dznet_auth=6bbeCQrzGv4eliNMLgU%2FlGZSpzbrsauGO1l0OBp6VQw5p0bcEg0xd4slYCM2ks%2FL0YCVYSO7XP2z8GMaxkPDUbXZCWft;

checkpm=1

(目前主流浏覽都有插件檢視cookie)

二 采用snoopy模拟登入

  1. include("snoopy.php");
  2. $snoopy = new Snoopy;
  3. $snoopy->agent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; TheWorld)";//這項是浏覽器資訊,前面你用什麼浏覽器檢視cookie,就用那個浏覽器的資訊(ps:$_SERVER可以檢視到浏覽器的資訊)
  4. $snoopy->referer = "http://www.discuz.net/";
  5. $snoopy->rawheaders["COOKIE"]= "dznet_cookietime=2592000;dznet_onlineusernum=7816;dznet_sid=QtlC87;
  6. dznet_auth=6bbeCQrzGv4eliNMLgU%2FlGZSpzbrsauGO1l0OBp6VQw5p0bcEg0xd4slYCM2ks%2FL0YCVYSO7XP2z8GMaxkPDUbXZCWft;
  7. checkpm=1";
  8. $snoopy->fetch("http://www.discuz.net/post.php?action=newthread&fid=2&extra=page%3D1");//擷取發貼頁面
  9. echo $tempCn = $snoopy->results;

三 采用curl 模拟登入

  1. $url = "http://www.discuz.net/";
  2. $useragent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; TheWorld)";
  3. $cookie = "dznet_cookietime=2592000;dznet_onlineusernum=7816;dznet_sid=QtlC87;
  4. dznet_auth=6bbeCQrzGv4eliNMLgU%2FlGZSpzbrsauGO1l0OBp6VQw5p0bcEg0xd4slYCM2ks%2FL0YCVYSO7XP2z8GMaxkPDUbXZCWft;
  5. checkpm=1";
  6. $ch= curl_init();
  7. curl_setopt($ch, CURLOPT_URL,$url);
  8. curl_setopt($ch, CURLOPT_COOKIE, $cookie);
  9. curl_setopt($ch, CURLOPT_REFERER, "http://www.discuz.net/index.php");
  10. curl_setopt($ch, CURLOPT_HEADER, false);
  11. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  12. curl_setopt ($ch, CURLOPT_USERAGENT, $useragent);