天天看點

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

可以使用 Visual Sniffer(百度搜尋) 來捕捉送出的資料資訊:

2. 填寫好需要的資料,比如使用者名和密碼,

3. 打開 Visual Sniffer, 點“開始攔截”

4. 在通路的頁面中送出。

5. 等送出成功之後,在 Visual Sniffer 中“停止攔截”

6. 在 Visual Sniffer 的左側欄的加号中依次點開,右邊是它攔截到的内容:

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

POST http://www.csdn.net/member/UserLogin.aspx HTTP/1.0

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-shockwave-flash, */*

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Referer: http://www.csdn.net/member/UserLogin.aspx

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Accept-Language: zh-cn

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Content-Type: application/x-www-form-urlencoded

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

UA-CPU: x86

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Pragma: no-cache

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322; InfoPath.1)

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Host: www.csdn.net

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Content-Length: 355

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Proxy-Connection: Keep-Alive

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

Cookie: ASPSESSIONIDAAAATBQC=FMEGGCKDBKHAMMCGKPFDMBFG; ASP.NET_SessionId=lusprmnom05lr445tmteaf55; userid=699879

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

__EVENTTARGET=&__EVENTARGUMENT=&__VIEWSTATE=dDwtMTcwMzgxNjQ2Mjs7bDxDU0ROVXNlckxvZ2luOmNiX1NhdmVTdGF0ZTtDU0ROVXNlckxvZ2luOkltYWdlX0xvZ2luOz4%2Btu1q2wmRZoAJTi9L73w1zBleylY%3D&CSDNUserLogin%3Atb_UserName=testusername&CSDNUserLogin%3Atb_Password=testpassword&CSDNUserLogin%3Atb_ExPwd=9232&from=&CSDNUserLogin%3AImage_Login.x=36&CSDNUserLogin%3AImage_Login.y=6

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

GET http://www.csdn.net/mycustompage.htm?aspxerrorpath=/member/UserLogin.aspx HTTP/1.0

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

以上為攔截内容,其中送出資料的參數部分(程式中的:strArgs)如:

__EVENTTARGET=&__EVENTARGUMENT=&__VIEWSTATE=dDwtMTcwMzgxNjQ2Mjs7bDxDU0ROVXNlckxvZ2luOmNiX1NhdmVTdGF0ZTtDU0ROVXNlckxvZ2luOkltYWdlX0xvZ2luOz4%2Btu1q2wmRZoAJTi9L73w1zBleylY%3D&CSDNUserLogin%3Atb_UserName=testusername&CSDNUserLogin%3Atb_Password=testpassword&CSDNUserLogin%3Atb_ExPwd=9232

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        protected static string cookieHeader;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        private void Page_Load(object sender, System.EventArgs e)

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        {

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            string strReContent = string.Empty;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //登入

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            strReContent = PostLogin("http://www.mystand.com.cn/login/submit.jsp送出的頁面","送出的參數:userid=hgj0000&password=06045369","引用位址:http://www.mystand.com.cn/");

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //asp.net登入傳遞的參數需注意    

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //strReContent = PostLogin("http://www.mystand.com.cn/login.aspx","__VIEWSTATE=dDwtNjkzMjUyNDczO3Q8O2w8aTwzPjs%2BO2w8dDxwPHA8bDxUZXh0Oz47bDxcZTs%2BPjs%2BOzs%2BOz4%2BOz6aX2dtqkJTK%2BKbNPsjd7Op%2Fl26Iw%3D%3D&txtUserName=hxf&txtPassword=hxf0000&btnEnter=%E7%99%BB%E5%BD%95","http://www.mystand.com.cn/login.aspx");

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //擷取頁面

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            strReContent = GetPage("http://www.mystand.com.cn/company/getdata.jsp?code=","引用位址:http://www.mystand.com.cn/");

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //strReContent = GetPage("http://www.mystand.com.cn/Modules/index.aspx","http://www.mystand.com.cn/login.aspx");

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //可以對獲得的内容進行處理:strReContent

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        }

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <summary>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// 功能描述:模拟登入頁面,送出登入資料進行登入,并記錄Header中的cookie

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// </summary>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <param name="strURL">登入資料送出的頁面位址</param>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <param name="strArgs">使用者登入資料</param>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <param name="strReferer">引用位址</param>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <returns>可以傳回頁面内容或不傳回</returns>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        public static string PostLogin(string strURL,string strArgs,string strReferer)

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            string strResult = "";

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            HttpWebRequest myHttpWebRequest = (HttpWebRequest)WebRequest.Create(strURL);

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.AllowAutoRedirect = true; 

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.KeepAlive = true;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.Accept = "image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/msword, application/x-shockwave-flash, */*";

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.Referer = strReferer;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Maxthon; .NET CLR 2.0.50727)";

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.ContentType = "application/x-www-form-urlencoded";

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.Method = "POST";

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            CookieCollection myCookies = null;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            CookieContainer myCookieContainer = new CookieContainer();

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.CookieContainer = myCookieContainer;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            Stream MyRequestStrearm = myHttpWebRequest.GetRequestStream();

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            StreamWriter MyStreamWriter = new StreamWriter(MyRequestStrearm,Encoding.ASCII);

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //把資料寫入HttpWebRequest的Request流

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            MyStreamWriter.Write(strArgs);

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            //關閉打開對象 

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            MyStreamWriter.Close();

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            MyRequestStrearm.Close();

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            HttpWebResponse response = null;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            System.IO.StreamReader sr = null;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            response = (HttpWebResponse)myHttpWebRequest.GetResponse();

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            cookieHeader = myHttpWebRequest.CookieContainer.GetCookieHeader(new Uri(strURL)); 

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            HttpContext.Current.Application.Lock(); 

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            HttpContext.Current.Application["cookieHeader"] = cookieHeader; 

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            HttpContext.Current.Application.UnLock();

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myCookies = response.Cookies;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            sr = new System.IO.StreamReader(response.GetResponseStream(),Encoding.GetEncoding("gb2312"));    //    //utf-8

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            strResult = sr.ReadToEnd();

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            return strResult;

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// 功能描述:在PostLogin成功登入後記錄下Headers中的cookie,然後擷取此網站上其他頁面的内容

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <param name="strURL">擷取網站的某頁面的位址</param>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <param name="strReferer">引用的位址</param>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        /// <returns>傳回頁面内容</returns>

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

        public static string GetPage(string strURL,string strReferer)

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.ContentType = "text/html";

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.Method = "GET";

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            myHttpWebRequest.Headers.Add("cookie:"+ cookieHeader);

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

            sr = new System.IO.StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));    //    //utf-8

HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)
HttpWebRequest自動登入網站并擷取網站内容(不包含驗證碼的網站)

本文轉自94cool部落格園部落格,原文連結:http://www.cnblogs.com/94cool/articles/1532591.html,如需轉載請自行聯系原作者

繼續閱讀