天天看點

HTML解析

       有時候, 一些網站沒有API接口, 就算是想要解析, 也沒辦法, 這時隻有通過HTML解析, 我當時在網上搜尋的時候, 因為有一個地方網上沒有寫, 自己也沒注意到, 結果浪費了很長時間.

       網頁上的HTML源碼一般用的都是gbk編碼, 而我們程式中使用的是UTF-8編碼, 導緻我不管使用哪種方法解析, 得到的結果都是null. 使用之前一定要先轉碼,  将下載下傳得來的資料, 通過:

       NSStringEncoding gbk = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);

       這種編碼格式來得到網頁的内容.

       另外附上解析的三種方法,

       1.通過第三方庫Hpple來解析, 這個使用方法, 網上一搜一大片, 我就不再贅述了.

       2.通過UIWebView來解析, WebView中有一個方法, 是通過JavaScript來解析的      

           [webView stringByEvaluatingJavaScriptFromString:

                                                                       @"document.getElementById('content').innerHTML"]

           字元串中使用的是JavaScript的知識, 通過Id"content"來得到content中的内容, 還有ByName, ByTagName, 具體使用方法請自己查詢, 推薦一個網站w3school(http://www.w3school.com.cn/).

繼續閱讀