有時候, 一些網站沒有API接口, 就算是想要解析, 也沒辦法, 這時隻有通過HTML解析, 我當時在網上搜尋的時候, 因為有一個地方網上沒有寫, 自己也沒注意到, 結果浪費了很長時間.
網頁上的HTML源碼一般用的都是gbk編碼, 而我們程式中使用的是UTF-8編碼, 導緻我不管使用哪種方法解析, 得到的結果都是null. 使用之前一定要先轉碼, 将下載下傳得來的資料, 通過:
NSStringEncoding gbk = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
這種編碼格式來得到網頁的内容.
另外附上解析的三種方法,
1.通過第三方庫Hpple來解析, 這個使用方法, 網上一搜一大片, 我就不再贅述了.
2.通過UIWebView來解析, WebView中有一個方法, 是通過JavaScript來解析的
[webView stringByEvaluatingJavaScriptFromString:
@"document.getElementById('content').innerHTML"]
字元串中使用的是JavaScript的知識, 通過Id"content"來得到content中的内容, 還有ByName, ByTagName, 具體使用方法請自己查詢, 推薦一個網站w3school(http://www.w3school.com.cn/).