關于HttpClient 擷取頁面，出現亂碼的問題

2023-06-25 07:04:49

HttpClient亂碼，網上有好多方法，在這，僅說下自己擷取頁面，出現亂碼的情情況：

将資料流增加字元集，這樣就可以解決這個問題：

如：“BufferedReader br = new BufferedReader(new InputStreamReader(in,"UTF-8"));”

源碼如下：

private String getPage(String url,String encode){

//建立HttpClient執行個體

HttpClient httpClient=new HttpClient();

//設定編碼參數

if (encode!=null){

httpClient.getParams().setParameter(HttpMethodParams.HTTP_CONTENT_CHARSET,encode);

}else{

httpClient.getParams().setParameter(HttpMethodParams.HTTP_CONTENT_CHARSET,"gbk");

}

//忽略Cookies

httpClient.getParams().setCookiePolicy(CookiePolicy.IGNORE_COOKIES);

//建立GetMethod執行個體通路指定URL

GetMethod getMethod = new GetMethod(url);

try{

//通路指定URL并取得傳回狀态碼

int statusCode = httpClient.executeMethod(getMethod);

if (statusCode==200){//傳回成功狀态碼200

//讀取頁面HTML源碼

StringBuffer sb = new StringBuffer();

InputStream in = getMethod.getResponseBodyAsStream();

BufferedReader br = new BufferedReader(new InputStreamReader(in,"UTF-8"));

String line;

while((line=br.readLine())!=null){

sb.append(line);

}

if(br!=null)br.close();

return sb.toString();

}else{

return null;

}

}catch(Exception ex){

ex.printStackTrace();

return null;

}

關于HttpClient 擷取頁面，出現亂碼的問題

繼續閱讀

程式設計高手：VC 6.0下利用消息實作内部程序通訊

Compile workrave under windows &ndash; My exprience 在Windows上編譯Workrave

門戶通專訪草根站長九天狼：做站貴在堅持

tabpanel 使用問題

轉換字元串成ＩＮＴ６４

c寫檔案

不用iconv函數實作UTF-8編碼轉換GB2312的PHP函數

為什麼把CSS放頭部，script放下面

什麼是BNF範式

C#多線程——前台線程和背景線程

CSS之折疊菜單

QName是什麼

web開發之前後端渲染

Android – ListView 中添加按鈕，動态删除添加ItemView的操作

403 Forbidden，You don't have permission to access / on this server.Forbidden

GridView終極用法(一)