天天看點

轉:分詞?Dz提供免費Webservice?

PHP代碼

  1. <?php   
  2. //強制使用字元集   
  3. @header('Content-Type: text/html; charset=gbk');   
  4. $subjectenc ='用“超級站長”安裝Discuz!和UCHome,超級簡單!';  //這是标題   
  5. $messageenc = preg_replace("/\[.+?\]/U", '', '用“超級站長”安裝Discuz!和UCHome,超級簡單!');  //這是内容   
  6. //從内容中找标題中有TAG;   
  7. $data = @implode('', file("http://keyword.discuz.com/related_kw.html?title=$subjectenc&content=$messageenc&ics=gbk&ocs=gbk"));//把标題和内容發送到dz官方去找   
  8. if($data) {   
  9. $parser = xml_parser_create();//建立一個 XML 解析器   
  10. xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);   
  11. xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);   
  12. xml_parse_into_struct($parser, $data, $values, $index);//将 XML 資料解析到數組中   
  13. xml_parser_free($parser);   
  14. $kws = array();   
  15. foreach($values as $valuearray) {   
  16.   if(in_array($valuearray['tag'],array('kw','ekw'))) {   //kw ekw是什麼意思?   
  17.     $kws[] = iconv('utf-8','gbk',$valuearray['value']);//編碼轉換   
  18.    }   
  19. }}   
  20. //最後出來的是數組.   
  21. print_r($kws);   
  22. ?>