天天看點

帶BOM的utf-8,用json_decode() 傳回null的問題 --- 超過3個bom字元

PHP中file_get_contents函数获取URL文件内容时,带BOM的utf-8,用json_decode() 返回null的问题。

网上有二种处理方法:

1、正则

if(preg_match('/^\xEF\xBB\xBF/',$data))    //去除可能存在的BOM

{

    $data=substr($data,3);

}

 

2、自动检测目录下文件并移除BOM

 <?php

if (isset($_GET['dir'])){ //config the basedir

  $basedir=$_GET['dir'];

}else{

  $basedir = '.';

}

$auto = 1;

checkdir($basedir);

function checkdir($basedir){

  if ($dh = opendir($basedir)) {

    while (($file = readdir($dh)) !== false) {

      if ($file != '.' && $file != '..'){

        if (!is_dir($basedir."/".$file)) {

          echo "filename: $basedir/

$file ".checkBOM("$basedir/$file")." <br>";

        }else{

          $dirname = $basedir."/".

$file;

          checkdir($dirname);

        }

      }

    }

  closedir($dh);

  }

}

function checkBOM ($filename) {

  global $auto;

  $contents = file_get_contents($filename);

  $charset[1] = substr($contents, 0, 1);

  $charset[2] = substr($contents, 1, 1);

  $charset[3] = substr($contents, 2, 1);

  if (ord($charset[1]) == 239 && ord($charset[2]) == 187 &&

ord($charset[3]) == 191) {

    if ($auto == 1) {

      $rest = substr($contents, 3);

      rewrite ($filename, $rest);

      return ("<font color=red>BOM found,

automatically removed.</font>");

    } else {

      return ("<font color=red>BOM found.

</font>");

    }

  }

  else return ("BOM Not Found.");

}

function rewrite ($filename, $data) {

  $filenum = fopen($filename, "w");

  flock($filenum, LOCK_EX);

  fwrite($filenum, $data);

  fclose($filenum);

}

?>

 

 本人参考上面二种方法,均无效。

于是把 file_get_contents得到的内容(浏览器上显示的)复制出来,并粘贴进Netbeans空白PHP文件中,发现我的BOM内容根本不至3个字符。。。

于是修改如下:

。。。。//类其他文件,不用理

 

    public static function checkBOM($contents) {        

        $j=0;

        for($i=0;$i<strlen($contents);$i++){

            $charset = ord(substr($contents, $i, 1));

            if($charset==239 || $charset==187 || $charset==191 ){

                $j++;

            }

        }

        $contents = substr($contents, $j);

        return $contents;

    }

。。。。//类其他文件,不用理

 

调用页:

$data = file_get_contents(fileURL);

$data = func::checkBOM($data);    //去除可能存在的BOM

$data = json_decode($data, true);

这样就OK了