天天看点

php curl批处理--可控并发异步通常情况下 PHP 中的 cURL 是阻塞运行的,就是说创建一个 cURL 请求以后必须等它执行成功或者超时才会执行下一个请求:API接口访问一般会首选CURL

在实际项目或者自己编写小工具(比如新闻聚合,商品价格监控,比价)的过程中, 通常需要从第3方网站或者api接口获取数据, 在需要处理1个url队列时, 为了提高性能, 可以采用curl提供的curl_multi_*族函数实现简单的并发.

php curl批处理--可控并发异步通常情况下 PHP 中的 cURL 是阻塞运行的,就是说创建一个 cURL 请求以后必须等它执行成功或者超时才会执行下一个请求:API接口访问一般会首选CURL

<?php  

include 'curl.class.php';  

function callback($response, $info, $error, $request)  

{  

    echo 'response:<br>';  

    print_r($response);  

    echo '<br>' . date("y-m-d h:i:s") . '   <br>';  

    echo '<br>' . str_repeat("-", 100) . '<br>';  

}  

$user_cookie = (!empty($_request['cookie'])) ? $_request['cookie'] : file_get_contents("cookie.txt");  

$curl = new curl ("callback");  

$data = array(  

    array(  

        'url' => 'http://dyactive2.vip.xunlei.com/com_sign/?game=qmr&type=rec_gametime&referfrom=&rt=0.42521539455332336', //秦美人  

        'method' => 'post',  

        'post_data' => '',  

        'header' => null,  

        'options' => array(  

            curlopt_referer => "http://niu.xunlei.com/entergame/?gameno=qmr&fenqunum=3",  

            curlopt_cookie => $user_cookie,  

        )  

    ),  

        'url' => 'http://dyactive2.vip.xunlei.com/com_sign/?game=sq&type=rec_gametime&referfrom=&rt=0.42521539455332336', //神曲  

            curlopt_referer => "http://niu.xunlei.com/entergame/?gameno=sq&fenqunum=41",  

        'url' => 'http://dyactive2.vip.xunlei.com/com_sign/?game=frxz&type=rec_gametime&referfrom=&rt=0.42521539455332336', //凡人修真  

            curlopt_referer => "http://niu.xunlei.com/entergame/?gameno=frxz&fenqunum=3",  

        'url' => 'http://dyactive2.vip.xunlei.com/com_sign/?game=smxj&type=rec_gametime&referfrom=&rt=0.42521539455332336', //神魔仙界  

            curlopt_referer => "http://niu.xunlei.com/entergame/?gameno=smxj&fenqunum=2",  

        'url' => 'http://dyactive2.vip.xunlei.com/com_sign/?game=qsqy&type=rec_gametime&referfrom=&rt=0.42521539455332336', //倾世情缘  

            curlopt_referer => "http://niu.xunlei.com/entergame/?gameno=qsqy&fenqunum=11",  

);  

foreach ($data as $val) {  

    $request = new curl_request ($val ['url'], $val ['method'], $val ['post_data'], $val ['header'], $val ['options']);  

    $curl->add($request);  

$curl->execute();  

echo $curl->display_errors();  

使用下来效果很好,没有副作用,并发数可控,应用之处多多,自己发挥想象吧

php curl批处理--可控并发异步通常情况下 PHP 中的 cURL 是阻塞运行的,就是说创建一个 cURL 请求以后必须等它执行成功或者超时才会执行下一个请求:API接口访问一般会首选CURL

/** 

 * curl批量处理  工具类 

 *  

 * @since version 1.0 

 * @author justmepzy <[email protected]> 

 * @link http://t.qq.com/justpzy 

 */  

 *单一的请求对象 

class curl_request {  

    public $url         = '';  

    public $method      = 'get';  

    public $post_data   = null;  

    public $headers     = null;  

    public $options     = null;  

    /** 

     *  

     * @param string $url 

     * @param string $method 

     * @param string $post_data 

     * @param string $headers 

     * @param array $options 

     * @return void 

     */  

    public function __construct($url, $method = 'get', $post_data = null, $headers = null, $options = null) {  

        $this->url = $url;  

        $this->method = strtoupper( $method );  

        $this->post_data = $post_data;  

        $this->headers = $headers;  

        $this->options = $options;  

    }  

    public function __destruct() {  

        unset ( $this->url, $this->method, $this->post_data, $this->headers, $this->options );  

 * 包含请求列队处理 

class curl {  

     * 请求url个数 

     * @var int 

    private $size           = 5;  

     * 等待所有curl批处理中的活动连接等待响应时间 

    private $timeout        = 5;  

     * 完成请求回调函数 

     * @var string 

    private $callback       = null;  

     * crul配置 

     * @var array 

    private $options        = array (curlopt_ssl_verifypeer => 0,curlopt_returntransfer => 1,curlopt_connecttimeout => 30 );  

     * 请求头 

    private $headers        = array ();  

     * 请求列队 

    private $requests       = array ();  

     * 请求列队索引 

    private $request_map    = array ();  

     * 错误 

    private $errors         = array ();  

     * @access public 

     * @param string $callback 回调函数 

     * 该函数有4个参数($response,$info,$error,$request) 

     * $response    url返回的body 

     * $info        curl连接资源句柄的信息 

     * $error       错误 

     * $request     请求对象 

    public function __construct($callback = null) {  

        $this->callback = $callback;  

     * 添加一个请求对象到列队 

     * @param object $request 

     * @return boolean 

    public function add($request) {  

        $this->requests [] = $request;  

        return true;  

     * 创建一个请求对象并添加到列队 

    public function request($url, $method = 'get', $post_data = null, $headers = null, $options = null) {  

        $this->requests [] = new curl_request ( $url, $method, $post_data, $headers, $options );  

     * 创建get请求对象 

    public function get($url, $headers = null, $options = null) {  

        return $this->request ( $url, "get", null, $headers, $options );  

     * 创建一个post请求对象 

    public function post($url, $post_data = null, $headers = null, $options = null) {  

        return $this->request ( $url, "post", $post_data, $headers, $options );  

     * 执行curl 

     * @param int $size 最大连接数 

     * @return ambigous <boolean, mixed>|boolean 

    public function execute($size = null) {  

        if (sizeof ( $this->requests ) == 1) {  

            return $this->single_curl ();  

        } else {  

            return $this->rolling_curl ( $size );  

        }  

     * 单个url请求 

     * @access private 

     * @return mixed|boolean 

    private function single_curl() {  

        $ch = curl_init ();  

        $request = array_shift ( $this->requests );  

        $options = $this->get_options ( $request );  

        curl_setopt_array ( $ch, $options );  

        $output = curl_exec ( $ch );  

        $info = curl_getinfo ( $ch );  

        // it's not neccesary to set a callback for one-off requests  

        if ($this->callback) {  

            $callback = $this->callback;  

            if (is_callable ( $this->callback )) {  

                call_user_func ( $callback, $output, $info, $request );  

            }  

        } else  

            return $output;  

     * 多个url请求 

    private function rolling_curl($size = null) {  

        if ($size)  

            $this->size = $size;  

        else   

            $this->size = count($this->requests);  

        if (sizeof ( $this->requests ) < $this->size)  

            $this->size = sizeof ( $this->requests );  

        if ($this->size < 2)  

            $this->set_error ( 'size must be greater than 1' );  

        $master = curl_multi_init ();  

        //添加curl连接资源句柄到map索引  

        for($i = 0; $i < $this->size; $i ++) {  

            $ch = curl_init ();  

            $options = $this->get_options ( $this->requests [$i] );  

            curl_setopt_array ( $ch, $options );  

            curl_multi_add_handle ( $master, $ch );  

            $key = ( string ) $ch;  

            $this->request_map [$key] = $i;  

        $active = $done = null;  

        do {  

            while ( ($execrun = curl_multi_exec ( $master, $active )) == curlm_call_multi_perform )  

                ;  

            if ($execrun != curlm_ok)  

                break;  

            //有一个请求完成则回调  

            while ( $done = curl_multi_info_read ( $master ) ) {  

                //$done 完成的请求句柄  

                $info = curl_getinfo ( $done ['handle'] );//  

                $output = curl_multi_getcontent ( $done ['handle'] );//  

                $error = curl_error ( $done ['handle'] );//  

                $this->set_error ( $error );  

                //调用回调函数,如果存在的话  

                $callback = $this->callback;  

                if (is_callable ( $callback )) {  

                    $key = ( string ) $done ['handle'];  

                    $request = $this->requests [$this->request_map [$key]];  

                    unset ( $this->request_map [$key] );  

                    call_user_func ( $callback, $output, $info, $error, $request );  

                }  

                curl_close ( $done ['handle'] );  

                //从列队中移除已经完成的request  

                curl_multi_remove_handle ( $master, $done ['handle'] );  

            //等待所有curl批处理中的活动连接  

            if ($active)  

                curl_multi_select ( $master, $this->timeout );  

        } while ( $active );  

        //完成关闭  

        curl_multi_close ( $master );  

     * 获取没得请求对象的curl配置 

     * @return array 

    private function get_options($request) {  

        $options = $this->__get ( 'options' );  

        if (ini_get ( 'safe_mode' ) == 'off' || ! ini_get ( 'safe_mode' )) {  

            $options [curlopt_followlocation] = 1;  

            $options [curlopt_maxredirs] = 5;  

        $headers = $this->__get ( 'headers' );  

        if ($request->options) {  

            $options = $request->options + $options;  

        $options [curlopt_url] = $request->url;  

        if ($request->post_data && strtolower($request->method) == 'post' ) {  

            $options [curlopt_post] = 1;  

            $options [curlopt_postfields] = $request->post_data;  

        if ($headers) {  

            $options [curlopt_header] = 0;  

            $options [curlopt_httpheader] = $headers;  

        return $options;  

     * 设置错误信息 

     * @param string $msg 

    public function set_error($msg) {  

        if (! empty ( $msg ))  

            $this->errors [] = $msg;  

     * 获取错误信息 

     * @param string $open 

     * @param string $close 

     * @return string 

    public function display_errors($open = '<p>', $close = '</p>') {  

        $str = '';  

        foreach ( $this->errors as $val ) {  

            $str .= $open . $val . $close;  

        return $str;  

     * @param string $name 

     * @param string $value 

    public function __set($name, $value) {  

        if ($name == 'options' || $name == 'headers') {  

            $this->{$name} = $value + $this->{$name};  

            $this->{$name} = $value;  

     * @return mixed 

    public function __get($name) {  

        return (isset ( $this->{$name} )) ? $this->{$name} : null;  

        unset ( $this->size, $this->timeout, $this->callback, $this->options, $this->headers, $this->requests, $this->request_map, $this->errors );  

// end curl class  

/* end of file curl.class.php */