天天看点

Puppeteer学习之小试牛刀

最近有了写文章的动力了,一方面是受到了很多前辈们的启示,另一方面也是为了记录下来更好地学以致用。闲言少叙,先说说Puppeteer是什么。

Puppeteer是一个node库,提供了一些用来操作Chrome的API,官网上介绍了一些实用的例子,可以先睹为快,

Puppeteer官方文档请猛戳这里

第一步 环境配置

1. 在nodejs官网(https://nodejs.org/en/)下载8.0以上的版本,安装到本地,本人安装了10.0.0版本到本地文件夹"D:\nodejs",安装完成后,在cmd中输入 node -v查看版本。

2. 安装完nodejs后,cmd进入D盘nodejs文件夹,新建node_global和node_cache两个文件夹

npm config set prefix "D:\nodejs\node_global" npm config set cache "D:\nodejs\node_cache"

否则执行npm命令时会出现npm执行命令失败的错误,如图:

3. 安装Puppeteer

      npm i puppeteer  -g

4. 设置环境变量

     将用户的环境变量 PATH的值 C:\Users\xx\AppData\Roaming\npm 

     改为:

    D:\nodejs\node_global

    将nodejs的安装目录加入到系统变量的path中

 第二步 运行实例

const puppeteer = require('puppeteer');

puppeteer.launch({headless: false}).then(async browser => {

  const page = await browser.newPage();

  await page.goto('https://www.baidu.com');

  // other actions...

  //await browser.close();

});

headless设置为true时,不启动浏览器

      执行 node test.js,启动浏览器。

Puppeteer还有好些功能,且听下回分解哈。

继续阅读