一、lxml的安裝
lxml是Python的一個解析庫,支援HTML和XML的解析,支援XPath解析方式,而且解析效率非常高。本節中,我們了解一下lxml的安裝方式,這主要從Windows、Linux和Mac三大平台來介紹。
官方網站:http://lxml.de
GitHub:https://github.com/lxml/lxml
PyPI:https://pypi.python.org/pypi/lxml
在Windows下,可以先嘗試利用pip安裝,此時直接執行如下指令即可:
pip3 install lxml
如果出現報錯,比如提示缺少libxml2庫等資訊,可以采用wheel方式安裝。
推薦直接到這裡(連結為:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)下載下傳對應的wheel檔案,找到本地安裝Python版本和系統對應的lxml版本,例如Windows 64位、Python 3.6,就選擇lxml?4.2.3?cp36?cp36m?win_amd64.whl,将其下載下傳到本地。
然後利用pip安裝即可,指令如下:
pip3 install 路徑/lxml?4.2.3?cp36?cp36m?win_amd64.wh
在Linux平台下安裝問題不大,同樣可以先嘗試pip安裝,指令如下:
pip3 install lxml
如果報錯,可以嘗試下面的解決方案。
CentOS、Red Hat
執行如下指令安裝所需的庫即可:
sudo yum groupinstall -y development tools
sudo yum install -y epel-release libxslt-devel libxml2-devel openssl-devel
主要是libxslt-devel和libxml2-devel這兩個庫,lxml依賴它們。安裝好之後,重新嘗試pip安裝即可。
Ubuntu、Debian和Deepin
在這些系統下,報錯的原因同樣可能是缺少了必要的類庫,執行如下指令安裝:
sudo apt-get install -y python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev
安裝好之後,重新嘗試pip安裝即可。
Python指令行下測試:
>>> import lxml #不報錯即可