天天看點

Ubuntu中安裝分布式爬蟲具體步驟

Ubuntu中安裝分布式爬蟲具體步驟

1、在win10系統中,安裝Ubuntu 18應用。

1)Microsoft Store搜尋Linux

2)可以搜尋到多個Linux發行版本,下面以Ubuntu為例。

3)下載下傳安裝Ubuntu,想打開軟體一樣打開。 這時候會遇到 Error:0x8007007e

4)解決方法如下:

控制台-程式和功能-啟用或關閉Windows功能-适用于Windows的Linux子系統 勾選。

5)完成後重新開機系統。再次打開Ubuntu,會提示:

Installing, this may take a few minutes…

6)大概要5分鐘左右,等會就可以進入Ubuntu了,如下:

2、進入Ubuntu中,安裝Python3.6(預設Linux中Python版本為2.7)

sudo apt-get update(更新Ubuntu中已有軟體)

sudo apt-get install python3.6

3、更新已安裝的Linux元件

在步驟二中,進行第一個指令行的操作後即可。

4、安裝gcc元件

sudo apt-get install gcc

5、将預設Python版本,更改為Python3.6

sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150

驗證:

6、安裝redis資料庫

sudo apt-get install redis-server

7、安裝Scrapy-Redis架構(此處如果出現pip錯誤提示,則進入下一步更新pip元件)

pip install scrapy-redis

或下載下傳安裝

8、更新pip元件

可能出現的坑:由于更改了預設python版本,可能導緻pip元件無法使用,提示類似錯誤:

重新安裝pip元件:

sudo apt install python3-pip

驗證:

9、啟動Redis資料庫驗證

首先,檢視 redis 是否啟動

$ redis-cli

以上指令将打開以下終端:

redis 127.0.0.1:6379>

127.0.0.1 是本機 IP ,6379 是 redis 服務端口。現在我們輸入 PING 指令。

redis 127.0.0.1:6379> ping

PONG

以上說明我們已經成功安裝了redis。

然後,啟動redis服務

sudo redis-server

出現以下提示資訊:

10、測試是否能遠端登陸

使用 windows 的指令視窗進入 redis 安裝目錄,用指令進行遠端連接配接 redis:

redis-cli -h 192.168.1.112 -p 6379

得到以下終端提示,表示遠端連接配接成功:

redis 127.0.0.1:6379>