天天看點

Python爬取内涵段子裡的段子

環境:Python3.6

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

<code>#!/usr/bin/env python3</code>

<code>#-*-coding:utf-8-*-</code>

<code>#version:3.6.4</code>

<code>__author__ </code><code>=</code> <code>'杜文濤'</code>

<code>import</code> <code>requests</code>

<code>import</code> <code>json</code>

<code>def</code> <code>get_json_dic(url):</code>

<code>    </code><code>global</code> <code>dict_json</code>

<code>    </code><code>response </code><code>=</code> <code>requests.get(url</code><code>=</code><code>url)</code>

<code>    </code><code>json_response </code><code>=</code> <code>response.content.decode() </code><code>#擷取r的文本 就是一個json字元串</code>

<code>    </code><code>dict_json </code><code>=</code> <code>json.loads(json_response) </code><code>#  将json字元串轉換成dic字典對象</code>

<code>    </code><code>return</code> <code>dict_json</code>

<code>def</code> <code>get_joke(dict_json):</code>

<code>    </code><code>print</code><code>(</code><code>len</code><code>(dict_json[</code><code>'data'</code><code>][</code><code>'data'</code><code>]))</code>

<code>    </code><code>for</code> <code>i </code><code>in</code> <code>range</code><code>(</code><code>1</code><code>,</code><code>20</code><code>):</code>

<code>        </code><code>conture </code><code>=</code> <code>input</code><code>(</code><code>'是否繼續,Y/N'</code><code>)</code>

<code>        </code><code>if</code> <code>conture </code><code>=</code><code>=</code> <code>'Y'</code> <code>or</code> <code>conture </code><code>=</code><code>=</code> <code>'y'</code><code>:</code>

<code>            </code><code>joke </code><code>=</code> <code>dict_json[</code><code>'data'</code><code>][</code><code>'data'</code><code>][i][</code><code>'group'</code><code>][</code><code>'text'</code><code>]</code>

<code>            </code><code>if</code> <code>i </code><code>=</code><code>=</code> <code>19</code><code>:</code>

<code>                </code><code>dict_json </code><code>=</code> <code>{}</code>

<code>                </code><code>conture</code>

<code>            </code><code>print</code><code>(joke)</code>

<code>        </code><code>else</code><code>:</code>

<code>            </code><code>exit()</code>

<code>def</code> <code>get_max_time(dic_json):</code>

<code>    </code><code>global</code> <code>max_time</code>

<code>    </code><code>max_time </code><code>=</code> <code>dict_json[</code><code>'data'</code><code>][</code><code>'max_time'</code><code>]</code>

<code>    </code><code>return</code> <code>max_time</code>

<code>if</code> <code>__name__ </code><code>=</code><code>=</code> <code>'__main__'</code><code>:</code>

<code>    </code><code>max_time </code><code>=</code> <code>1519404642</code>

<code>    </code><code>url </code><code>=</code> <code>'http://www.neihanshequ.com/joke/?is_json=1&amp;app_name=neihanshequ_web&amp;max_time='</code> <code>+</code> <code>str</code><code>(max_time)</code>

<code>    </code><code>get_json_dic(url)</code>

<code>    </code><code>get_max_time(dic_json</code><code>=</code><code>dict_json)</code>

<code>    </code><code>get_joke(dict_json</code><code>=</code><code>dict_json)</code>

<code>    </code><code>while</code> <code>True</code><code>:</code>

<code>        </code><code>url </code><code>=</code> <code>'http://www.neihanshequ.com/joke/?is_json=1&amp;app_name=neihanshequ_web&amp;max_time='</code> <code>+</code> <code>str</code><code>(max_time)</code>

<code>        </code><code>get_json_dic(url)</code>

<code>        </code><code>get_max_time(dic_json</code><code>=</code><code>dict_json)</code>

<code>        </code><code>get_joke(dict_json</code><code>=</code><code>dict_json)</code>

<code>        </code><code>print</code><code>(url)</code>

微信公衆号:

本文轉自 天道酬勤VIP 51CTO部落格,原文連結:http://blog.51cto.com/tdcqvip/2072704