天天看點

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

    • 寫在前面
    • 資料擷取
    • 資料預處理
    • 資料可視化
      • 各地區獎牌數量分布
      • 獎牌榜前十
      • 中國奪金項目分類
      • 中國獎牌實時數量
      • 合成看闆
    • 總結

寫在前面

首先要聲明一點标題沒寫錯哦!是【2020東京奧運會】,應該看過直播的人都知道,至于原因可以自行百度哈,今天給我女朋友看了一下文章,她竟然直接說我标題寫錯了,哈哈,是以感覺在這有必要解釋一下~

8月8日,小日…呃…子過得挺好的日本選手的國家 舉辦的東京奧運會已經結束了。在奧運期間,主辦方種種 奇葩操作 直接把我看傻,最終它們也通過獨特的“手段” 擠入了前三名,在這裡首先謝謝他們重新整理了我對奧運的認知。同時,借此機會看看我國今年奧運會的獲獎情況,話不多說進入正文。

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

資料擷取

奧運會相關資料來自以下兩個接口。

https://app-sc.miguvideo.com/vms-livedata/olympic-medal/total-table/15/110000004609

https://app-sc.miguvideo.com/vms-livedata/olympic-medal/detail-total/15/110000004609

1️⃣ 下面通過第一個接口,解析擷取我們所需的資料,主要包含國家的排名與獎牌數。

打開連結之後,可以發現主要資訊都在

allMedalData

字段内。

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

在網頁中确認需要提取的内容,然後通過對應的

key

進行提取。

import requests
import pandas as pd

data_url = 'https://app-sc.miguvideo.com/vms-livedata/olympic\
-medal/total-table/15/110000004609'
# 請求資料
data = requests.get(data_url).json()
df = pd.DataFrame()

for item in data['body']['allMedalData']:
    df = df.append([[item['countryName'],
                     item['countryId'],
                     item['rank'],
                     item['goldMedalNum'],
                     item['silverMedalNum'],
                     item['bronzeMedalNum'],
                     item['totalMedalNum']]])
# 修改列名
df.columns = ['國家', '國家id', '排名', '金牌', '銀牌', '銅牌', '獎牌']
# 重置索引
df.reset_index(drop=True, inplace=True)
df.head()
           
⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

2️⃣ 第二個連結同樣如此。

data_url = 'https://app-sc.miguvideo.com/\
vms-livedata/olympic-medal/detail-total/15/110000004609'

data = requests.get(data_url).json()
detail_df = pd.DataFrame()
# 請求資料
for item in data['body']['medalTableDetail']:
    detail_df = detail_df.append([[item['awardTime'],
                                   item['medalType'],
                                   item['sportsName'],
                                   item['countryId'],
                                   item['bigItemName']]])
# 修改列名
detail_df.columns = ['獲獎時間', '獎牌類型', '運動員', '國家id', '運動類别']
# 重置索引
detail_df.reset_index(drop=True, inplace=True)
detail_df.head()
           
⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

資料預處理

第二個接口擷取的資料中沒有國家名稱,需要參照第一個接口的資料按照 “國家id” 列進行比對。修改 “獎牌類型”,将“1,2,3” 修改為 “金牌,銀牌,銅牌”。

detail_df.loc[detail_df['獎牌類型'] == 1, '獎牌類型'] = '金牌'
detail_df.loc[detail_df['獎牌類型'] == 2, '獎牌類型'] = '銀牌'
detail_df.loc[detail_df['獎牌類型'] == 3, '獎牌類型'] = '銅牌'

courtry_df = df.loc[:, ['國家', '國家id']]
detail_df = pd.merge(detail_df, courtry_df, on='國家id', how = "inner")
detail_df.head()
           
⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

資料整理完畢可以将資料儲存到本地,友善可視化。

df.to_csv('東京奧運會國家排名.csv', index=False)
detail_df.to_csv('東京奧運會獲獎詳情.csv', index=False)
           

資料可視化

各地區獎牌數量分布

先看一下各地區獎牌數量分布,顔色越深獎牌數(總數)越多。得獎多的地區也側面反映了國家的實力。

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

獎牌榜前十

制作堆疊條形圖,展示獎牌榜前十名,每個柱子從上到下依次為金牌、銀牌、銅牌的數量,圖例沒在邊上沒截進去,見諒~

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

中國奪金項目分類

使用餅圖來顯示我國奪金的項目分類,像 舉重、跳水、乒乓球 一直都是我們的奪金熱門項目。

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

中國獎牌實時數量

該圖展示我國每日金銀銅擷取的實時情況,可以清晰地看出每天各個項目的獲獎情況。

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

合成看闆

将上面制作的圖示合成在一個儀表盤中,提高觀賞性~

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

由于地圖太大,就在兩個看闆中添加了跳轉按鈕,以此實作看闆跳轉。效果如下。

⭐️【2020東京奧運會】 資料分析及可視化 ⭐️

總結

在此次奧運會中,我國代表隊在大部分項目都有出色的表現,傳統優勢項目也保持了優勢地位。舉重共8個小項目獲得 7金1銀 ,跳水8個小項目獲得 7金5銀 ,均取得曆史最好成績。在整體上來看我國奪金項目覆寫面寬,除優勢項目外,還擷取 蹦床體操、場地自行車賽、帆船、擊劍、淨水皮劃艇、賽艇、田徑、羽毛球 等項目的金牌。

由于資料量不多,不能夠較全面的分析整個比賽,這發表一下自己的看法,同時在這裡期待下屆奧運會我國運動健兒的表現~

這就是本文所有的内容了,如果感覺還不錯的話。❤ 點個贊再走吧!!!❤
⭐️【2020東京奧運會】 資料分析及可視化 ⭐️
後續會繼續分享《Python資料分析及可視化》方面文章,如果感興趣的話可以點個關注不迷路哦~。