⭐️【2020東京奧運會】資料分析及可視化 ⭐️

- 寫在前面
- 資料擷取
- 資料預處理
- 資料可視化
- - 各地區獎牌數量分布
  - 獎牌榜前十
  - 中國奪金項目分類
  - 中國獎牌實時數量
  - 合成看闆
- 總結

寫在前面

首先要聲明一點标題沒寫錯哦！是【2020東京奧運會】，應該看過直播的人都知道，至于原因可以自行百度哈，今天給我女朋友看了一下文章，她竟然直接說我标題寫錯了，哈哈，是以感覺在這有必要解釋一下~

8月8日，小日…呃…子過得挺好的日本選手的國家舉辦的東京奧運會已經結束了。在奧運期間，主辦方種種奇葩操作直接把我看傻，最終它們也通過獨特的“手段” 擠入了前三名，在這裡首先謝謝他們重新整理了我對奧運的認知。同時，借此機會看看我國今年奧運會的獲獎情況，話不多說進入正文。

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

資料擷取

奧運會相關資料來自以下兩個接口。

https://app-sc.miguvideo.com/vms-livedata/olympic-medal/total-table/15/110000004609

https://app-sc.miguvideo.com/vms-livedata/olympic-medal/detail-total/15/110000004609

1️⃣ 下面通過第一個接口，解析擷取我們所需的資料，主要包含國家的排名與獎牌數。

打開連結之後，可以發現主要資訊都在

allMedalData

字段内。

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

在網頁中确認需要提取的内容，然後通過對應的

key

進行提取。

import requests
import pandas as pd

data_url = 'https://app-sc.miguvideo.com/vms-livedata/olympic\
-medal/total-table/15/110000004609'
# 請求資料
data = requests.get(data_url).json()
df = pd.DataFrame()

for item in data['body']['allMedalData']:
    df = df.append([[item['countryName'],
                     item['countryId'],
                     item['rank'],
                     item['goldMedalNum'],
                     item['silverMedalNum'],
                     item['bronzeMedalNum'],
                     item['totalMedalNum']]])
# 修改列名
df.columns = ['國家', '國家id', '排名', '金牌', '銀牌', '銅牌', '獎牌']
# 重置索引
df.reset_index(drop=True, inplace=True)
df.head()

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

2️⃣ 第二個連結同樣如此。

data_url = 'https://app-sc.miguvideo.com/\
vms-livedata/olympic-medal/detail-total/15/110000004609'

data = requests.get(data_url).json()
detail_df = pd.DataFrame()
# 請求資料
for item in data['body']['medalTableDetail']:
    detail_df = detail_df.append([[item['awardTime'],
                                   item['medalType'],
                                   item['sportsName'],
                                   item['countryId'],
                                   item['bigItemName']]])
# 修改列名
detail_df.columns = ['獲獎時間', '獎牌類型', '運動員', '國家id', '運動類别']
# 重置索引
detail_df.reset_index(drop=True, inplace=True)
detail_df.head()

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

資料預處理

第二個接口擷取的資料中沒有國家名稱，需要參照第一個接口的資料按照 “國家id” 列進行比對。修改 “獎牌類型”，将“1，2，3” 修改為 “金牌，銀牌，銅牌”。

detail_df.loc[detail_df['獎牌類型'] == 1, '獎牌類型'] = '金牌'
detail_df.loc[detail_df['獎牌類型'] == 2, '獎牌類型'] = '銀牌'
detail_df.loc[detail_df['獎牌類型'] == 3, '獎牌類型'] = '銅牌'

courtry_df = df.loc[:, ['國家', '國家id']]
detail_df = pd.merge(detail_df, courtry_df, on='國家id', how = "inner")
detail_df.head()

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

資料整理完畢可以将資料儲存到本地，友善可視化。

df.to_csv('東京奧運會國家排名.csv', index=False)
detail_df.to_csv('東京奧運會獲獎詳情.csv', index=False)

資料可視化

各地區獎牌數量分布

先看一下各地區獎牌數量分布，顔色越深獎牌數（總數）越多。得獎多的地區也側面反映了國家的實力。

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

獎牌榜前十

制作堆疊條形圖，展示獎牌榜前十名，每個柱子從上到下依次為金牌、銀牌、銅牌的數量，圖例沒在邊上沒截進去，見諒~

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

中國奪金項目分類

使用餅圖來顯示我國奪金的項目分類，像舉重、跳水、乒乓球一直都是我們的奪金熱門項目。

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

中國獎牌實時數量

該圖展示我國每日金銀銅擷取的實時情況，可以清晰地看出每天各個項目的獲獎情況。

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

合成看闆

将上面制作的圖示合成在一個儀表盤中，提高觀賞性~

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

由于地圖太大，就在兩個看闆中添加了跳轉按鈕，以此實作看闆跳轉。效果如下。

⭐️【2020東京奧運會】資料分析及可視化 ⭐️

總結

在此次奧運會中，我國代表隊在大部分項目都有出色的表現，傳統優勢項目也保持了優勢地位。舉重共8個小項目獲得 7金1銀，跳水8個小項目獲得 7金5銀，均取得曆史最好成績。在整體上來看我國奪金項目覆寫面寬，除優勢項目外，還擷取蹦床體操、場地自行車賽、帆船、擊劍、淨水皮劃艇、賽艇、田徑、羽毛球等項目的金牌。

由于資料量不多，不能夠較全面的分析整個比賽，這發表一下自己的看法，同時在這裡期待下屆奧運會我國運動健兒的表現~

這就是本文所有的内容了，如果感覺還不錯的話。❤ 點個贊再走吧！！！❤

⭐️【2020東京奧運會】資料分析及可視化 ⭐️
後續會繼續分享《Python資料分析及可視化》方面文章，如果感興趣的話可以點個關注不迷路哦~。

⭐️【2020東京奧運會】資料分析及可視化 ⭐️