天天看點

Pandas+Pyecharts | 2022年世界500強資料分析可視化

作者:Python當打之年

大家好,我是【Python當打之年】

本期我們利用Python分析2022年世界500強企業資訊資料,看看:

  • 500強企業大概分布在哪些國家
  • 500強企業中國企業有哪些,在國内各城市分布情況
  • 500強企業利潤盈虧情況
  • ...

希望對小夥伴們有所幫助,如有疑問或者需要改進的地方可以私信小編。

涉及到的庫:

  • Pandas — 資料處理
  • Pyecharts — 資料可視化

可視化部分:

  • 象形圖 — PictorialBar
  • 柱狀圖 — Bar
  • 地圖 — Map
  • 地理坐标系 — Geo
  • 水球圖 — Liquid
  • 極坐标圖 — Polar
  • 詞雲 — WordCloud

目錄

1. 導入子產品

2.Pandas資料處理

2.1 讀取資料

2.2 檢視索引、資料類型和記憶體資訊

3. Pyecharts資料可視化

3.1 各國世界500強企業數量排名柱狀圖

3.2 各國世界500強企業數量排名TOP8極坐标圖

3.3 各國世界500強企業數量排名TOP8象形圖

3.4 各國世界500強企業數量占比餅狀圖

3.5 中國各城市世界500強企業數量排名柱狀圖

3.6 各國世界500強企業數量地圖分布

3.7 中國世界500強企業數量占比水球圖

3.8 世界500強企業公司名稱詞雲

4. 線上運作位址

1. 導入子產品

import pandas as pd
from pyecharts.charts import Pie
from pyecharts.charts import Bar
from pyecharts.charts import Grid
from pyecharts.charts import Map
from pyecharts.charts import Geo
from pyecharts.charts import WordCloud
from pyecharts.charts import PictorialBar
from pyecharts.charts import Liquid
from pyecharts.charts import Polar
from pyecharts import options as opts
from pyecharts.commons.utils import JsCode           

2. Pandas資料處理

2.1 讀取資料

df = pd.read_excel('2022年世界五百強排行榜.xlsx')
df.head(10)           
Pandas+Pyecharts | 2022年世界500強資料分析可視化

2.2 檢視資料資訊

df.info()           
Pandas+Pyecharts | 2022年世界500強資料分析可視化

500條資料沒有确缺失,不需要進行其他處理。

3. Pyecharts資料可視化

3.1 各國世界500強企業數量排名柱狀圖

bar = (
    Bar(init_opts=opts.InitOpts(width='1000px', height='1000px',bg_color='#0d0735'))
    .add_xaxis(x_data)
    .add_yaxis("",y_data)
    .set_series_opts(label_opts=opts.LabelOpts(position="right",
                                              font_size=12,
                                              font_weight='bold',
                                              formatter='{c} 家'),
                    )
    .set_global_opts(
                    xaxis_opts=opts.AxisOpts(is_show=False,),
                    yaxis_opts=opts.AxisOpts(
                        axislabel_opts=opts.LabelOpts(font_size=13,color='#fff200'),
                        axistick_opts=opts.AxisTickOpts(is_show=False),
                        axisline_opts=opts.AxisLineOpts(is_show=False)
                    ),
                    title_opts=opts.TitleOpts(title="各國世界500強企業數量排名",pos_left='center',pos_top='1%',
                              title_textstyle_opts=opts.TextStyleOpts(font_size=22,color="#38d9a9")),
                    visualmap_opts=opts.VisualMapOpts(is_show=False,
                                      min_=20,
                                      max_=150,
                                      is_piecewise=False,
                                      dimension=0,
                                      range_color=['#203fb6', '#008afb', '#ffec4a', '#ff6611', '#f62336']
                                                     ),
                    )
    .reversal_axis()
)           
Pandas+Pyecharts | 2022年世界500強資料分析可視化
  • 大陸以145家世界500強企業高居榜首
  • 美國128家、日本47家位居二、三位
  • 亞洲方面還有南韓以18家的數量排名第六

3.2 各國世界500強企業數量排名TOP8極坐标圖

p = (
    Polar(init_opts=opts.InitOpts(width='1000px', height='800px', bg_color='#0d0735'))
    .add_schema(
        radiusaxis_opts=opts.RadiusAxisOpts(data=x_data[-8:],
                                            type_='category'),
        angleaxis_opts=opts.AngleAxisOpts(
              is_clockwise=True,
              is_scale=True,
              max_=150,
              axislabel_opts=opts.LabelOpts(font_size=14, color='#fff200'),
              axisline_opts=opts.AxisLineOpts(is_show=True,linestyle_opts=opts.LineStyleOpts(
                                                    width=2,type_='dashed',color='#e4e932')),
              splitline_opts=opts.SplitLineOpts(is_show=True,
                    linestyle_opts=opts.LineStyleOpts(type_='dashed', color='#9FC131')
                ),
             ),
    )
    .add('',y_data[-8:], type_='bar')
    .set_global_opts(
        title_opts=opts.TitleOpts(title='各國世界500強企業數量排名TOP8',subtitle='制圖@公衆号:Python當打之年',pos_left='center',pos_top='1%',
            title_textstyle_opts=opts.TextStyleOpts(color='#38d9a9',font_size=20)
        ),
         visualmap_opts=opts.VisualMapOpts(max_=150, is_show = False, is_piecewise=True, split_number = 8, min_ = 10,
                                           range_color=['#203fb6', '#008afb', '#ffec4a', '#ff6611', '#f62336']
                                          ),
    )
)           
Pandas+Pyecharts | 2022年世界500強資料分析可視化

3.3 各國世界500強企業數量占比餅狀圖

Pandas+Pyecharts | 2022年世界500強資料分析可視化
  • 大陸世界500強企業有145家,占比高達29%,接近總量的1/3
  • 美國占比24.8,日本占比9.4%

3.4 各國世界500強企業數量排名TOP8象形圖

Pandas+Pyecharts | 2022年世界500強資料分析可視化

3.5 中國各城市世界500強企業數量排名柱狀圖

Pandas+Pyecharts | 2022年世界500強資料分析可視化

國内方面:

  • 大陸145家世界500強企業基本上也以一線城市居多
  • 北京以54家500強企業排名第一位,上海和深圳分别以12家和10家緊随其後
  • 北上廣深中,廣州以4家的數量跌出前5,排名第7

3.6 各國世界500強企業數量地圖分布

m1 = (
    Map(init_opts=opts.InitOpts(width='1000px', height='500px',theme='dark',bg_color='#0d0735'))
    .add('公司數量',
         region_data,
         "world",
         is_map_symbol_show=False,
         is_roam=False,
        )
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
    .set_global_opts(
        legend_opts=opts.LegendOpts(is_show=False),
        visualmap_opts=opts.VisualMapOpts(is_show=True,
                                          max_=150,
                                          min_=0,
                                          is_piecewise=True,
                                          split_number=10,
                                          pos_top='50%',
                                          pos_left='10%',
                                          range_color=['#9ecae1','#6baed6','#4292c6','#2171b5','#08519c','#08306b','#d4b9da','#c994c7','#df65b0','#e7298a','#ce1256','#980043','#67001f']
        ),
    )
)           
Pandas+Pyecharts | 2022年世界500強資料分析可視化

3.7 中國世界500強企業數量占比水球圖

Pandas+Pyecharts | 2022年世界500強資料分析可視化

3.8 世界500強企業公司名稱詞雲

wd = WordCloud(init_opts=opts.InitOpts(width='1000px',height='600px',theme='dark',bg_color='#0d0735'))
wd.add('',
       [list(z) for z in zip(x_data, y_data)],
      )
wd.set_global_opts(
        title_opts=opts.TitleOpts(
            title=""),
        tooltip_opts=opts.TooltipOpts(is_show=True),
    )           
Pandas+Pyecharts | 2022年世界500強資料分析可視化

營收方面:

  • 沃爾瑪以572754百萬美元的營業收入排名第1,亞馬遜以469822百萬美元的營業收入排名第2,大陸國家電網有限公司以460616.9百萬美元排名第3
  • 大陸共有4家企業進入世界500強榜單前10:國家電網有限公司(3)、中國石油天然氣集團有限公司(4)、中國石油化工集團有限公司(5)、中國建築集團有限公司(9)

4. 線上運作位址

篇幅原因,部分代碼未展示,線上運作位址(含源碼):

https://www.heywhale.com/home/column/60e2740e3aeb9c0017b967a2

END

以上就是本期為大家整理的全部内容了,趕快練習起來吧,喜歡的朋友可以點贊、轉發,也可以在評論區留言互相交流。文章首發公衆号 “Python當打之年” ,每天都有python程式設計技巧推送,希望大家可以喜歡。

40000+條考研資訊資料可視化(學校、專業分數分布)

可視化 | Python分析中秋月餅,這幾種口味才是yyds

看完這份全國各地結婚/離婚資料,我徹底懵了

Pandas+Pyecharts | 全國熱門旅遊景點資料分析+可視化

繼續閱讀