Python数据挖掘学习02--numpy和pandas模块基本使用

2023-05-19 18:34:11

一、numpy模块

导入numpy模块并命名为npy

>>> import numpy as npy

1、创建数组

（1）一维数组

>>> x = npy.array(['22','18','15','4'])
>>> x
array(['22', '18', '15', '4'],dtype='<U2')
>>>

（2）二维数组

>>> y = npy.array([['aa','bb','cc'],['12','14'],['adasd']])
>>> y
array([list(['aa', 'bb', 'cc']), list(['12', '14']), list(['adasd'])], dtype=object)
>>>

2、数组排序

>>> a = npy.array([,,,])
>>> a
array([, , ,  ])
>>> a.sort()
>>> a
array([ , , , ])
>>>

3、取最大值最小值

>>> a = npy.array([,,,])
>>> a
array([, , ,  ])
>>> a.min()

>>> a.max()

注意：两种情况会取不出最大值最小值的情况

1、数组中有不为数字的项

>>> a = npy.array([['15','22','17','6'],['12','23']]) #不为数字
>>> a.min()
['12','23']  #就会出现找不出最小数的情况

2、数组同一维度中长度不同也会报错

>>> a = npy.array([[,],[,,]]) 
>>> a.min()
[,]

4、切片

a[0:2]相当于取a数组中下表为0到2但不包含2下标的数组，也就是说是取a[0],a[1]

>>> a = npy.array([,,,,,,])
>>> a
array([, , , , , , ])

>>> a[:]   #取0~2的数组但不包含2
array([, ])

>>> a[:-]  #取到最后一位，但不包含最后一位
array([, , , , , ])

>>> a[:]  #下标为1后的所有数，包含第一一位
array([, , , , , ])

>>> a[:]  #取所有数
array([, , , , , , ])

二、pandas模块

导入pandas模块并命名为pda

>>> import pandas as pda

1、Series：序列

>>> a = pda.Series([,,,,])
>>> a
    
    
    
    
    
dtype: int64

1、Series：序列

>>> a = pda.Series([,,,,])
>>> a
    
    
    
    
    
dtype: int64

2、DataFrame:数据框，有行有列

>>> c = pda.DataFrame([[,,],[,,],[,,]])
>>> c

（1）取头部或尾部几行

#取头部，默认5行
>>> c.head()
       
      
      
      

#取头部2行
>>> c.head()
       
      
      

#取尾部，默认5行
>>> c.tail()
       
      
      
      

#取尾部2行
>>> c.tail()

（2）描述

>>> c.describe()
                      
count      
mean       
std        
min        
%    1.5  2.000000  3.5
%    2.0  2.000000  4.0
%    2.5  2.500000  4.5
max

count：每一列的个数

mean：每一列的平均数

（3）反转

>>> c
       
      
      
      

>>> c.T

Python数据挖掘学习02--numpy和pandas模块基本使用

一、numpy模块

1、创建数组

（1）一维数组

（2）二维数组

2、数组排序

3、取最大值最小值

4、切片

二、pandas模块

1、Series：序列

1、Series：序列

2、DataFrame:数据框，有行有列

（1）取头部或尾部几行

（2）描述

（3）反转

继续阅读

来自python的【条件控制/语句循环/break/continue/else/pass】一、条件控制二、语句循环

无法解析的外部符号 wmain，该符号在函数 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink导出用例转换工具(XML2Excel)

YAML简介和PyYAML安全操作YAML支持的类型YAML的优点：yaml的基本语法python操作

Small tricks

libsvm for python 安装

学习软件测试基础测试第七天

Zeppelin 配置访问 REST APIApache Zeppelin Configuration REST API

【Torch】最简洁logging使用指南

27. Remove Element(列表)题目代码

Cloud Studio初体验

使用 ctypes 进行 Python 和 C 的混合编程

【python】【数据处理】画多维数据分布图

【python】netconf协议对接管理设备

「Python 网络自动化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 网络设备

在python中创建excel并写入