天天看點

Python:range、np.arange和np.linspace的差別與聯系

Python:range、np.arange和np.linspace的差別與聯系

range是python内置的一個類,該類型表示一個不可改變(immutable)的數字序列,常常用于在for循環中疊代一組特殊的數;numpy.arange是NumPy包的一個函數,它的功能與Python内置的range類似,但該類與Python内置的range差別有兩點:一是支援小數參數,二是傳回ndarray類型而非像range那樣常常做為(隐式轉換為)list類型使用;numpy.linspace也是Numpy内置的一個函數,它和numpy.arange類似,但是它不再是簡單的[start, stop)左閉右開,也沒有使用步長step,而是使用樣本個數num。

1. range

range

是python内置的一個類,該類型表示一個不可改變(immutable)的數字序列,常常用于在

for

循環中疊代一組特殊的數,它的原型可以近似表示如下:

class range(stop)
class range(start, stop, step=1)
           

(注意,因為Python沒有函數重載,是以是不允許定義兩個類初始化函數的,其實其CPython實作更像是傳入不定長參數

*args

,然後根據

len(args)

來進行不同的拆分,但我們這裡遵循Python文檔風格寫法)

如果隻傳入

stop

參數,那麼我們就預設在[0,

stop

)區間以步長1進行疊代。如果傳入2或3個參數,則我們會将在[

start

,

stop

)區間以

step

步長(可選,預設為1)疊代 。注意,三個參數必須全部為整數值。

它的常見使用樣例如下:

print(list(range(10)))
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
print(list(range(0, 30, 5)))
# [0, 5, 10, 15, 20, 25]
           

stop

<=

start

時,而直接采用預設的

step=1

時,元素會為空:

print(list(range(0)))
# []
print(list(range(1, 0)))
# []
           

此時的疊代我們需要将疊代步長設定為負:

print(list(range(0, -10, -1)))
# [0, -1, -2, -3, -4, -5, -6, -7, -8, -9]
           

如果非法地傳入非整數的參數,如:

print(list(range(10, 0.3)))
           

則會報以下的TypeError:

'float' object cannot be interpreted as an integer
           

最後提一下,我們常常會寫下如下代碼:

for i in range(10):
    print(i)
           

此時Python解釋器實質上會将

range

對象隐式轉化為疊代器,等價于如下代碼:

list_iterator = iter(range(10))
try:
    while True:
        x = next(list_iterator)
        print(x)
except StopIteration:
    pass
           

2. numpy.arange

numpy.arange

NumPy

包的一個函數,它的功能與Python内置的

range

類似,它的原型可以近似表示為:

numpy.arange(stop, dtype=None, like=None)
numpy.arange(start, stop, step=1, dtype=None, like=None)
           

(還是如前面所說,因為Python沒有函數重載,是不允許定義兩個類初始化函數的,其實其CPython實作更像是傳入不定長參數

*args

,然後根據

len(args)

來進行不同的拆分,但我們這裡遵循Python文檔風格寫法)

其中

start

step

step

的使用與

range

類似,此處不再贅述,唯一的差別就是這3個參數都可以是小數。dtype為傳回

array

的類型,如果沒有給定則會從輸入輸入參數中推斷。

like

為一個array-like的類型,它允許建立非NumPy arrays的arrays類型。

總結一下,該類與Python内置的

range

差別有兩點:一是支援小數參數,二是傳回

ndarray

類型而非像

range

那樣常常做為(隐式轉換為)

list

類型使用。

以下是其常見用例:

print(np.arange(3))
# [0 1 2]
print(np.arange(3.0))
# [0. 1. 2.]
print(np.arange(3,7))
# [3 4 5 6]
print(np.arange(3,7,2))
# [3 5]
print(np.arange(0, 5, 0.5))
#[0.  0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]
           

注意,在

numpy.arange

的使用過程中可能存在浮點穩定性的問題,進而導緻下面這樣的意想不到的結果:

print(np.arange(0, 5, 0.5, dtype=int))
# [0 0 0 0 0 0 0 0 0 0]
print(np.arange(-3, 3, 0.5, dtype=int))
# [-3 -2 -1  0  1  2  3  4  5  6  7  8]
           

這是因為在

np.arange

的内部實作中,實際上的step值是按照公式

dtype(start+step)-dtype(start)

來計算的,而非直接采用

step

。當進行強制類型轉換(上面例子中轉為

int

,即朝0方向取整)或

start

遠遠比

step

大時,會出現精度的損失。在這種情況下,建議使用下面提到的

np.linspace

3. numpy.linspace

numpy.linspace

也是

Numpy

内置的一個函數,它和

numpy.arange

類似,但是它不再是簡單的

[start, stop)

左閉右開,也沒有使用步長

step

,而是使用樣本個數

num

。其函數原型如下:

numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)
           

其中當

endpoint

采用預設的

True

時,

start

stop

表示序列的開始和初始值(閉區間

[start, stop]

),

num

為區間

[start, stop]

按照均勻(evenly)劃分采樣的樣本數(包括邊界

start

stop

在内)。不過需要注意的是,

endpoint

True

stop

才能做為最後一個樣本,為

False

時區間内便不包括

stop

,此時會在區間

[start,end]

内按照總個數為

num + 1

個樣本采樣并去掉尾部樣本(即

stop

點)組成。

retstep

位置為

True

則會傳回

(samples, step)

元組,其中

samples

為生成的樣本,

step

為樣本之間的間隔步長。

注意,它的start、stop參數都可以為小數,但是當dtype設定為int時則就不能為小數。

numpy.linspace

的常見使用樣例如下:

print(np.linspace(2.0, 3.0, num=5))
# array([2.  , 2.25, 2.5 , 2.75, 3.  ])
           

如果設定

endpoint

True

,則按照

num+1

個樣本數量來采樣,并去掉最後一個樣本。

print(np.linspace(2.0, 3.0, num=5, endpoint=False))
# [2.  2.2 2.4 2.6 2.8]
           

如果

retstep

設定為

True

,則除了傳回生成的樣本,還會傳回樣本之間的間隔步長。

print(np.linspace(2.0, 3.0, num=5, retstep=True))
# (array([2.  ,  2.25,  2.5 ,  2.75,  3.  ]), 0.25)
           

下面我們用圖形形象化地描述

endpoint

True

和取

False

的差別:

import matplotlib.pyplot as plt
N = 8
y = np.zeros(N)
x1 = np.linspace(0, 10, N, endpoint=True)
x2 = np.linspace(0, 10, N, endpoint=False)
plt.plot(x1, y, 'o', color='orange')
plt.plot(x2, y + 0.5, 'o', color='blue')
plt.ylim([1, -0.5])
plt.show()
           

圖像顯示如下:

Python:range、np.arange和np.linspace的差別與聯系

可以看出橘色的點為

np.linspace(0, 10, N, endpoint=True)

,按照總共8個點在

[0, 10]

采樣,并包括

stop

邊界10。藍色的點為

np.linspace(0, 10, N, endpoint=False)

,先按照總共9個點在

[0, 10]

采樣最後再去掉最後一個點(即

stop

點10),最終得到間隙更密的8個點。

參考

  • [1] https://docs.python.org/3/library/stdtypes.html?highlight=range#range
  • [2] https://stackoverflow.com/questions/43999181/range-non-default-parameter-follows-default-one
  • [3] https://numpy.org/doc/stable/reference/generated/numpy.arange.html?highlight=arange#numpy.arange
  • [4] https://numpy.org/doc/stable/reference/generated/numpy.linspace.html#numpy.linspace

數學是符号的藝術,音樂是上界的語言。