JAX: 快如 PyTorch，簡單如 NumPy - 深度學習與資料科學

作者：冷凍工廠 2023-12-28 14:00:00

JAX 是 TensorFlow 和 PyTorch 的新競争對手。 JAX 強調簡單性而不犧牲速度和可擴充性。由于 JAX 需要更少的樣闆代碼，是以程式更短、更接近數學，是以更容易了解。

長話短說：

使用 import jax.numpy 通路 NumPy 函數，使用 import jax.scipy 通路 SciPy 函數。
通過使用 @jax.jit 進行裝飾，可以加快即時編譯速度。
使用 jax.grad 求導。
使用 jax.vmap 進行矢量化，并使用 jax.pmap 進行跨裝置并行化。

函數式程式設計

JAX 遵循函數式程式設計哲學。這意味着您的函數必須是獨立的或純粹的：不允許有副作用。本質上，純函數看起來像數學函數（圖 1）。有輸入進來，有東西出來，但與外界沒有溝通。

例子#1

以下代碼片段是一個非功能純的示例。

import jax.numpy as jnp

bias = jnp.array(0)
def impure_example(x):
   total = x + bias
   return total

注意 impure_example 之外的偏差。在編譯期間（見下文），偏差可能會被緩存，是以不再反映偏差的變化。

例子#2

這是一個pure的例子。

def pure_example(x, weights, bias):
   activation = weights @ x + bias
   return activation

在這裡，pure_example 是獨立的：所有參數都作為參數傳遞。

确定性采樣器

在計算機中，不存在真正的随機性。相反，NumPy 和 TensorFlow 等庫會跟蹤僞随機數狀态來生成“随機”樣本。

函數式程式設計的直接後果是随機函數的工作方式不同。由于不再允許全局狀态，是以每次采樣随機數時都需要顯式傳入僞随機數生成器 (PRNG) 密鑰

import jax

key = jax.random.PRNGKey(42)
u = jax.random.uniform(key)

此外，您有責任為任何後續調用推進“随機狀态”。

key = jax.random.PRNGKey(43)

# Split off and consume subkey.
key, subkey = jax.random.split(key)
u = jax.random.uniform(subkey)

# Split off and consume second subkey.
key, subkey = jax.random.split(key)
u = jax.random.uniform(subkey)

..

jit

您可以通過即時編譯 JAX 指令來加快代碼速度。例如，要編譯縮放指數線性機關 (SELU) 函數，請使用 jax.numpy 中的 NumPy 函數并将 jax.jit 裝飾器添加到該函數，如下所示：

from jax import jit

@jit
def selu(x, α=1.67, λ=1.05):
 return λ * jnp.where(x > 0, x, α * jnp.exp(x) - α)

JAX 會跟蹤您的指令并将其轉換為 jaxpr。這使得加速線性代數 (XLA) 編譯器能夠為您的加速器生成非常高效的優化代碼。

gard

JAX 最強大的功能之一是您可以輕松擷取 gard。使用 jax.grad，您可以定義一個新函數，即符号導數。

from jax import grad

def f(x):
   return x + 0.5 * x**2

df_dx = grad(f)
d2f_dx2 = grad(grad(f))

正如您在示例中看到的，您不僅限于一階導數。您可以通過簡單地按順序連結 grad 函數 n 次來擷取 n 階導數。

vmap 和 pmap

矩陣乘法使所有批次尺寸正确需要非常細心。 JAX 的矢量化映射函數 vmap 通過對函數進行矢量化來減輕這種負擔。基本上，每個按元素應用函數 f 的代碼塊都是由 vmap 替換的候選者。讓我們看一個例子。

計算線性函數：

def linear(x):
 return weights @ x

在一批示例 [x₁, x2,..] 中，我們可以天真地（沒有 vmap）實作它，如下所示：

def naively_batched_linear(X_batched):
 return jnp.stack([linear(x) for x in X_batched])

相反，通過使用 vmap 對線性進行向量化，我們可以一次性計算整個批次：

def vmap_batched_linear(X_batched):
 return vmap(linear)(X_batched)

JAX: 快如 PyTorch，簡單如 NumPy - 深度學習與資料科學

函數式程式設計

例子#1

例子#2

确定性采樣器

jit

gard

vmap 和 pmap

繼續閱讀

聲入人心：天文街道“學習新思想建設新南岸開創新局面”微宣講在城南家園國小校舉行！

基層幹部進高校“充電”！丹桂街道舉行黨紀學習教育專題講座

中醫揭秘：40種常見疾病中藥，收藏起來一起學習吧！

王清任的五大逐瘀湯，不管瘀在哪都能用上，收藏起來一起學習吧！

中醫揭秘上火的9種常見類型，收藏起來一起學習吧！

脾虛最可怕的地方——掐斷你的氣血來源，收藏起來一起學習吧！

婆婆做的月子餐，比月子中心還進階，比月嫂還專業，學習學習吧！

都說十年看婆，十年看媳，先有好婆婆，再有好兒媳，一點也沒錯，我婆婆特好，她雖然也是農村出生的，但是她思想前衛，她不愛計較

三國群英傳3，終極武将技的學習條件，呂布為啥學不會鬼哭神嚎？

怒江消防支隊黨委黨紀學習教育讀書班圓滿完成

Win系統20個必會的技巧，建議收藏備用，學習起來

内部群聊顯示璩靜要求所有人學習海參哥金句海參哥成了幕後軍師？

婆婆和婆婆家人喜歡摸寶寶小雞怎麼辦？評論區網友的做法值得學習

八種體質分不清，一目了然，收藏起來一起學習吧！

璩靜離職了，但是壓力卻全部給到了“海參哥”，在璩靜離職前，還在讓全員學習海參歌的“金句”。璩靜是一個有着30年媒體人，2

最近，小米SU7的上市在汽車行業引起了廣泛關注，這不僅僅是因為它代表了小米在智能汽車領域的一次大膽嘗試，更因為它的一個出