DataWorks百問百答35：有哪些odps spark的主python樣例？

2020-06-23 23:50:00

odps spark節點不僅可以使用java代碼進行資料處理，也可以使用python進行資料處理。

注意：由于python資源是針對Python udf

進行開發，其所能擷取到的直接依賴的三方包非常有限，故而python資源使用局限性比較大，很多三方包在python資源裡都沒有支援，自定義添加步驟、操作繁複。

python資源引用三方依賴可仿照此文檔：

https://yq.aliyun.com/articles/591478

而在pyodps2/pyodps3節點内支援性比較豐滿，支援性更好。

以下是python樣例：

DataWorks百問百答35：有哪些odps spark的主python樣例？

1.簡單demo示例（非資料業務處理邏輯，簡單案例進行校驗數值判斷）

建立python檔案：

樣例demo（僅做參考使用）：

def is_number(s):

try:

float(s)

return True

except ValueError:

pass

import unicodedata

unicodedata.numeric(s)

except (TypeError, ValueError):

return False

print(is_number('foo'))

print(is_number('1'))

print(is_number('1.3'))

print(is_number('-1.37'))

print(is_number('1e3'))

python檔案儲存送出釋出即為odps/dataworkspy資源檔案，這時候已經可以使用spark節點引用了。

2.建立odps spark節點并加載剛剛送出的python資源：

釋出後即可執行測試

DataWorks百問百答曆史記錄

請點選這裡檢視>>

更多DataWorks技術和産品資訊，歡迎加入

【DataWorks釘釘交流群】

DataWorks百問百答35：有哪些odps spark的主python樣例？

繼續閱讀

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

Cloud Studio初體驗

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method

在python中建立excel并寫入