天天看點

用Streamlit開發機器學習UI

Streamlit是第一個專門針對機器學習和資料科學團隊的應用開發架構,它是開發自定義機器學習工具的最快的方法,你可以認為它的目标是取代Flask在機器學習項目中的地位,可以幫助機器學習工程師快速開發使用者互動工具。

1、Hello world

學程式設計,上 彙智網 ,線上練習環境,一對一助教答疑。

Streamlit應用就是Python腳本,沒有隐含的狀态,你可以使用函數調用重構。隻要你會寫Python腳本,你就會開發Streamlit應用。例如,下面的代碼在網頁中輸出

Hello, world!

import streamlit as st
st.write('Hello, world!')           

結果如下:

用Streamlit開發機器學習UI

2、使用UI元件

Streamlit将元件視為變量,在Streamlit中沒有回調,每一個互動都是簡單地傳回,進而確定代碼幹淨:

import streamlit as st

x = st.slider('x')
st.write(x, 'squared is', x * x)           
用Streamlit開發機器學習UI

3、資料重用和計算

如果你要下載下傳大量資料或者運作複雜的計算該怎麼實作?關鍵在于安全地重用資料。Streamlit引入了緩存原語可以讓Steamlit應用安全、輕松的重用資訊。例如,下面的代碼隻需要從Udacity的自動

駕駛車項目下載下傳一次資料,進而得到一個簡單、快速的應用:

import streamlit as st
import pandas as pd

# Reuse this data across runs!
read_and_cache_csv = st.cache(pd.read_csv)

BUCKET = "https://streamlit-self-driving.s3-us-west-2.amazonaws.com/"
data = read_and_cache_csv(BUCKET + "labels.csv.gz", nrows=1000)
desired_label = st.selectbox('Filter to:', ['car', 'truck'])
st.write(data[data.label == desired_label])           
用Streamlit開發機器學習UI

簡而言之,Streamlit的工作方式如下:

  • 對于使用者的每一次互動,整個腳本從頭到尾執行一遍
  • Streamlit基于UI元件的狀态給變量指派
  • 緩存讓Streamlit可以避免重複請求資料或重複計算

或者參考下圖:

用Streamlit開發機器學習UI

如果上面的内容還沒有說清楚,你可以直接上手嘗試Streamlit!

$ pip install --upgrade streamlit 
$ streamlit hello   
    You can now view your Streamlit app in your browser.   
    Local URL: http://localhost:8501
    Network URL: http://10.0.1.29:8501           

這會自動打開本地的web浏覽器并通路Streamlit應用:

用Streamlit開發機器學習UI

4、執行個體:自動駕駛資料集工具

下面的Streamlit應用讓你可以在整個Udacity自動駕駛車輛照片資料集中進行語義化搜尋,可視化人工标注,并且可以實時運作一個YOLO目标檢測器:

用Streamlit開發機器學習UI

整個應用隻有300行Python代碼,絕大多數是機器學習代碼。實際上

其中隻有23個Streamlit調用。你可以嘗試自己運作:

$ pip install --upgrade streamlit opencv-python
$ streamlit run https://raw.githubusercontent.com/streamlit/demo-self-driving/master/app.py           

原文連結:

Streamlit - 機器學習工具開發架構 - 彙智網