1. 有了這款神器,輕松用 Python 寫個 APP

        共 5138字,需瀏覽 11分鐘

         ·

        2021-06-04 19:36

        作者:Adrien Treuille

        機器之心編譯

        機器學習開發(fā)者想要打造一款 App 有多難?事實上,你只需要會 Python 代碼就可以了,剩下的工作都可以交給一個工具。近日,Streamlit 聯(lián)合創(chuàng)始人 Adrien Treuille 撰文介紹其開發(fā)的機器學習工具開發(fā)框架——Streamlit,這是一款專為機器學習工程師創(chuàng)建的免費、開源 app 構(gòu)建框架。這款工具可以在你寫 Python 代碼的時候,實時更新你的應用。目前,Streamlit 的 GitHub Star 量已經(jīng)超過 3400,在 medim 上的熱度更是達到了 9000+。


        Streamlit 網(wǎng)站:https://streamlit.io/
        GitHub地址:https://github.com/streamlit/streamlit/


        用 300 行 Python 代碼,編程一個可實時執(zhí)行神經(jīng)網(wǎng)絡推斷的語義搜索引擎。


        以我的經(jīng)驗,每一個不平凡的機器學習項目都是用錯誤百出、難以維護的內(nèi)部工具整合而成的。這些工具通常用 Jupyter Notebooks 和 Flask app 寫成,很難部署,需要對客戶端服務器架構(gòu)(C/S 架構(gòu))進行推理,且無法與 Tensorflow GPU 會話等機器學習組件進行很好的整合。


        我第一次看到此類工具是在卡內(nèi)基梅隆大學,之后又在伯克利、Google X、Zoox 看到。這些工具最初只是小的 Jupyter notebook:傳感器校準工具、仿真對比 app、激光雷達對齊 app、場景重現(xiàn)工具等。


        當一個工具越來越重要時,項目經(jīng)理會介入其中:進程和需求不斷增加。這些單獨的項目變成代碼腳本,并逐漸發(fā)展成為冗長的「維護噩夢」……


        機器學習工程師創(chuàng)建 app 的流程(ad-hoc)。


        而當一個工具非常關鍵時,我們會組建工具團隊。他們熟練地寫 Vue 和 React,在筆記本電腦上貼滿聲明式框架的貼紙。他們的設計流程是這樣式的:


        工具團隊構(gòu)建 app 的流程(干凈整潔,從零開始)。


        這簡直太棒了!但是所有這些工具都需要新功能,比如每周上線新功能。然而工具團隊可能同時支持 10 多個項目,他們會說:「我們會在兩個月內(nèi)更新您的工具?!?/span>


        我們返回之前自行構(gòu)建工具的流程:部署 Flask app,寫 HTML、CSS 和 JavaScript,嘗試對從 notebook 到樣式表的所有一些進行版本控制。我和在 Google X 工作的朋友 Thiago Teixeira 開始思考:如果構(gòu)建工具像寫 Python 腳本一樣簡單呢?


        我們希望在沒有工具團隊的情況下,機器學習工程師也能構(gòu)建不錯的 app。這些內(nèi)部工具應該像機器學習工作流程的副產(chǎn)品那樣自然而然地出現(xiàn)。寫此類工具感覺就像訓練神經(jīng)網(wǎng)絡或者在 Jupyter 中執(zhí)行點對點分析(ad-hoc analysis)!同時,我們還想保留強大 app 框架的靈活性。我們想創(chuàng)造出令工程師驕傲的好工具。


        我們希望的 app 構(gòu)建流程如下:


        Streamlit app 構(gòu)建流程。


        與來自 Uber、Twitter、Stitch Fix、Dropbox 等的工程師一道,我們用一年時間創(chuàng)造了 Streamlit,這是一個針對機器學習工程師的免費開源 app 框架。不管對于任何原型,Streamlit 的核心原則都是更簡單、更純粹。


        Streamlit 的核心原則如下:


        1. 擁抱 Python


        Streamlit app 是完全自上而下運行的腳本,沒有隱藏狀態(tài)。你可以利用函數(shù)調(diào)用來處理代碼。只要你會寫 Python 腳本,你就可以寫 Streamlit app。例如,你可以按照以下代碼對屏幕執(zhí)行寫入操作:

        import streamlit as stst.write('Hello, world!')


        2. 把 widget 視作變量


        Streamlit 中沒有 callback!每一次交互都只是自上而下重新運行腳本。該方法使得代碼非常干凈:

        import streamlit as stx = st.slider('x')
        st.write(x, 'squared is', x * x)

        3 行代碼寫成的 Streamlit 交互 app。


        3. 重用數(shù)據(jù)和計算


        如果要下載大量數(shù)據(jù)或執(zhí)行復雜計算,怎么辦?關鍵在于在多次運行中安全地重用信息。Streamlit 引入了 cache primitive,它像一個持續(xù)的默認不可更改的數(shù)據(jù)存儲器,保障 Streamlit app 輕松安全地重用信息。例如,以下代碼只從 Udacity 自動駕駛項目(https://github.com/udacity/self-driving-car)中下載一次數(shù)據(jù),就可得到一個簡單快速的 app:

        使用 st.cache,在 Streamlit 多次運行中保存數(shù)據(jù)。代碼運行說明,參見:
        https://gist.github.com/treuille/c633dc8bc86efaa98eb8abe76478aa81#gistcomment-3041475。


        運行以上 st.cache 示例的輸出。


        簡而言之,Streamlit 的工作流程如下:


        1. 每次用戶交互均需要從頭運行全部腳本。

        2. Streamlit 根據(jù) widget 狀態(tài)為每個變量分配最新值。

        3. 緩存保證 Streamlit 重用數(shù)據(jù)和計算。


        如下圖所示:


        用戶事件觸發(fā) Streamlit 從頭開始重新運行腳本。不同運行中僅保留緩存。


        感興趣的話,你可以立刻嘗試!只需運行以下行:


        網(wǎng)頁瀏覽器將自動打開,并轉(zhuǎn)向本地 Streamlit app。如果沒有出現(xiàn)瀏覽器窗口,只需點擊鏈接。


        這些想法很簡潔,但有效,使用 Streamlit 不會妨礙你創(chuàng)建豐富有用的 app。我在 Zoox 和 Google X 工作時,看著自動駕駛汽車項目發(fā)展成為數(shù) G 的視覺數(shù)據(jù),這些數(shù)據(jù)需要搜索和理解,包括在圖像數(shù)據(jù)上運行模型進而對比性能。我看到的每一個自動駕駛汽車項目都有整支團隊在做這方面的工具。


        在 Streamlit 中構(gòu)建此類工具非常簡單。以下 Streamlit demo 可以對整個 Udacity 自動駕駛汽車照片數(shù)據(jù)集執(zhí)行語義搜索,對人類標注的真值標簽進行可視化,并在 app 內(nèi)實時運行完整的神經(jīng)網(wǎng)絡(YOLO)。


        這個 300 行代碼寫成的 Streamlit demo 結(jié)合了語義視覺搜索和交互式神經(jīng)網(wǎng)絡推斷。


        整個 app 只有 300 行 Python 代碼,其中大部分是機器學習代碼。事實上,整個 app 里只有 23 次 Streamlit 調(diào)用。你可以試試看:


        我們與機器學習團隊合作,為他們的項目而努力時,逐漸意識到這些簡單的想法會帶來大量重要的收益:


        Streamlit app 是純 Python 文件。你可以使用自己喜歡的編輯器和 debugger。


        我用 Streamlit 構(gòu)建 app 時喜歡用 VSCode 編輯器(左)和 Chrome(右)。


        純 Python 代碼可與 Git 等源碼控制軟件無縫對接,包括 commits、pull requests、issues 和 comment。由于 Streamlit 的底層語言是 Python,因此你可以免費利用這些協(xié)作工具的好處。


        Streamlit app 是 Python 腳本,因此你可以使用 Git 輕松執(zhí)行版本控制。


        Streamlit 提供即時模式的編程環(huán)境。當 Streamlit 檢測出源文件變更時,只需點擊 Always rerun 即可。


        點擊「Always rerun」,保證實時編程。


        緩存簡化計算流程。一連串緩存函數(shù)自動創(chuàng)建出高效的計算流程!你可以嘗試以下代碼:


        Streamlit 中的簡單計算流程。運行以上代碼,參見說明:
        https://gist.github.com/treuille/ac7755eb37c63a78fac7dfef89f3517e#gistcomment-3041436。


        基本上,該流程涉及加載元數(shù)據(jù)到創(chuàng)建摘要等步驟(load_metadata → create_summary)。該腳本每次運行時,Streamlit 僅需重新計算該流程的子集即可。


        為了保證 app 的可執(zhí)行性,Streamlit 僅計算更新 UI 所必需的部分。


        Streamlit 適用于 GPU。Streamlit 可以直接訪問機器級原語(如 TensorFlow、PyTorch),并對這些庫進行補充。例如,以下 demo 中,Streamlit 的緩存存儲了整個英偉達 PGGAN。該方法可使用戶在更新左側(cè)滑塊時,app 執(zhí)行近乎即時的推斷。


        該 Streamlit app 使用 TL-GAN 展示了英偉達 PGGAN 的效果。


        Streamlit 是免費開源庫,而非私有 web app。你可以本地部署 Streamlit app,不用提前聯(lián)系我們。你甚至可以在不聯(lián)網(wǎng)的情況下在筆記本電腦上本地運行 Streamlit。此外,現(xiàn)有項目也可以漸進地使用 Streamlit。


        漸進地使用 Streamlit 的幾種方式。


        以上只是 Streamlit 功能的冰山一角而已。它最令人興奮的一點是,這些原語可以輕松組成復雜 app,但看起來卻只是簡單腳本。這就要涉及架構(gòu)運作原理和功能了,本文暫不談及。


        Streamlit 組件圖示。


        我們很高興與社區(qū)分享 Streamlit,希望它能夠幫助大家輕松將 Python 腳本轉(zhuǎn)化為美觀實用的機器學習 app。


        原文鏈接:https://towardsdatascience.com/coding-ml-tools-like-you-code-ml-models-ddba3357eace




        推薦閱讀:

        入門: 最全的零基礎學Python的問題  | 零基礎學了8個月的Python  | 實戰(zhàn)項目 |學Python就是這條捷徑


        干貨:爬取豆瓣短評,電影《后來的我們》 | 38年NBA最佳球員分析 |   從萬眾期待到口碑撲街!唐探3令人失望  | 笑看新倚天屠龍記 | 燈謎答題王 |用Python做個海量小姐姐素描圖 |碟中諜這么火,我用機器學習做個迷你推薦系統(tǒng)電影


        趣味:彈球游戲  | 九宮格  | 漂亮的花 | 兩百行Python《天天酷跑》游戲!


        AI: 會做詩的機器人 | 給圖片上色 | 預測收入 | 碟中諜這么火,我用機器學習做個迷你推薦系統(tǒng)電影


        小工具: Pdf轉(zhuǎn)Word,輕松搞定表格和水?。?/a> | 一鍵把html網(wǎng)頁保存為pdf!|  再見PDF提取收費! | 用90行代碼打造最強PDF轉(zhuǎn)換器,word、PPT、excel、markdown、html一鍵轉(zhuǎn)換 | 制作一款釘釘?shù)蛢r機票提示器! |60行代碼做了一個語音壁紙切換器天天看小姐姐!


        年度爆款文案


        點閱讀原文,領廖雪峰全套資料!

        瀏覽 48
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
          
          

            1. 亚洲五月花 | 一本一道久久综合狠狠 | 婷婷基地第 | AV日韩| 围产精品久久久久久久妞妞 |