乾明 發自 凹非寺
量子位 報道 | 公衆号 QbitAI
沒想到,滴滴開源的自然語言了解(人機對話)模型訓練平台,就這樣登上了GitHub熱榜。

這一項目名為DELTA,是一個深度學習模型訓練架構,基于TensorFlow建構,滴滴自己内部也在使用,在ACL 2019上宣布開源。
滴滴表示,它可以用于加快實驗進度,部署用于文本分類、命名實體識别、自然語言推理、問答、序列到序列文本生成、語音識别、說話人驗證、語音情感識别等任務的系統。
這是滴滴開源的第22個項目,也得到了谷歌AI大牛、Keras創始人François Chollet轉發支援。
GitHub連結:
https://github.com/didi/delta
模型從論文到産品部署無縫銜接
滴滴介紹稱,DELTA主要基于TensorFlow建構,能同時支援NLP(自然語言處理)和語音任務及數值型特征的訓練。
整合了包括文本分類、命名實體識别、自然語言推理、問答、序列到序列文本生成、語音識别、說話人驗證、語音情感識别等重要算法模型,形成一緻的代碼組織架構,整體包裝統一接口。
使用過程中,使用者要準備好模型訓練資料,并指定好配置Configuration,模型訓練pipeline可以根據配置進行資料處理,并選擇相應的任務和模型,進行模型訓練。
在訓練結束之後,可以自動生成模型檔案儲存,而且模型檔案也能夠形成統一接口,可以直接上線使用,快速産品化。
此外,DELTA在多種常用任務上也提供了穩定高效的Benchmark,可以簡單快速複現論文中的模型結果,也可以在此基礎上擴充新的模型。
模型建構完成後,使用者可以使用DELTA的部署流程工具,迅速完成模型上線,實作從論文到産品部署無縫銜接。
滴滴如何用?
現在,滴滴已經在産品中應用了NLP和語音技術。最核心的産品,是滴滴自建的智能客服系統,能輔助人工客服,提高人工客服處理問題的效率,并減少人工客服在重複、簡單問題上的處理量,就使用了包括自然語言處理、深度學習、知識圖譜、語音、推薦等在内的技術。
此外,基于語音識别以及自然語言了解技術,滴滴也建構了駕駛員語音助手。在日本和澳洲,滴滴實際語音直接“免接觸”接單的功能即将上線。
滴滴表示,将來這一語音助手會支援全方位的語音互動服務,包括影音娛樂、資訊查詢、車内環境調節,到乘客通信、客服,甚至是加油、充電或維保服務。
與此同時,滴滴也宣布,将推進相關能力的開放,通過提供一站式自然語言處理工具、一站式機器人開放平台,幫助行業合作夥伴更好地實作AI應用落地。
今年5月,滴滴釋出群雁智能出行開放平台,宣布将滴滴積累的AI技術、服務、算力以及多元化的解決方案進行全面開放。
據悉,“群雁智能出行開放平台”包括滴滴的AI基礎平台、AI服務能力以及滴滴在出行領域積累的解決方案。
将重點為城市交通管理者、智慧交通企業、汽車産業鍊上下遊合作夥伴、企業開發者及技術極客、高校及科研機構、社會機構和公益組織等提供定制化開放服務。
滴滴一下,AI去哪裡
滴滴的AI曆史很早。
2015年5月,滴滴成立機器學習研究院,就開始将機器學習大規模應用在出行領域,特别是資料挖掘、實時計算等,更是場景天然,應用直接。
當時滴滴創始人還專門從浙江大學挖來AI大牛何曉飛。
次年4月,滴滴機器學習研究院更新為滴滴研究院, 何曉飛擔任創始院長,後來何曉飛離職創業,則由副院長葉傑平和弓峰敏共同掌舵。
研究方向包括機器學習、計算機視覺、人工智能、資料挖掘、最優化理論、分布式計算等。試圖通過機器學習理論和方法,最大化利用交通運力,緩解城市擁堵。
2017年,成立滴滴美國研究院,将以雲安全、 深度學習、人機互動、計算機視覺及圖像學、智能駕駛等領域的技術開發及應用為主要課題,重點發展大資料安全和智能駕駛兩大核心領域。
坐擁海量資料,招攬衆多大牛,滴滴AI開始在行業内展露鋒芒,屢屢在行業頂級賽事中斬獲冠軍。
比如今年4月,滴滴AI團隊聯合北京郵電大學PRIS團隊提出的人臉檢測DFS算法,在世界人臉檢測公開評測集WIDER FACE的Easy、Medium和Hard三個評測子集的六項評估結果中, 超過了國内外衆多科技公司和高校院所,取得了五項第一、一項第二。
而且,滴滴的AI活動,不僅僅隻是立足研究,也涉足AI行業頂級活動。剛剛落幕的AI頂會KDD 2019上,滴滴就是鉑金贊助商。
實際上,無論是資料挖掘、機器學習還是自動駕駛,滴滴在這些領域都有場景,也有技術投入。
隻因為業務太“社會”,反倒是讓人談論其技術實力的時候少了些。
— 完 —