Written by joezou(鄒鎮洪), 2019/3/4
項目 | 内容 |
---|---|
這個作業屬于課程 | 人工智能實戰 2019 - 北京航空航天大學 |
這個作業的要求在 | 第一次作業 介紹自己,提出課程項目建議 - 作業 - 人工智能實戰 2019 |
我在這個課程的目标是 | 學會利用雲部署機器學習模型并完成一個app |
這個作業在這些方面幫助我實作目标 | 了解如何開發實用項目 |
作業正文:
1. 描述你在這門課想要達到的具體目标。
- 掌握在在雲上部署機器學習模型的能力。
- 部分地借助Azure或AWS完成一個實用app。
- 提高團隊合作coding的能力。
2. 描述你學過什麼計算機語言, 代碼量大約是多少行。我們這次課程主要用 Python 語言, 請抓緊時間自學或鞏固你的Python 知識。
- Python:代碼20k+行,主要包括一個關于商品推薦的項目。
- C:代碼約4k行,主要是數值分析作業。
3. 如果你要和另外 4 - 5 名同學一起做一個小的 AI 項目,你有什麼想法,請描述一下。請按照這個 NABCD 格式來寫你的項目建議。
我的構想項目是輔助視覺系統,以下是NABCD内容:
1) N (Need 需求)
對于視障人員而言,目前主要輔助工具為導盲犬、陪護人員等具備視力的生物,但無疑這些服務均需要一定成本和時間進行培養,且仍在許多情況下不适用,比如導盲犬無法于盲人進行充分的資訊交流、陪護人員難以做到終生陪伴等。對于如夜晚等弱視環境而言,視覺輔助系統,如夜視鏡,也有着重要的工程應用。于此同時,各種視覺輔助穿戴裝置不斷湧現,如谷歌眼鏡等,說明這裡有一定的市場,而在計算視覺和自然語言處理技術的加持下它會發展得更好。
2) A (Approach 做法)
計劃分三部分達成,其中第2部分在3-5年達成内較為現實:
提高微型計算機計算能力
主要通過提高傳感器精度和計算機實時圖像處理能力達成,尤其是後者,需要解決目前CV和NLP技術在小規模機器(眼睛搭載單片機)上以低能耗高速計算的能力,以及高能小型電池的研發。但還有一個替代方案,如果日後5G通信和物聯網技術發展充分,也可以借助街道攝像頭擷取街景資料,眼睛負責近距離圖像,而資料全部上傳雲端,雲端模型完成訓練後傳回本地,好處是可以通過雲端的機器數量備援來暴力實作高速實時處理,特别适用于限制範圍的場景,如實景遊戲。
搭建video to text模型
現有算法專注于文本了解、視訊實體識别、視訊分類等基本步驟,這些步驟的組合可以搭建一個粗糙的video to text模型,但該模型的複雜度過高,我們希望可以建構全新的end to end模型,并希望輸出為“自然對畫面的動态描述”而不是“機械地描述客觀環境狀态”,以模拟真人的對話效果。
實景測試并逐漸推向市場
按科學實驗->康複醫療->工地應用->市場娛樂的步驟逐漸開發産品,從醫療入手是因為醫療領域的需求最硬且對産品功能多樣化要求最低,最後進軍娛樂是因為娛樂市場對産品體驗要求最高,過早投入面臨較高的冷場風險。
3) B (Benefit 好處)
無疑,目前沒有任何一款裝置可以幫助視障患者恢複視覺,目前視覺輔助産品也僅限于雷達和紅外探測等初級感覺智能,無法适用于複雜的生活實景,也無法于使用者進行充分的資訊交流,如浙大在2017年的視覺輔助系統。這款産品将為使用者帶來全新的體驗,在較大程度上讓盲人擷取外部視覺資訊。
但無疑,在當先微機計算能力、電池技術、人工智能技術和移動通信水準下,5年内仍看不到實作的可能,且産品在早期必然價格不菲。目前有可能實作的僅有第2部分。
但我相信這是一項重要的穿戴産品,随着計算機視覺技術和智能眼睛技術的發展終将出現,是以早期的技術累計是必要的。
4) C (Competitors 競争)
産品競争:現有的初級視覺輔助系統和AR裝置(遊戲領域);未來的腦機智能裝置(直接與腦電信号交流)
目前技術競争:各大CV公司的視訊了解技術均為強大競争,國内主要是位元組跳動、BAT,自動駕駛廠商也構成部分競争。
5) D (Delivery 傳遞, Data 資料)
傳遞:已在A中闡述,先從醫療合作入手。
資料:未進行調研,目前國内僅有浙大一家開發了盲人輔助視覺系統,2017年獲得600萬美元融資,估計競争較少是技術問題。
4. 建立一個你的 github 賬戶, 學習github 的基本操作,并且關注 https://github.com/microsoft/ai-edu, 浏覽相關的課程内容。(在你的部落格文章列出賬戶連結即可)
我的github