本周關鍵詞:深度學習、3D對象跟蹤、機器翻譯
本周最佳學術研究
蒙娜麗莎在現實生活中看起來如何?一個可以“放大”圖像的AI模型
一組研究人員最近提出了一種新的超分辨率算法,該算法可以以研究中從未見過的分辨率生成高分辨率,逼真的圖像。所有這些操作都是通過無監督的方法完成的,進而無需對成對的LR-HR圖像資料集進行訓練。
基本上,AI擴充使用了一個深度學習模型,該模型以低分辨率(LR)圖像作為輸入并預測高分辨率(HR)圖像,該圖像将縮小為原始的低分辨率圖像。
研究人員使用了一個名為PULSE的新模型,而不是從LR圖像開始并逐漸添加細節。在新模型中,PULSE周遊高分辨率的自然圖像,搜尋能縮小到原始LR圖的圖像。這是通過“按比例縮小損失”來形式化的,在搜尋時運用了潛在空間的生成模型。這篇論文中包括了很多的應用資料,證明了該方法在人臉超分辨率領域的有效性。研究人員還讨論了該方法的局限性和偏見。
觀看視訊:
https://www.youtube.com/watch?v=CSoHaO3YqH8&feature=youtu.beGitHub:
https://github.com/adamian98/pulse原文:
https://drive.google.com/file/d/1fV7FsmunjDuRrsn4KYf2Efwp0FNBtcR4/view用RepNet計算視訊中的重複次數
在本文中,Google和Deep Mind的研究人員示範了,将綜合訓練資料進行簡單組合,以及使用時間自相似性的體系結構,進而産生了功能強大的與類無關的重複計數模型RepNet。
RepNet成功地檢測了周期性并預測了對各種對象,動物和人類中不同角色的數量,并且對大量視訊進行了評估。該模型解決了簡單重複的情況,下一步則是考慮更複雜的情況,例如對多個同時重複的信号進行檢測或者檢測類似舞蹈和音樂中的重複片段等。
RepNet是一個單一模型,可以計算來自許多不同域的重複次數,也可以用于監視重複活動的速度變化。
http://openaccess.thecvf.com/content_CVPR_2020/papers/Dwibedi_Counting_Out_Time_Class_Agnostic_Video_Repetition_Counting_in_the_CVPR_2020_paper.pdf一個生成用于深度學習的高性能Tensor程式
深度學習生态系統正在擁抱硬體平台(包括CPU,GPU,FPGA和ASIC)的快速增長,為了在這些平台上部署DNN,DNN中使用的運算符需要高性能的張量程式。但是,要在各種硬體平台上為不同的運算符擷取性能張量程式非常困難。
為了解決這一挑戰,加州大學伯克利分校,阿裡巴巴,亞馬遜網絡服務和杜克大學的研究人員探索了一種新穎的搜尋政策,以生成高性能張量程式。
他們介紹了Ansor,一個用于深度學習應用程式的張量程式生成架構。通過有效地探索大型搜尋空間,Ansor可以找到現有方法搜尋空間之外的高性能程式。
Ansor在各種神經網絡和硬體平台上的表現優于現有的手動庫和其他基于搜尋的架構,最高可優化3.8倍。Ansor的所有源代碼都将開源。
https://arxiv.org/abs/2006.06762v2通過增強現實中的應用程式進行即時3D對象跟蹤
單眼視訊中的跟蹤是計算機視覺中一個具有挑戰性且經過充分研究的問題。盡管2D跟蹤已經有了強大的解決方案,但從單眼RGB圖像進行3D跟蹤仍然是一個巨大的挑戰。
最近釋出的這篇論文提出了一種用于3D對象跟蹤的系統,該系統能夠在移動裝置上進行實時3D邊界框跟蹤。該系統使用神經網絡初始化3D姿勢,然後利用平面跟蹤器在視訊幀中跟蹤對象的姿勢。該端到端系統在移動裝置上可以實時運作。
該跟蹤器能夠在移動裝置上實時執行相對規模為9自由度的跟蹤。通過有效地結合使用CPU和GPU,它在移動裝置上實作了26-FPS +的性能。
閱讀更多:
https://arxiv.org/abs/2006.13194v1機器翻譯如何兼得速度與品質
快速且準确的機器翻譯是研究和生産中具有廣泛應用的基本目标。
為了推動該領域的研究,Facebook AI和艾倫研究所的研究人員提供了廣泛的經驗研究,該研究證明通過一種簡單的層配置設定政策(深層編碼器,淺層解碼器)可以大大加快自回歸翻譯的速度。
與強大的非自回歸模型相比,深淺結合的自回歸模型以可比的延遲在翻譯品質上實作了顯著的提高。
結果表明,在任何序列到序列任務中,編碼器和解碼器之間更好的層配置設定可以加速推理。具體來說,具有深度編碼器和淺層解碼器的模型可用于大規模預訓練并生成序列,以BART為例,延遲減少将在許多實際應用中成為關鍵。
https://arxiv.org/abs/2006.10369v1其他爆款論文
使用自我監督改進語音表示和個性化模型:
https://arxiv.org/abs/2002.12764基于深度重構和預測的自治系統異常檢測:
https://arxiv.org/abs/2006.14556v1自然語言進行中對抗性攻擊的架構:
https://arxiv.org/abs/2005.05909v2通過3DMotion-Net學習連續流函數以進行3D運動預測:
https://arxiv.org/abs/2006.13906v1從原始失真的視訊中發現實體定律:在未經監督的原始且可能會失真的視訊中,對對象的運動方程進行無監督學習的方法:
https://arxiv.org/abs/2005.11212v1資料集
緻命的NLP資料庫:
https://datasets.quantumstat.com/競賽:有效的開放域問答
如果你有興趣開發一個問答系統,其中包含回答開放域問題所需的所有知識,那麼你可以參加此開放域問答問題。
在競賽網站上找到可供下載下傳的資料和評估代碼,以及有關如何參與的日期和說明,以及用于更新的系統資料庫格。
網站位址:
https://efficientqa.github.io/ https://ai.googleblog.com/2020/06/presenting-challenge-and-workshop-in.htmlAI大事件
特朗普當機新簽證可能威脅美國在人工智能領域的主導地位:
https://www.technologyreview.com/2020/06/26/1004520/trump-executive-order-h1b-visa-threatens-us-ai英偉達和梅賽德斯将在2024年之前推出軟體定義的自動駕駛汽車:
https://www.zdnet.com/article/nvidia-and-mercedes-benz-to-roll-out-software-defined-autonomous-vehicles-by-2024/機器學習如何發現異常情況來抓捕金融網絡犯罪分子:
https://thenextweb.com/neural/2020/06/26/how-machine-learning-combats-financial-cybercrime-syndication/