【PaperReading每日打卡20220308】[星數]三顆星，收藏榜[類型]文檔圖像Transformer的自監督

作者：碼科智能 2022-03-08 21:49:00

【PaperReading每日打卡20220308】

[星數] 三顆星，收藏榜

[類型] 文檔圖像Transformer的自監督預訓練

[文章] DiT: Self-supervised Pre-training for Document Image Transformer

[機構] Shanghai Jiao Tong University & Microsoft Research & Microsoft Azure AI

[簡介] 圖像Transformer在自然圖像了解方面取得了重大進展，無論是用有監督(ViT、DeiT等)還是自監督(BEiT、MAE等)預訓練技術。本文提出DiT，一種自監督預訓練文檔圖像Transformer模型，用大規無标記文本圖像來完成文檔人工智能任務，這一點至關重要，因為由于缺乏人工标記的文檔圖像，從來沒有監督資料。利用DiT作為骨幹網絡來完成各種基于視覺的文檔人工智能任務，包括文檔圖像分類、文檔布局分析以及表格檢測。實驗結果表明，自監督預訓練的DiT模型在這些下遊任務上取得了新的最先進的結果，如文檔圖像分類（91.11→92.69），文檔布局分析（91.0→94.9）和表格檢測（94.23→96.55）。

【PaperReading每日打卡20220308】[星數]三顆星，收藏榜[類型]文檔圖像Transformer的自監督

【PaperReading每日打卡20220308】[星數]三顆星，收藏榜[類型]文檔圖像Transformer的自監督

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普