天天看點

2442 個專業術語!人工智能術語庫 AITD 更新至 3.1 版

2017 年,機器之心釋出了第一版人工智能術語庫「Artificial-Intelligence-Terminology-Database」(以下簡稱「AITD」),一個旨在建構 AI 領域專業術語庫的開源項目。術語庫的前兩版主要是将機器之心在編譯技術文章和論文過程中所遇到的專業術語記錄下來,希望為大家寫論文、中文部落格、閱讀文章提供幫助。此外,讀者可以積極指出我們編譯的不當之處,以提高我們的專業性。同時,這也是一份開放的表單,希望越來越多的人能夠提供增添、修改建議,為人工智能的傳播助力,共同推進知識高效、廣泛地傳播。

近年,人工智能被證明能做科學規律發現,不僅在應用科學領域,也能在基礎科學領域發揮作用,如 DeepMind 使用人工智能來幫助證明或提出新的數學定理,輔助數學家形成對複雜資料的直覺。阿裡達摩院釋出的 2022 達摩院十大科技趨勢之一也是「AI for Science:人工智能成為科學家的新生産工具,催生科研新範式。」

為此,2022 年 2 月,機器之心聯合深勢科技更新「AITD」Version 3.1,釋出第二個「專項領域」AI for Science 篇。「AITD」項目組從《Machine Learning in Chemistry: The Impact of Artificial Intelligence》以及一些經典論文中提取常見術語,并聯合深勢科技的專家們進行了翻譯。

2442 個專業術語!人工智能術語庫 AITD 更新至 3.1 版

項目位址:https://github.com/jiqizhixin/Artificial-Intelligence-Terminology-Database

GitBook 位址:https://jiqizhixin.gitbook.io/artificial-intelligence-terminology-database/

劃重點:「AITD」Version 3.1「專項領域」AI for Science 篇完整内容在本文文末收錄。

「AITD」Version 3.1 更新了什麼?

1、AITD 3.1 版術語庫釋出,包含了 2442 個術語

「AITD」Version 3.1 相較于第一版的 500 詞、第二版的 755 詞,在規模上擴大了不少。術語庫 3.1 版包含了 2442 個專業術語。

2、增加了新的領域專題 Section,第二個 Section 為 AI for Science 篇,包含了 491 個術語

在深勢科技專家的幫助下,「AITD」項目團隊完成了第二個「專項領域」篇 —— AI for Science 篇,并收錄在 Version 3.1 的更新中。在後續的版本更新中,機器之心将搜集自權威教科書、論文等具有公信力的資料源中的術語表進行校驗彙總,并從中篩選出一些具有争議、沒有翻譯等情況的術語給到領域專家進行集中讨論以确認翻譯、統一翻譯。

「AITD」後續有什麼計劃?

本項目中所有英文專業術語對照的中文都來自機器之心編譯的文章和系列機器學習教科書(如周志華教授的《機器學習》、李航博士的《統計學習方法》、邱錫鵬教授的《神經網絡與深度學習》、李沐博士的《動手學深度學習》、李宏毅教授的《機器學習方法》和 Ian Goodfellow 的《深度學習》中譯版等),我們力求在提供準确翻譯的同時保留最常用的形式。同時,為了保證術語翻譯的準确性,我們将此項目向讀者開源,并希望能與讀者共同疊代術語的準确度。

除了日常編譯工作積累之外,我們将逐專項領域基于權威教科書及文獻,聯合領域專家進一步擴充并完善本倉庫,為社群提供具有統一性的 AI 及相關領域的中英術語翻譯對照參考。在接下來的一段時間裡,機器之心将從三個方面持續完善術語的收錄和擴充閱讀的建構:

繼續完善基礎術語的建構,即通過權威教科書或其它有公信力的資料抽取常見術語;

續性地把編譯論文或其他資料中所出現的非常見術語更新到術語庫中;

聯合更多專項領域專家,建構專項領域術語庫。

自「AITD」Version 3.0 起,機器之心「AITD」項目團隊将基于以下标準開展「專項領域」術語庫工作:

1)基于權威教科書、論文等具有公信力的資料源提取詞彙。

2)邀請對應領域專家進行專業指導

緻謝!

衷心感謝深勢科技以下專家參與了包含但不限于術語提供、校對、翻譯研讨等工作,為該項目擴充了專項領域術語收錄的覆寫度、提升了術語中文翻譯用法的準确性、專業性及公信力,感謝老師們的辛勤貢獻。

AI for Science 篇

張铎,DP Technology,DeepModeling 開源社群成員 @iprozd

蔡淳 ,DP Technology,DeepModeling 開源社群成員 @caic99

董昊森,DP Technology,DeepModeling 開源社群成員 @Asuna981002

深勢科技成立于2018年,緻力于以新一代分子模拟技術解決微尺度工業設計難題。深勢科技自研算法Deep Potential在保持量子力學精度準确性的基礎上,将分子動力學的計算速度提升了多個數量級;結合高性能計算,能夠對數十億原子規模的體系進行量子力學精度的計算模拟。圍繞領先的分子模拟方法,深勢科技正在推動 DeepModeling 開源社群建設,以開放與包容的環境,推動全球科學計算事業發展。釋出兩年多以來,DeepModeling社群中的開源軟體已得到國内外近千個研究組使用,涉及實體、化學、材料、生物、地質等多個領域。

讀者及使用者的回報意見和更建立議将貫穿整個階段,我們也将在項目緻謝頁中展示對該項目起積極作用的讀者及使用者。如果您在使用術語庫的過程中若發現了存在的錯誤、或是想要擴充術語庫的内容、讨論特定術語的翻譯等等非常歡迎大家提 Issue 與我們以及各位讀者進行讨論(請附帶來源,以便我們能更客觀地更新詞彙)。同時也非常歡迎讀者們進行 Fork、提 Pull Request,共同加強術語的編譯品質以及擴充術語庫的規模。

「AITD」Version 3.1:「AI for Science」專項領域術語中英對照表

2442 個專業術語!人工智能術語庫 AITD 更新至 3.1 版

參與「AITD」!

我們邀請更多感興趣一起參與「AITD」項目的小夥伴通過加入「機器之心分析師網絡」加入到「AITD」項目工作中來。除了旨在建構 AI 領域術語庫的「Artificial-Intelligence-Terminology-Database」,機器之心目前還有「開放知識庫」 GitHub 項目,例如 ——

「ML-Tutorial-Experiment」算法教程與實作項目目前共獲得 2500+ Star。它目前有五篇詳細的教程文章,即 CNN 的實作、經典 GAN 的推導實作、 CapsNet 的解讀、LSTM 等語言模組化和基于 Transformer 的神經機器翻譯實作。我們希望能提供高品質和能實作的技術文章,在這些文章中,我們所使用的代碼塊或整體實作都是我們預先測試的,且提供的 JupyterNotebook 都帶有代碼注釋,非常适合初學者随文章閱讀。

項目位址:https://github.com/jiqizhixin/ML-Tutorial-Experiment

「SyncedLeg2018」 機器之腿項目是源于機器之心 2018 年暑期實習生 Hackathon 的輸出成果,可基于微信曆史文章與相應的流量資料、分析統計出熱點詞彙。

項目位址:https://github.com/jiqizhixin/SyncedLeg2018

加入機器之心分析師網絡,在參與機器之心發起的人工智能及相關技術領域的「開放知識庫」項目之外,還将有機會受邀作為特約分析師:

現場參與國内外學術、學術及産業盛會,現場觀察。

參與熱點技術解讀、名額分析、性能評測等專業性技術分析項目。

參與熱點事件解讀、産業前景分析等專業性産業分析項目。

繼續閱讀