@
目錄
- [1] 資訊檢索語言
- [2] 資訊檢索技術
- [3] 資訊檢索工具
- [4] 資訊檢索流程
資訊檢索語言是用于描述資訊系統中的資訊的内容特征,常見的資訊檢索語言包括分類語言和主題語言。就神經網絡架構搜尋這個問題來說,最好選擇主題語言,可以通過借助自然語言,更具有直覺性和概念唯一性。而主題語言分為關鍵詞語言和純自然語言。
選用關鍵詞語言就要挑選神經網絡架構搜尋的關鍵詞,表征文獻主題内容具有實質意義的詞語,不要将冠詞、介詞、副詞、連詞作為查詢的關鍵詞。
采用布爾邏輯檢索的方法:
- 使用邏輯運算符将檢索詞、短語、代碼進行邏輯配置
- 指定文獻命中條件群組配次序
- 是構造檢索最基本的比對模式,最高效的檢索技術。
以神經網絡搜尋技術為例,搜尋
CNKI中國知網
資料庫,選擇進階檢索:
挑選關鍵詞 神經網絡架構搜尋+NAS+架構搜尋
主題中的加号是進階檢索比對運算符, 規則如下:
進階檢索支援使用運算符*、+、-、''、""、()進行同一檢索項内多個檢索詞的組合運算,檢索框内輸入的内容不得超過120個字元。
輸入運算符*(與)、+(或)、-(非)時,前後要空一個位元組,優先級需用英文半角括号确定。
若檢索詞本身含空格或*、+、-、()、/、%、=等特殊符号,進行多詞組合運算時,為避免歧義,須将檢索詞用英文半角單引号或英文半角雙引号引起來。
檢索結果:
在IEEE中檢索嘗試:
搜尋非中國人發表文獻:
發現非中文發表文獻就有5k之多,檢索結果如下:
查找中國發表的相關内容,隻有300篇,看來國内在這個領域并沒有處于領先地位。
- 截詞檢索
- 一般用于引文資訊的檢索,為了避免檢索式過長,一般會在資訊檢索時使用截詞檢索。
- 一般有
和*
: * 代表無限個字元;?代表有限截斷,一個字元?
- 字段限制檢索
- 将檢索詞限定到一個或者多個字段中,來檢索這些檢索字段含有的資訊,一般都是檢索提名、主題或者全字段。
- 有題名,篇名
- 作者機關
- 摘要
- 關鍵詞
- 主題詞
- 全文
- 作者
- 書名
- DOI: Igital Objects Identifier: 數字化對象辨別符,通過DOI可以擷取該文獻對應的中繼資料、下載下傳連結,進而可以擷取文摘資訊,全文。
- 出版年
- 問下按類型
- 所有字段
- 聚類檢索
- 自動聚類使用者所需要的相關資訊,重點完成使用者的特性查詢,通過幾次疊代查詢,一般能找到目标的結果。
- 比如:主題、發表年度、文獻來源、機構、基金、文獻類型
網絡資料庫和搜尋引擎是最主要的檢索工具,國際三大科技文獻檢索系統:
- 科學引文索引 Science Citation Index SCI
- 工程索引 Engineering Index EI
- 科技會議索引CPCI-S Conference Proceedings Citation Index-Science
一般去Web of Science查詢文獻
4.1 分析問題
神經網絡架構搜尋是近些年興起的領域,屬于計算機科學領域的研究,時間設定可以是2012年-2021年,因為2012年是神經網絡興起的年代,再往前的文獻參考價值不大。目前國内外都有研究,國外以谷歌、微軟等巨頭研究領先,國内也有百度、華為等公司在開展相關業務,是以語種設定可以不限,一般是英文或者中文。
4.2 選擇檢索工具
這裡選擇web of science作為檢索工具
4.3 拟定檢索詞
Neural Architecture Search
NAS
4.4. 編寫檢索式
TS=(Neural Architecture Search OR NAS)
4.5 擷取原文或者文獻線索
這樣會存在問題,如果是多個詞,需要用冒号包起來,結果如下:
代碼改變世界