天天看點

巧用COCA,語料庫武力值UP!

1.介紹

美國當代英語語料庫(Corpus of Contemporary American English)是由美國楊伯翰大學 (Brigham Young University) 的Mark Davie教授開發,美國最新當代英語單語語料庫,是當今世界上最大的英語平行語料庫。官網:https://www.english-corpora.org/coca

2.頁面詳解

巧用COCA,語料庫武力值UP!

2.1 首頁面

List:清單視圖

Chart:用于比較檢索項在五種領域和不同時段内的頻次

Collocates:用于研究詞語搭配

Compare:用于比較兩個詞的搭配現象,研究在其意義和用法上有何不同

KWIC:Keyword In Context,通過對檢索項相鄰的左邊或右邊若幹個詞排序,研究檢索詞的用法

2.2 進階功能

Sections:條件檢索,能夠指定要檢索的時間段等

Texts/Virtual:基于COCA内的語料建立自己的語料庫

Sort/Limit:設定結果排序規則,可以按頻率、相關性和英文字母三種方式排序。設定最低頻率,最小互資訊值

Options:其他設定

3.Search功能

在“Search”頁面下選擇“List”一欄,并在搜尋框中搜尋,以“expect”一詞為例:

巧用COCA,語料庫武力值UP!

輸入後點選“Find matching strings”就會跳轉到進入“Frequency”頁面,如下圖所示⬇

巧用COCA,語料庫武力值UP!

在該頁面點選“expect”詞條就會跳轉到“Context”頁面檢視該詞條出現的語境;随後在該頁面點選任意縮寫,即可檢視詳細的語境。如下圖所示⬇

巧用COCA,語料庫武力值UP!

4.Chart功能

在“Search”頁面下選擇“Chart”一欄進行檢索,就可以通過柱狀圖直覺統計檢索的詞條在不同文體和不同年份中的詞頻情況,這樣有利于更恰當的使用該檢索詞。如下圖所示⬇

巧用COCA,語料庫武力值UP!
巧用COCA,語料庫武力值UP!

注:ACAD:學術類期刊;BLOG:部落格;FIC:小說;MAG:雜志;NEWS:新聞;SPOK:口語;WEB:網站

5.Collocates功能

Collocates功能下有兩個搜尋欄:

  • Word/phrase:在這裡鍵入短語中的核心詞
  • Collocates:鍵入搭配的介詞、冠詞等内容,如不知道核心詞後應搭配哪個介詞或冠詞,或者想限定詞性進行檢索,可以在兩個搜尋欄後面的[POS](Part of Speech,詞性)中鍵入想限定的詞性即可

以“expect”一詞為例,如要檢索expect後兩個詞内會使用的介詞,可進行以下操作:

巧用COCA,語料庫武力值UP!

1.在“Word/phrase”搜尋欄鍵入“expect”;

2.在“Collocates”搜尋欄鍵入“_i*”表示查詢與介詞的搭配,如要查詢名詞則把其中的“i”替換為“n”即可,其他詞性同理;注:個别詞性規則:名詞:[n*];動詞:[v*];形容詞:[j*];副詞:[r*];代詞:[p*];連詞:[c*]。

3.在搜尋欄下面的數字部分進行選擇;

巧用COCA,語料庫武力值UP!

4.點選“Find collocates”進行檢索,在跳轉的“Frequency”頁面就會顯示與expect搭配的介詞的使用情況,見下圖⬇

巧用COCA,語料庫武力值UP!

有些詞不隻有一個詞性,比如look,如要檢索它作為名詞時的搭配情況,則在“Word/phrase”搜尋欄中先鍵入“look”,再在該詞之後加一個英文句号、方括号,方括号裡輸入詞性,即“look.[n*]”。

6.Compare功能

當對比兩個近義詞或同義詞,但不知道它們各自如何搭配時,可以使用Compare功能,比如對比work和job分别與哪些動詞搭配使用。

在兩個搜尋欄分别鍵入“work”和“job”,在“collocates”部分鍵入動詞詞性,同時調整數字部分,見下圖⬇;

巧用COCA,語料庫武力值UP!

點選“Compare words”後,在跳轉的“Frequency”頁面就會顯示結果

其中“W1”表示與“work”搭配的某一動詞的詞頻;“W2”表示與“job”搭配的某一動詞的詞頻;右側表格正好相反

巧用COCA,語料庫武力值UP!

在跳轉的“WORD”頁面看到結果如下圖⬇

巧用COCA,語料庫武力值UP!
巧用COCA,語料庫武力值UP!

7.Browse功能

(1)在“Browse”頁面下可以查詢詞的使用情況、排名、詞性等資訊。同樣以“look”為例:

在“Search”頁面下點選“Browse”,即可進入該頁面,見下圖⬇

巧用COCA,語料庫武力值UP!

搜尋結果如下⬇:

巧用COCA,語料庫武力值UP!

(2)在“Browse”頁面下可以查詢以某個字首或字尾開頭或結尾的單詞,以“-ism”為例,見下圖⬇:

巧用COCA,語料庫武力值UP!

注:切勿忘記輸入“*”,“*”在此代表所有以“-ism”結尾的詞

搜尋結果如下⬇:

巧用COCA,語料庫武力值UP!

(3)在“Browse”頁面下可以查詢6萬詞範圍内的詞彙的使用排名,比如在“Range”搜尋欄中輸入“1-500”,即可查詢詞庫中常用的前500個都是哪些詞彙,見下圖⬇:

巧用COCA,語料庫武力值UP!

搜尋結果如下⬇:

巧用COCA,語料庫武力值UP!

8.KWIC功能

KWIC(Keyword in Context)也叫語境共現(Concordance),以檢索詞為中心,可以看到檢索詞所處的上下文語境以及一些詞性。以“expect”為例:

巧用COCA,語料庫武力值UP!

搜尋結果如下⬇:

巧用COCA,語料庫武力值UP!

注:不同顔色代表不同詞性。藍色:名詞;紫色:動詞;綠色:形容詞;棕色:副詞;灰色:代詞;黃色:介詞。

9.通配符使用

(1)比如想要搜尋organization前搭配的動詞有哪些,就可以在“SEARCH”頁面的搜尋欄中輸入“[*v] organization”。(*可代替任意數量字母)

巧用COCA,語料庫武力值UP!

在跳轉的頁面就可以看到與“organization”搭配的動詞的使用頻率,搜尋結果如下圖⬇:

巧用COCA,語料庫武力值UP!

同理,如要查詢搭配的其它詞性的詞,詞性規則與“Collocates功能”中用到的相同。

(2)搜尋近義詞:在搜尋欄中輸入“[=develop]”,表示和develop意思詳盡的所有形容詞:

巧用COCA,語料庫武力值UP!
巧用COCA,語料庫武力值UP!

如要查詢與“a strategy”搭配且與“develop a strategy”意義相近的類似詞組,也是同理,在搜尋欄輸入“[=develop] a strategy”即可得到結果。見下圖⬇:

巧用COCA,語料庫武力值UP!
巧用COCA,語料庫武力值UP!

(3)如想查詢某種詞性且此種帶有部分帶有某些字母的形式,比如要查詢以un-開頭、-ed結尾的所有形容詞的所有形式,輸入“un*ed.[*j]”即可查詢(.[*j]表示詞性是形容詞)。見下圖⬇

巧用COCA,語料庫武力值UP!
巧用COCA,語料庫武力值UP!

(4)若想查詢動詞+任何詞+ground的所有詞組,在搜尋欄輸入“[vv*] * [ground]”即可得到結果(方括号中間有空格)。

前者用來查詢詞彙,後者用來查詢特定詞性的搭配

巧用COCA,語料庫武力值UP!
巧用COCA,語料庫武力值UP!

(5)如要搜尋以s開頭、第三個字母是n的任意單詞,則可以輸入“s?n*”進行查詢。(?可代替一個字母)

巧用COCA,語料庫武力值UP!
巧用COCA,語料庫武力值UP!

本期分享到此結束,希望大家可以通過此次分享有所收獲~

特别說明:本文僅供學習交流,如有不妥歡迎背景聯系小編。

- END -

翻譯技術教育與研究——搜尋煮譯專題小組緻力于普及搜商概念、推廣搜尋資源、傳播搜尋方法、讓搜尋成為每一位譯者的習慣,進而提高譯者的工作效率。專題小組目前的主要方向是探索搜尋資源、搜尋内容、搜尋技巧、資訊甄别、文本操控、碎片知識管理等相關知識。小組成員經由老師指導,通過定期會議及讨論的形式确定選題,并以推文的形式分享探索結果。歡迎大家積極留言以及對搜尋煮譯專題小組提供建設性意見!

原文作者:田貝西

推文編輯:賈銳