天天看點

考研英語單詞學習--單詞資料整理2、将資料導入資料表并分析

對于考研英語,英語單詞的重要性可想而知,考研單詞實體書、電子書 多種多樣。

如何能設計一個适合自己學習的單詞學習工具,使得單詞學習輕松愉快,就顯示尤為必要。

資料整理,網絡上各種資料林立,收集整理資料建設适合系統适用的資料集。

1、系統用資料結構

通常,平台使用資料是存放在資料庫中,單詞的存放,需要建立一個資料表,用于存放zk考研單詞大綱。

基本資料結構:

表名:NewWord

字段 :ID(序号),word(單詞),part(詞性),exp(解釋),memo(備注),類型為字元類型,長度為适用長度即可。

詞性查詢字典的解釋為part of speech ,感覺不合适,專門請教英語專業教師,确認就是這個,這種翻譯好像不符合邏輯。

2、将資料導入資料表并分析

通常網絡單詞給出的都是一個單詞一個文本行,而我們在資料庫中需要的是将文本行分為3個組成部分(word,part,exp),分析資料格式,可以看出單詞與後面的内容使用空格進行分離的,詞性與解釋沒有分開,甚至還有詞性+解釋+詞性+解釋 、詞性/詞性+解釋等情況,需要進行程式設計分離。

資料z導入步驟:

(1)由于網絡資料,特殊字元可能混雜其中,通常情況下,需通過記事本進行過濾,即将資料拷貝到記事本中,然後再從記事本中拷出使用

(2) 直接将單詞行拷貝到資料表中的memo字段中,然後采用sql語句進行分析,将分解的内容分别放置到(word,part,exp)字段中。

(3) 以單一單詞詞性為資料的資料分組(n.,v.,vi.,vt.,adj.,adv.等等),以組合單詞詞性為資料的資料分組n./vi. , n./vt., adj./ad. 等等,或 n.v.,n.a. 等等。

(4) sql語句略。