天天看點

Python必知詞彙:文本

文本,是指書面語言的表現形式,從文學角度說,通常是具有完整、系統含義的一個句子或多個句子的組合。一個文本可以是一個句子、一個段落或者一個篇章。計算機中的文本分為純文字和富文本。

純文字中隻能儲存單一的文本内容,無法儲存内容無關的資訊如字型、顔色、圖檔等。

純文字在計算機底層使用二進制資料進行儲存。在儲存過程中,我們将字元轉換為二進制碼的過程成為編碼。将二進制碼轉換為字元的過程稱為解碼。編碼與解碼采用字元集的規則進行。

富文本,也稱為格式化文本,與純文字相比,除了儲存文本資訊外,還可以儲存風格、排版等資訊,如顔色、式樣(黑體、斜體等)、字型尺寸、特性(如超連結)等。

資料來源:

  • 維基百科詞條:文本檔案
  • 百度百科詞條:文本