python 讀取txt檔案時split()函數的妙用

不知道大家有沒有過需要從

txt

檔案中讀取含有多行多列的資料的經曆，當我們讀入資料時，資料會以

string

的形式被讀入，然而如何進行資料類型轉換就成了大的問題。這裡介紹一種最簡單的方式和容易産生的錯誤使用方法。

txt

測試檔案中的資料如下：

我們使用如下代碼讀取檔案，使用

readlines()

一次性将所有資料全部讀取。

with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    print(all_data)
# ['6.317438621610765E-05  6.123920173773844E-05  0.00010382572761752979\n', '0.00010819194873178063  8.848784016828921E-05  0.0002043378699454479\n', '9.79660835582763E-05  9.750829986943346E-05  0.00021506758227284687']

我們不難發現這時我們的所有資料都被讀入了同一行，但是内部有三個單引号括起來的部分，與我們測試資料中的三行吻合。我們也可以看到，我們需要将這些資料分成單獨的

string

，然後我們就可以使用例如

float

關鍵字對這些資料進行類型轉換。我們看到資料之間是通過空格來分開的。我們第一時間想到我們應該使用

.split(" ")

方法以空格将資料分開。我們嘗試以下代碼：

with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    all_data = all_data[0].split(" ")
    print(all_data)
# ['6.317438621610765E-05', '', '6.123920173773844E-05', '', '0.00010382572761752979\n']

首先我們需要選取第一行，使用

all_data[0]

，然後再使用

split(" ")

函數分開它們。我們成功達到了目的，但是我們同時引入了

""

空字元串項和末尾處

\n

的隐患，很是棘手。這麼做我們就進入了誤區。正确地做法如下：

with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    all_data = all_data[0].split()
    print(all_data)
# ['6.317438621610765E-05', '6.123920173773844E-05', '0.00010382572761752979']

我們使用

split()

函數時不添加任何參數，這樣就一次性去掉了

""

空字元串項和末尾處

\n

的隐患還同時分開了各個字元串。如果需要輸出多行的結果，我們可以預先定義一個數組，用來存放我們的資料，完整代碼如下：(以後所有的多行多列資料均可以如此讀入)

方法一：将資料以二維清單形式讀入

array2d = []
with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    for i in range(len(all_data)):
        temp_list = []
        for element in all_data[i].split():
            temp_list.append(float(element))
        array2d.append(temp_list)

print(array2d)
#[[6.31743862e-05, 6.12392017e-05, 0.000103825728], 
# [0.000108191949, 8.84878402e-05, 0.00020433787], 
# [9.79660836e-05, 9.75082999e-05, 0.000215067582]]

import numpy as np

array = np.zeros((3, 3))
with open(r"C:\Users\15025\Desktop\debug1.txt", "r") as f:
    all_data = f.readlines()
    for i, line in enumerate(all_data):
        numbers = line.split()
        for j, element in enumerate(numbers):
            array[i, j] = float(element)

print(array)
# [[6.31743862e-05 6.12392017e-05 1.03825728e-04]
#  [1.08191949e-04 8.84878402e-05 2.04337870e-04]
#  [9.79660836e-05 9.75082999e-05 2.15067582e-04]]

python 讀取txt檔案時split()函數的妙用

繼續閱讀

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

詳解STM32單片機的堆棧

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入