天天看點

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

資料一:

以下是帶标題的示例CSV:

Name,Class,Subject,ExamDate,Mark,Description
Prabhat,4,Math,2/10/2013,25,Test data for prabhat.
Murari,5,Science,2/11/2013,24,"Test data for his's test, where we can test 2nd ROW, Test."
sanjay,4,Science,,25,Test Only.
           

和要導入的SQL語句:

BULK INSERT SchoolsTemp
FROM 'C:\CSVData\Schools.csv'
WITH
(
    FIRSTROW = 2,
    FIELDTERMINATOR = ',',  --CSV field delimiter
    ROWTERMINATOR = '\n',   --Use to shift the control to next row
    TABLOCK
)
           

參考資料

https://cloud.tencent.com/developer/ask/48590

------------------------------------------------------------------------------

資料二:

有時候我們可能會把CSV中的資料導入到某個資料庫的表中,比如做報表分析的時候。

對于這個問題,我想一點也難不倒程式人員吧!但是要是SQL Server能夠完成這個任務,豈不是更好!

對,SQL Server确實有這個功能。

首先先讓我們看一下CSV檔案,該檔案儲存在我的D:盤下,名為csv.txt,内容是:

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

現在就是SQL Server的關鍵部分了;

我們使用的是SQL Server的BULK INSERT指令,關于該指令的詳細解釋,請點選此處;

我們先在SQL Server中建立用于儲存該資訊的一張資料表,

CREATE TABLE CSVTable(

Name NVARCHAR(MAX),

Email NVARCHAR(MAX),

Area NVARCHAR(MAX)

)

然後執行下面的語句:

BULK INSERT CSVTable
FROM 'D:\csv.txt'
WITH(
	FIELDTERMINATOR = ',',
	ROWTERMINATOR = '\n'
)
SELECT * FROM CSVTable      
按F5,執行結果如下:
        

怎麼樣?是不是比用程式簡單!

但是現在有幾個問題需要考慮一下:

1,CSV檔案中有的列值是用雙引号,有的列值則沒有雙引号:

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

如果再次運作上面的語句,得到結果就和上一個結果不同了:

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

其中有的列就包含雙引号了,這應該不是我們想要的結果,要解決這個問題,我們隻能利用臨時表了,先把CSV導入到臨時表中,然後在從這個臨時表中導入到最終表的過程中把雙引号去掉。

2,CSV檔案的列值全部是由雙引号組成的:

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

這個問題要比上一個稍微複雜點,除了要先把CSV檔案導入到臨時表中,還必須修改一下在把CSV檔案導入到臨時表的代碼:

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

注意圈中的部分。

3,CSV檔案的列要多于資料表的列:

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

而我們的資料表隻有三列,如果在執行上面的導入代碼,會産生什麼結果呢?

結果就是:

CSV 導入SQL Server(bulk insert方式)資料一:資料二:

它把後邊的全部放在了Area列中了,要處理這個問題,其實也很簡單,就是我們把我們想要的列值在資料表中都按順序建立一列,而把不需要的列值,也在資料表中建立一個,隻不過隻是一個臨時列,在把這個資料表導入到最終表的時候,忽略這個臨時列就行了。

參考資料:

https://www.cnblogs.com/newstar0101/archive/2010/03/15/1685886.html