C++ 字元串、string、char *、char[]、const char*的轉換和差別

1.字元串

字元串本質就是一串字元，在C++中大家想到字元串往往第一反應是std::string(後面簡稱string)

字元串得從C語言說起，string其實是個類，C語言是沒有class的，是以C語言的字元串其實就是字元數組，也就是char [ ] ,例如：

char str[10]; //定義了一個有十個元素的數組，元素類型為字元char

char str[10] = {"hello"}; //"h e l l o \0"五個字元賦給str數組, 然後用‘\0’填滿數組剩餘元素

為什麼要加上'\0'？，‘\0’代表空格符，在字元串結尾加上‘\0’，代表字元串已經結束，讀到\0的時候會停下來，不然會沿着記憶體位址一直讀下去，讀到什麼亂七八糟的東西就不知道了，比如會讀到類似 “燙燙燙燙”的東西。。。

那我如果讓數組元素全部為其他字元，不放\0會怎麼樣呢？可以這樣，如下：

char str[4] = {"abcd"}; //會報錯

編譯器會報錯，不能把“const char[5]” 類型的值不能用于初始化“char [4]”類型的實體

這裡可以看到，編譯器是把"abcd"作為“abcd\0”來處理的，有五個字元

那如果就隻要裝四個字元呢，可以這樣，如下：

char str1[4] = { ‘a’ ,'b', 'c', 'd' }; //這樣就沒'\0'了，可是這樣的話，使用str1來表示字元串也失去了意義

輸出str1，std::cout << str1 << std::endl; 會變成這樣：

C++ 字元串、string、char *、char[]、const char*的轉換和差別

為什麼cout << str1 讀取 str1 就能讀取到 abcd呢？

這是因為C中規定數組名就代表數組所在記憶體位置的首位址，也是 str1[0]的位址，即str = &str[0];

可以了解成讀取str1 的時候其實是在通路 abcd中 a的位址。。

C語言中操作字元串是通過它在記憶體中的存儲單元的首位址進行的，這是字元串的本質

string、char*、char[]、const char *

看一下這四個分别是什麼類型：

int main()
{
	char *p;
	auto s = "111";   //可以看到 "aaa"這樣的類型 其實代表 const char *
	std::string str = "222";
	char a[] = "hello";
	
	std::cout << typeid(p).name()<<  std::endl;
	std::cout << typeid(s).name() << std::endl;
	std::cout << typeid(str).name() << std::endl;
	std::cout << typeid(a).name() << std::endl;
	return ;
}

輸出如下：

C++ 字元串、string、char *、char[]、const char*的轉換和差別

1.char * //字元指針，指向字元的指針

2."aaa"這樣的類型其實代表 const char *，字元串常量

3.string 是std::basic_string模闆類的執行個體化，是一個類...，string str="aaa"; 其實是 const char *轉class ，string重載了=号，把“aaa”封裝成std::string

4.char a[8]; // a的類型是 char [8]，如果是char a[6]; 則a的類型就是char [6] 既長度為N的字元數組

string、char*、char[]、const char *互相轉換

如下表：

C++ 字元串、string、char *、char[]、const char*的轉換和差別

轉化規律總結下:

1.轉化成char[]，可以用strcpy_s ，或者周遊字元串的方式

string 轉char[] : strncpy_s(a, string.c_str(), N); 也可以用上圖的周遊string

const char * 轉char[] : strcpy_s(a, const char *); 也可以用上圖的strncpy_s

char * 轉char[] : strcpy_s(a, char *); 也可以用上圖的strncpy_s

2.char[]變成别的，直接指派

3.轉化為std::string 最簡單，可以直接=, 因為string太強大了，把=号重載了很多遍

4.const char *轉化到 char * 使用const_cast<char *>

5.string轉化為char *　用c_str()

for循環中的陷阱：

char** ppInsId=new char*[50]; 首先解釋下這一句：

char*[50] ，因為[]的優先級高，是以是一個數組，數組元素為指針

new char*[50] 意為開辟一塊記憶體，存放50個char*指針的記憶體空間，大小為sizeof(char*)*50 =200 個位元組

而char** ppInsId 是二級指針，因為右邊是數組，而數組的元素為char型指針，是以指向指針的指針，既為2級指針，char** ppInsId就代表指向記憶體首位址，也就是一個char*指針的指針

對ppInsId 可以用下标通路代表數組第幾個元素，也就是第幾個char *指針

#include<iostream>
using namespace std;
#include <vector>

std::vector<string> vstr;

void makeData(std::vector<string> _vect)
{
   char** ppInsId=new char*[];      //定義了一個二級指針
   for(int i=;i<_vect.size();i++)
   {
      std::string str=_vect[i];
      char *s =const_cast<char*>(str.c_str());
      ppInsId[i]=s;  
   }
   std::cout<<ppInsId[]<<std::endl;     //出了循環，ppInsId[0]和ppInsId[1]都變成了""空
   std::cout<<ppInsId[]<<std::endl;
}

int main()
{
    vstr.push_back("aaaa");
    vstr.push_back("bbbb");
    makeData(vstr);
    return ;
}

這個例子裡，輸出ppInsId[0] 預想是aaaa, ppInsId[1]預想是 bbbb，實際上卻都是“ ” 空

按理說，每個for{}裡面都新定義了s,兩個s應該不一樣才對，确實在C#,java中是一樣的

原因是char *s 是在for{ }裡定義的，第一次循環時ppInsId[0] 被指派為aaaa，一旦第一次循環結束，就s這個變量和s指向的記憶體立馬被釋放掉了，ppInsId[0] 為空，然後第二次循環又定義了一個新的s，可是這個s的位址又指向了那個位址，也就是兩個s指向的位址是一樣，然後ppInsId[1]都變成了bbbb,因為ppInsId[0]和ppInsId[1]指向的位址一樣，s是有兩個，但是兩個for把s的位址剛好是一樣的，然後第二次循環結束，s被釋放ppInsId[0]和ppInsId[1]都變成了空。。。

這裡有個插曲：相同的代碼在vs2017和coldblocks的編譯出來的結果不一樣

vs中出了for循環後，ppInsId[0] ，[1]都為空了，已經被釋放，和我預想的一樣，不知為何codeblocks 還能輸出兩個bbbb

應該是編譯器不一樣導緻的：

vs2017的c++編譯器是:cl.exe,是控制Microsoft C 和C++ 編譯器以及連結器的工具。cl.exe 隻能在支援Microsoft Visual Studio 的作業系統中運作

而codeblock是不安裝編譯器的，需要自己配置，我配置的是Mingou的gdb.exe

那麼怎麼改呢。。

char *s =const_cast<char*>(str.c_str());

ppInsId[i]=s;

改為：

char a[10];

strncpy_s(a, str.c_str(), strlen(str.c_str()));

ppInsId[i] = a;

通過數組的方式，在用strcopy 把值拷貝進去

但是改成char a[10]後也有問題，輸出的是兩個bbbb,原因跟上面char *s 一樣，第一次循環結束後釋放了a，然後第二次進來又把a指到了之前的位址，因為ppInsId[0]的位址還是那個，是以兩個都變成了bbbb

是以繼續改，改成在外面定義一個二維數組：

char** ppInsId = new char*[50];

char a[50][10];

for (int i = 0; i < _vect.size(); i++)

{

       std::string str = _vect[i];

       strncpy_s(a[i], str.c_str(), strlen(str.c_str()));

       ppInsId[i] = a[i];

}

std::cout << ppInsId[0] << std::endl;

std::cout << ppInsId[1] << std::endl;

這樣既可，完成預想中的p[0]為aaaa,p[1]為bbbb

總結：

 1.一定要使用strcpy()函數等來操作方法c_str()傳回的指針

最好不要這樣:

char* c; string s="1234"; c = s.c_str(); //c最後指向的内容是垃圾，因為s對象被析構，其内容被處理

//應該這樣用：

char c[20]; string s="1234"; strcpy(c,s.c_str()); //這樣才不會出錯，c_str()傳回的是一個臨時指針，不能對其進行操作

2.在循環内部或者一塊作用域内，定義變量要注意被釋放的情況

最好放到循環外定義

C++ 字元串、string、char 、char[]、const char的轉換和差別

繼續閱讀

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

C#多線程——前台線程和背景線程

QName是什麼

成員函數初始化清單

2021-08-13c++——類之操作符重載

swmm與lisflood-fp源碼如何一起編譯 CMake指令

Windows下VS開發環境環境安裝工程項目設定關于Debug和Release的提示

一文看懂字元串的加減乘除

Android – ListView 中添加按鈕，動态删除添加ItemView的操作

C++ 第十五周報告1--《冒泡法排序》

C++實作簡單順序表

C經典書籍筆記——C陷阱與缺陷②(文法陷阱之優先級)一、錯誤案列二、優先級規律

線性表之順序表的實作

GridView終極用法(一)

C++判斷素數、求最大公約數代碼判斷一個數是否為素數求兩個數的最大公約數

SequoiaDB巨杉資料庫C++驅動概述