天天看點

C++:字元串分割

字元串切割的使用頻率還是挺高的,string本身沒有提供切割的方法,但可以使用stl提供的封裝進行實作或者通過c函數strtok()函數實作。

1、通過 stl 實作

涉及到string類的兩個函數find和substr:

(1)find函數

原型:size_t find ( const string& str, size_t pos = 0 ) const;

功能:查找子字元串第一次出現的位置。

參數說明:str為子字元串,pos為初始查找位置。

傳回值:找到的話傳回第一次出現的位置,否則傳回string::npos

(2)substr函數

原型:string substr ( size_t pos = 0, size_t n = npos ) const;

功能:獲得子字元串。

參數說明:pos為起始位置(預設為0),n為結束位置(預設為npos)

傳回值:子字元串

代碼如下:

std::vector<std::string> splitWithStl(const std::string &str,const std::string &pattern)
{
    std::vector<std::string> resVec;

    if ("" == str)
    {
        return resVec;
    }
    //友善截取最後一段資料
    std::string strs = str + pattern;

    size_t pos = strs.find(pattern);
    size_t size = strs.size();

    while (pos != std::string::npos)
    {
        std::string x = strs.substr(,pos);
        resVec.push_back(x);
        strs = strs.substr(pos+,size);
        pos = strs.find(pattern);
    }

    return resVec;
}
           

2、通過使用 strtok() 函數實作

原型:char *strtok(char *str, const char *delim);

功能:分解字元串為一組字元串。s為要分解的字元串,delim為分隔符字元串。

描述:strtok()用來将字元串分割成一個個片段。參數s指向欲分割的字元串,參數delim則為分割字元串,當strtok()在參數s的字元串中發現到參數delim的分割字元時 則會将該字元改為\0 字元。在第一次調用時,strtok()必需給予參數s字元串,往後的調用則将參數s設定成NULL。每次調用成功則傳回被分割出片段的指針。

其它:strtok函數線程不安全,可以使用strtok_r替代。

代碼如下:

std::vector<std::string> split(const std::string &str,const std::string &pattern)
{
    //const char* convert to char*
    char * strc = new char[strlen(str.c_str())+];
    strcpy(strc, str.c_str());
    std::vector<std::string> resultVec;
    char* tmpStr = strtok(strc, pattern.c_str());
    while (tmpStr != NULL)
    {
        resultVec.push_back(std::string(tmpStr));
        tmpStr = strtok(NULL, pattern.c_str());
    }

    delete[] strc;

    return resultVec;
};