天天看點

不一樣的大小寫轉換

假設有一個string “BaSiC”,需要将它轉變為大小寫,那麼該如何轉換?

最簡單的方式:調用api:

string str = "BaSiC";

string strUpper = str.ToUpper();

string strLower = str.ToLower();

第二種方法:調用Char.ToUpper(),Char.ToLower()方法,同樣是調用api

第三種方法:使用for循環來判斷,如果是大寫就,如果是小寫就..

首先觀察大寫字母和小寫字母的異同:

<a href="http://images.cnblogs.com/cnblogs_com/LoveJenny/201112/20111209063511207.png"></a>

列印上面的代碼如下,有興趣的可以自己試試列印這樣的表格出來:

Console.WriteLine("{0,-3} | {1,-6} | {2,-8} | {3,-3} | {4,-6} | {5,-8}",

    "小寫", "ascil", "2進制", "大寫", "ascil", "2進制");

IEnumerable&lt;char&gt; chars = Enumerable.Range('a', 'z' - 'a' + 1).Select(i =&gt; (char)i);

foreach (char c in chars)

{

    char upperC = char.ToUpper(c);

    Console.WriteLine("{0,-5} | {1,-6} | {2,-10} | {3,-5} | {4,-6} | {5,-10}",

        c, (int)c, Convert.ToString(c, 2),

        upperC, (int)upperC, Convert.ToString(upperC, 2));

}

從上面很容易看的出來’a’ 比大寫的’A’ 的ascil多32,從這點出發就可以得到下面的代碼:

private static char[] GetUpperChars(string str)

    char[] chars = str.ToCharArray();

    for (int i = 0; i &lt; chars.Length; i++)

    {

        if (char.IsLower(chars[i]))

        {

            chars[i] = (char)(chars[i] - 32);

        }

    }

    return chars;

這段代碼使用for循環并加入判斷,如果是小寫,則将其值減去32,調用也比較簡單:

string strUpper2 = new string(GetUpperChars(str));

這段代碼唯一的缺點是進行了IsLower的判斷,可不可以在沒有判斷的情況下來修改chars使其變成大寫呢?

如果從Ascii 的角度來解決這個問題,那麼我們就必須使用大小寫的判斷,我在彙編語言的書上看到了這句話:

如果一個問題的解決方案,使我們陷入一種沖突之中,那麼很可能是我們考慮問題的出發點有了問題,或者說我們起初運用的規律并不适合。

這段話的意思是,可能我們應該從其他角度來觀察,而不應該從Ascii的角度來觀察。

如果不從Ascii的角度來觀察,那還能從哪裡來觀察呢?

可以從2進制的角度來觀察。

<a href="http://images.cnblogs.com/cnblogs_com/LoveJenny/201112/201112090635128387.png"></a>

還是這幅圖,隻是我們的觀察角度變成了2進制。

a 的2進制:1100001, b的2進制1100010,..

A 的2進制: 1000001, B的2進制1000010,..

可以知道a的第5位是1,而A的第5位是0,(從右邊往左邊數,0開始,後面得第幾位都這樣數)

        b的第5位是1,而B的第5位是0,

        ..

是以如果要将一個字元串變成大寫,隻需要将字元串的所有字元的第5位全部變成1就可以了。

而如何将一個字元的第5位變成1呢?

答案是使用And(位運算)操作.

首先a 是個7位字元,隻是以是7位,是因為在制定Ascii的時候位比較貴,8位比較浪費,而6位又不夠,是以ascii碼是7位的,這點從

a 是1100001 就可以看出了,總共7位。

它可以和0101-1111 或者是1101-1111,進行And

在C#中And 是&amp;

是以你可能會将函數修改為:

for (int i = 0; i &lt; chars.Length; i++)

    chars[i] = (char)(chars[i] &amp; 11011111);

先停一下,你認為上面的寫法正确嗎?

然後運作,結果卻發現:

<a href="http://images.cnblogs.com/cnblogs_com/LoveJenny/201112/201112090635132390.png"></a>

為什麼?

這是因為C#中的&amp; 預設操作的是十進制的數字,是以11011111,

就會變成一千一百零一萬一千一百一十一

是以要将2進制的11011111 變成10進制,如何轉變?

int value = Convert.ToInt32("11011111", 2);

value的值是223.是以代碼修改為:

    chars[i] = (char)(chars[i] &amp; 223);

運作可以得到正确的結果:

或者使用16進制來表示:1101-1111 ,的16進制是:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

0 1 2 3 4 5 6 7 8 9  A  B  C   D  E  F

1101=2^3+2^2+1=8+4+1=13 = D

1111=2^3+2^2+2^1+2^0=8+4+2+1=15 = F

是以可以将上面的代碼修改為:

chars[i] = (char)(chars[i] &amp; 0xdf);

同樣因為隻是第5位不同,而第7位會被忽略。是以和 0101-1111進行and操作也可以得到正确的答案:

而0101-1111 的16進制是0x5f.是以代碼可以變成:

chars[i] = (char)(chars[i] &amp; 0x5f);

本文轉自LoveJenny部落格園部落格,原文連結:http://www.cnblogs.com/LoveJenny/archive/2011/12/09/2281476.html,如需轉載請自行聯系原作者

繼續閱讀