天天看点

特殊符号/转义字符的整理

文章目录

    • 转义字符
      • html常用转义字符
      • 转义符号 \
    • 特殊符号
      • 换行符
      • 空格符
      • 编码符

转义字符

html常用转义字符

字符 转义符
"

"

&

&

<

&lt;

>

&gt;

空格

参考文章:

Html转义字符

转义符号 \

反斜杠

\

在程序设计中称为转义符,用来表示那些不能直接显示的字符。例如:换行。

在不同的系统中换行的表示又不相同,在Unix中换行符是

\n

,而在Windows中换行符是

\r\n

(先回车再换行),在Mac中换行是

\r

。这里的换行符的意思是,当我们使用文本编辑器书写内容时,当我们完成一行内容(无论主动敲击回车键换行还是文本编辑器自动换行),编辑器会自动在我们每行文本后添加转义字符(

\n

或者

\r\n

或者

\r

),也就是在每行末尾做个“标记”,当使用编辑器打开时,方便我们查看(这些“标记”我们看不到)。

另外,在Bash中用于去除某些字符的特殊意义,保留跟随在

\

之后的字符的字面值,参考示例1。

示例1:

[email protected]:~$ echo $HOME
/home/ubuntu
[email protected]:~$ echo \$HOME
$HOME
           

说明:反斜线去除了

$

字符的特殊意义,保留字面值,从而不输出

HOME

变量的值

扩展知识:

路径和参数的表示符号

  • Windows:

    /

    是表示参数,

    \

    是表示本地路径
  • Linux和Unix:

    /

    表示路径,

    \

    表示转义,

    -

    --

    表示参数
  • 网络:由于网络使用Unix标准,所以网络路径用

    /

参考文章:

Linux下反斜杠号""引发的思考

特殊符号

换行符

\r

是回车,本义是光标重新回到本行开头,名称传承自以前的打字机,表示打印头归位,

r

的英文

return

,控制字符可以写成

CR

,即

Carriage Return

\n

是换行,本义是光标往下一行(不一定到下一行行首),名称传承自以前的打字机,表示走纸另起一行,

n

的英文

newline

,控制字符可以写成

LF

,即

Line Feed

  • Dos和Windows采用回车(CR)+换行(LF)表示下一行,转义符号:

    \r\n

    ,具体含义:光标回到本行开头并往下一行,十六进制ASCII码:

    0x0D0A

  • Unix类系统中采用换行(LF)表示下一行,转义符号:

    \n

    ,具体含义:光标下一行并回到行首,十六进制ASCII码:

    0x0A

  • MAC OS中采用回车(CR)表示下一行,转义符号:

    \r

    ,具体含义:光标回到本行开头并往下一行,十六进制ASCII码:

    0x0D

用表格整理如下:

Windows Linux/Unix Mac OS
换行符

\r\n

\n

\r

ASCII

0x0D0A

0x0A

0x0D

注意:

vi/vim编辑器中,

0x0D0A

被表示成

^M$

$

不是换行符的表示,换行符没有表示出来,

$

是文本结束

EOF

的表示),关于这个

^M$

东西并没有同时出现过呀,我有疑问!!!

一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix下打开(例如vi编辑器)的话,在每行的结尾会出现

^M

字符。

扩展知识:

  1. 关于“回车键”的来历

    还得从机械英文打字机说起。在机械英文打字机上,有一个部件叫“字车”,每打一个字符(原为单词,但是个人觉得这里应该是字符),“字车”就前进一格。当打满一行字符后,打字者就得推动“字车”到起始位置,这时打字机会有两个动作响应:一是“字车”被归位,二是滚筒上卷一行,以便开始输入下一行,这个推动“字车”的动作叫“回车”。后来,在电动英文打字机上,人们增加了一个直接起“回车”作用的键。这个新增的键就被称为“回车键”。

    在电脑键盘上,“回车键”上曾经使用过“CR”、“RETURN”的字样,后来才统一确定为“Enter”。

  2. 为什么Windows会使用

    \r\n

    作为换行符?

    在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33,Linux/Unix下的tty概念也来自于此)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒(注:估计是从打字机的最右边回到最左边的机械运动 所需要的时间),正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。

    于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车(Carriage Return)”,告诉打字机把打印头定位在左边界;另一个叫做“换行(Line Feed)”,告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。

空格符

\t

表示空格,

半角空格的Unicode是:\u0020,代码中常用的,是英文符号

全角空格的Unicode是:\u3000,中文中使用,是中文符号

编码符

\u

,表示Unicode编码,例如:

\u4f60\u597d\uff0c\u4e16\u754c

\u

后面的是十六进制数,转换成二进制数是2个字节(16bit),表示2个字节表示一个字符,这里有5个字符,如下:

public static void main(String[] args) {
        System.out.println("\u4f60\u597d\uff0c\u4e16\u754c");
    }
           

得到的实际字符是:

你好,世界