字符 / 数据类型 · 2023年 10月 6日 0

转义字符

144 次浏览

对于人生,什么时候都感觉不够满意。编程语言的字符集是有限的,有限的字符集表达更多的功能,引入了转义字符之类的特殊字符。

不同的转义字符

为了支持特定的字符控制,比如换行或indent对齐等,编程语言一般支持特殊字符控制,通常采用转义字符,比如\r, \n, \t, \a, \\等等.

  • ‘\a’ 响铃
    • C#调用Console.WriteLine("\a")会有响铃效果。
      • 在Windows环境,本质是调用Windows API WriteFile, 最终内核原封不动返回给调用进程,所属的解释器(cmd.exe)调用响铃动作
  • ‘\t’ 长度
    • C语言标准未规定具体长度,不一定是8个字符。
    • 一般而言,操作系统也会把’\t’的编码(ANSI或Unicode)传递给解释器,解释器根据控制台环境配置决定TAB长度。
  • 转义字符本质也是整数
    • 例如,’\n’数值为10, 可以利用'\xA'代表,同样会输出换行。
  • 三字符序列
    • 早期的C/C++均支持,C++17取消了三字符序列,如下展示三字符序列输出’|’示例: printf("??!")
      • 注意:VC中需开编译选项/Zc:trigraphs才支持三字符序列.
  • 为什么问号需要转义(‘\?’)?
    • 正因为上面提到的三字符序列,它是以问号开头,避免问号'?'含义不确定性。
  • 反斜杠'\\'
    • Windows路径用反斜杠,路径名很长就会输入很多转义"\\", 现代编程语言纷纷引入控制机制减少冗余输入
    • C++11引入R原始字符串模式,R"(C:\Windows\System32)"代表“C:\\Windows\\System32”.
    • C#在字符串前面加@符号取消转义功能:@"C:\Windows\System32"

不同编程语言的转义字符

  • C系编程语言包括C/C++/Java/C#支持常用的转义字符,如\b, \n, \t, \", \f, \r, \', \\, JavaScript也支持这些。
  • JS中放在<pre>和</pre>标签内使用转义字符才有效。
  • Shell转义字符除了C系语言那些,因内部有更多特殊符号支持更多。例如, ~ ` ( ) $等等。例如$代表变量,"\$"被转义成'$'.

头文件路径的转义字符'\'

Unix like操作系统无此问题,因为使用'/', Windows平台会遇到。不过,C/C++头文件路径看起来像是字面量,有路径分隔符’\’却不会被当成转义字符,这很有用。即#include "aa\bb.h"真的是aa目录的bb.h, 而非\b转义。这可以看成头文件包含对转义字符的特殊处理。