字符 / 字符串 / 编程语言 · 2023年 10月 7日 0

字符串的内存存储

83 次浏览

对于支持单字符的编程语言,比如C/C++, 字符被当成整型保存,当作整数做运算,简单直接。字符串数据更多,分配新的内存区域保存更合适。

存储格式

  • C/C++对于char *字符串只利用一个规则,结尾为NULL字符'\0'算结束,只保存首地址,不需保存长度。C++支持string类,一般会封装字符串data指针和长度讯息(加速获取字符串长度)。
    • char *字符串天生的缺点是如果忘记了结束的'\0'将一直被当做字符串数据。
    • 修改"hello"为"he\0llo”, 字符串变为"he".
  • C++ string类提供c_str()返回const char *指针。data()和c_str()一样,C++17修改为非const字符串返回char *.
  • Delphi在字符串数据前面插入长度信息。
  • Java String类封装数据成员char value[], 早期版本有hashCode成员辅助,新版本增加了encoding,可支援更小数据量的Latin编码。

太长的字符串

大部分编程语言提供续行符连接成更长的字符串。

  • C/C++

char str[100] = "Hello, \
World!";

运行结果为:Hello, World! (中间有3个空格) 当然编译也会告警:warning: backslash and newline separated by space.

为了避免续行后行开始的空格被当做字符串,也提供字面量相连的方式。

char str[100] = "Hello, " "World!"; // 输出Hello, World! (中间只有一个空格)

C++11原始字面量包裹的字符串不用续行符就可以换行,换行保存在字符串中。

  • C#

不支持'\'续行符连接字符串,可以在字符串前面加'@'符号连接字符串,缺点一样是会把回车符加进去。一种比较好的做法是直接用'+'运算符做字符串连接。

  • Python

Python字符串里面的续行符不会自动加换行,这很不错。如下a字符串为: "aaabbb"

a = "aaa\

bbb"

同样也支持字面量相连,a = 'a''b' # a字符串为 "ab"