学习C语言局部变量,经常听到这个说法。为什么局部变量默认是未初始化的?解释它需要理解程序结构和栈操作。
栈内存
- C/C++函数的局部变量保存在栈,栈可以认为是操作系统为了“加速”程序运行给线程配置了一块临时使用的内存区域,如果有临时使用的变量,直接压栈或者出栈即可。
- CPU用push和pop执行压栈和出栈,仅仅是修改的RSP或ESP的指针,没有任何一条指令在清零栈内存。
- C/C++局部变量int a或者int a[10]并不会生成初始化它们的代码,编译器只不过偷偷计算占用的空间,并修改RSP/ESP初始值,并通过它们的相对关系找到对应的临时变量,仅此而已。
- 注意,需要和申请内存清零区分开。这是申请的时刻清零,运行时操作系统不会浪费时间去清零不用的堆栈。
- 顺带介绍一下向内核申请内存的清零行为。操作系统在创建进程或线程时,Windows早期内核并不为栈(包括堆内存)初始化,Windows 10 版本 2004 之后建议用类似ExAllocatePoolZero的API申请(默认会清零内存),请参见:Windows内核申请内存清零? 值得注意的是,一般而言,通过操作系统native API向内核申请的内存,一般会被清零,这是为了安全(注意内核为了优化性能,可能用一个fake zero page代替(读内存只会返回0,未真正将page清零),等到真正写内存时重新申请创建PTE并做真正清零动作)。但内核态属于信任模式,内核使用新page可能使用非零内存。
未初始化的变量是否能使用?
- C/ObjC/C++默认允许使用未初始化的变量,GCC/G++/Clang/Clang++打开-Wall才会提示warning:
‘xxx’ is used uninitialized [-Wuninitialized]
- MSVC会更严格,编译C/C++代码默认就会提示未初始化变量的警告,编译依然可以通过。如需将此标记为error,需要加参数/we 4700:- cl.exe /we 4700 xxx.cpp
- C#不允许使用未初始化的局部变量,会编译错误。C#的类或结构的字段,不显式初始化,默认值为0.
- Java类似C#,没有结构体,基本类型和对象必须初始化才能使用。
- Python作为解释语言,变量一定需要先赋值才能用。
- JS可以使用未初始化的变量,默认值是undefined.
let a
console.log(a) // 输出: undefined - VB.NET没初始化的变量,会有默认值,数值类型默认值为0.
Dim y As Integer
Console.WriteLine(y) // 编译OK,输出为:0 - Go语言未初始化变量会被赋值为默认值,例如,整型默认为0
var x int
println(x) // 编译OK,输出:0 - Rust/Swift/仓颉 使用变量前必须初始化,否则会编译错误。
未初始化类型的默认值
- C/ObjC/C++ 未初始化类型默认值是不确定的。
- Go 整型和浮点数默认是0,字符串默认是空字符串"", 布尔类型默认是false.