文章

静态初始化顺序问题

静态初始化顺序不确定,跨文件静态对象依赖可能导致未定义行为和崩溃。

静态初始化顺序问题

静态初始化顺序问题

什么是“全局/静态对象初始化顺序”规则?

全局对象、静态局部对象、静态成员变量,它们的初始化遵循以下规则:

  • 同一翻译单元(即同一个 .cpp 文件)中的静态/全局对象,按照它们在代码中定义的顺序**初始化。
  • 析构顺序与构造顺序相反
  • 不同翻译单元之间的全局/静态对象,其初始化顺序是未定义的!

这就意味着:你无法保证 A.cpp 中的全局对象比 B.cpp 中的先初始化。

什么是 Static Initialization Order Fiasco?

Static Initialization Order Fiasco(SIOF) 是 C++ 中的一个经典问题,指不同编译单元(.cpp 文件)中的静态变量的初始化顺序不确定,导致程序可能崩溃或行为异常。

在 C++ 中,静态/全局对象的初始化顺序在不同翻译单元间是不确定的。如果一个静态/全局对象在其构造过程中访问了另一个尚未完成初始化的静态/全局对象,程序将产生 未定义行为(Undefined Behavior)。这可能导致程序崩溃、数据错误或其他难以预测的问题。

为避免这种情况,常用的解决方案之一是使用“懒汉式”局部静态对象(函数内部的 static 变量),它们保证在首次调用时初始化,从而确保对象的初始化顺序受控且安全。

例子:全局对象(无static修饰)

A.h

1
2
3
4
5
6
7
8
9
10
#pragma once
class B;  // 前向声明

class A {
public:
    A();
    void doSomething();
};

extern A a;  // 声明外部定义的全局对象 a

B.h

1
2
3
4
5
6
7
8
9
10
#pragma once
class A;  // 前向声明

class B {
public:
    B();
    void doSomething();
};

extern B b;  // 声明外部定义的全局对象 b

A.cpp

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <iostream>
#include "B.h"
#include "A.h"

A::A() {
    std::cout << "A constructed\n";
    b.doSomething();  // 使用全局对象 b
}

void A::doSomething() {
    std::cout << "A does something\n";
}

A a;  // 定义全局对象 a

B.cpp

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <iostream>
#include "B.h"
#include "A.h"

B::B() {
    std::cout << "B constructed\n";
    a.doSomething();  // 使用全局对象 a
}

void B::doSomething() {
    std::cout << "B does something\n";
}

B b;  // 定义全局对象 b

main.cpp

1
2
3
4
5
6
#include <iostream>

int main() {
    std::cout << "Main running\n";
    return 0;
}

运行结果可能是(顺序由链接器决定):

情况 1(构造顺序“刚好”)
A constructed
B does something
B constructed
A does something
Main running

情况 1 的流程:

  1. 程序启动,进入全局初始化阶段。

  2. 编译器决定:先初始化 a(即先调用 A::A())。

  3. 进入 A::A()

    • 输出 "A constructed"

    • 调用 b.doSomething(),此时:

      • b 已经是个“已分配但尚未构造”的对象(注意:构造函数还没跑)
      • 于是 B::doSomething() 被调用 → 输出 "B does something"
  4. A::A() 完成。

  5. 回到初始化流程,继续构造 b

    • 现在正式执行 B::B(),输出 "B constructed"

    • 调用 a.doSomething() → 输出 "A does something"

  6. 全局对象构造完毕 → main() 开始 → 输出 "Main running"

B constructed 为啥在 B does something 后面?

一、背景知识:C++ 中创建对象过程分两步
  1. 分配内存(memory allocation):
    • 编译器为全局变量 b 分配内存空间。
    • 此时地址是有的,指针可以指向它。
  2. 调用构造函数(construction):
    • 执行 B::B() 构造函数,初始化成员,输出内容等。

只有构造函数执行完毕,整个对象才算“构造完成”。

二、具体分析

在代码中:

1
2
3
4
A::A() {
    std::cout << "A constructed\n";
    b.doSomething();  // b 已分配,但 b 的构造函数还没执行
}

此时 b 的内存已经被分配了,编译器知道 b 是个全局变量,它有地址,所以 b.doSomething() 语法上没问题。但:

b 的构造函数 B::B() 还没有运行,所以 b 处于一种“危险”的、未完全初始化的状态。

这就是所谓的:

“b 此时已分配,但尚未构造。”

三、调用未构造对象的成员函数 → 未定义行为

虽然看到程序能跑、甚至输出了 "B does something",但:

  • 如果 B 有成员变量未初始化就被访问了?
  • 如果 doSomething() 使用了构造时才设置的状态?

程序就会崩溃或逻辑错误。

情况 2(构造顺序反了)
B constructed
Segmentation fault (core dumped)

如果程序启动时,先构造了 b

  1. 执行 B::B() 构造函数
  2. 构造函数内部访问了 a.doSomething()
  3. 此时 a 的构造函数 A::A()没有被调用过
  4. 所以 a 所指代的内存可能还没初始化、vtable 还没绑定、数据成员未定义
  5. 最终可能导致:
    • 访问未初始化内存
    • 程序崩溃(段错误)
    • 调用了未绑定的虚函数(vtable 还没设置)
    • 输出错乱甚至死锁(如果是多线程对象)

正确做法:用“懒汉式”静态局部对象

A.h

1
2
3
4
5
6
7
8
9
10
11
12
13
#pragma once

class B;  // 前向声明

class A {
public:
    A();
    void doSomething();

    void init();  // 延迟初始化,避免递归
};

A& getA();  // 获取单例对象

B.h

1
2
3
4
5
6
7
8
9
10
11
12
13
#pragma once

class A;  // 前向声明

class B {
public:
    B();
    void doSomething();

    void init();
};

B& getB();

A.cpp

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#include <iostream>
#include "A.h"
#include "B.h"

A::A() {
    std::cout << "A constructed\n";
}

void A::doSomething() {
    std::cout << "A does something\n";
}

void A::init() {
    // 延迟调用 B 的方法,避免构造时递归
    getB().doSomething();
}

A& getA() {
    static A a;  // 局部静态,线程安全且懒加载
    return a;
}

B.cpp

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <iostream>
#include "B.h"
#include "A.h"

B::B() {
    std::cout << "B constructed\n";
}

void B::doSomething() {
    std::cout << "B does something\n";
}

void B::init() {
    getA().doSomething();
}

B& getB() {
    static B b;
    return b;
}

main.cpp

1
2
3
4
5
6
7
8
9
10
11
12
13
#include <iostream>
#include "A.h"
#include "B.h"

int main() {
    std::cout << "Main running\n";

    // 显式触发初始化,避免构造函数递归调用
    getA().init();
    getB().init();

    return 0;
}

打印输出:

Main running
A constructed
B constructed
B does something
A does something
本文由作者按照 CC BY 4.0 进行授权