天天看点

[C++] 编程实践之1: Google的C++代码风格2:作用域

作用域

名字空间

鼓励在.cc文件内使用匿名名字空间。使用具名的名字空间时,其名称可基于项目名或者相对路径。禁止使用using指示(using-directive)。禁止使用内联命名空间(inline namespace)。

定义:

  • 名字空间将全局作用域细分为独立的,具名的作用域,可有效防止全局作用域的命名冲突。

优点:

  • 虽然类已经提供了(可嵌套的)命名轴线,名字空间在这一基础上又做了一层封装。
  • 内联命名空间会自动把内部的标识符放到外层的作用域,比如下面的代码中,X::Y::foo()与X::foo()彼此可代替。内联命名空间主要用来保持跨版本的API的兼容性。
namespace X {
    inline namespace Y {
        void foo();
    }
}
           

缺点:

  • 名字空间具有迷惑性,因为它们和类一样提供了额外的(可嵌套的)命名轴线。此外,它们不再受其声明所在的命名空间的限制。
  • 内联命名空间只在大型版本控制里有用。
  • 在头文件中使用匿名空间导致违背C++的唯一定义原则(One Definition Rule (ODR))。

结论:

  • 根据下文将要提到的策略合理地使用命名空间。

匿名名字空间

  • 在.cc文件中,允许甚至鼓励使用匿名名字空间,以避免运行时的命名冲突。然而,与特定类关联的文件作用域声明在该类中被声明为类型、静态数据成员或者静态成员函数,而不是匿名名字空间的成员。匿名空间结束时用注释 //namespace标识。
namespace {                                  // .cc文件中
    // 名字空间的内容无需知道
    enum {kUNUSED, kEOF, kERROR};            // 经常使用的符号
    bool AtEof() { return pos == kEOF; }     // 使用本名字空间内的符号EOF
}   // namespace
           
  • 不要在.h文件中使用匿名名字空间。

具名名字空间

具名的名字空间使用方式如下:

  • 用名字空间把文件包含gflags的声明/定义,以及类的前置声明以外的整个源文件封装起来,以区别于其它名字空间:
// .h 文件
namespace mynamespace {
// 所有声明都置于命名空间中
// 注意不要使用缩进
class MyClass {
    public:
    ...
    void Foo();
};
}
           
// .cc 文件
namespace mynamespace {
// 函数定义要置于命名空间中
void MyClass::Foo() {
    ...
}
} // namespace mynamespace
           

通常的.cc文件包含更多,更复杂的细节,比如引用其他名字空间的类等。

#include "a.h"
DEFINE_bool(someflag, false, "dummy flag");
class C;                    // 全局名字空间中类C的前置声明
namespace a { class A; }    // a::A的前置声明
namespace b {
...code for b...            // b中的代码
} // namespace b
           
  • 不要在名字空间std内声明任何东西,包括标准库的类前置声明。在std名字空间声明实体会导致不确定的问题,比如不可移植。声明标准库下的实体,需要包括对应的头文件。
  • 最好不要使用using指示,以保证名字空间下的所有名称都可以正常使用。
  • 在.cc文件,.h文件的函数、方法或者类中,可以使用using声明。
// 允许.cc 文件中使用using声明
// 如果在.h文件中,必须在函数、方法或者类的内部使用
using ::foo::bar;
           
  • 在.cc文件,.h文件的函数、方法或者类中,允许使用名字空间别名。注意在.h文件的别名对包含了该头文件的所有人可见,所以在公共头文件(在项目外可用)以及它们递归包含的其它头文件里,不要用别名。毕竟原则上公共API要尽可能地精简。
// 允许:.cc文件中
// .h文件的话,必须在函数,方法或者类的内部使用
namespace fbz = ::foo::bar::baz;

// 在 .h文件里
namespace librarian {
// 以下别名在所有包含了该头文件的文件中生效。
namespace pd_s = ::pipeline_diagnostics::sidetable;

inline void my_inline_function() {
    // namespace alas local to a function (or method).
    namespace fbz = ::foo::bar::baz;
    ...
}
}   // namespace librarian
           
  • 禁止使用内联命名空间。

嵌套类

当公有嵌套类作为接口的一部分时,虽然可以直接将他们保持在全局作用域中,但将嵌套类的声明置于 2.1 名字空间 内是更好的选择。

定义:

  • 一个类的内部定义另外一个类;嵌套类也被成为成员类(member class)。
class Foo {
private:
    // Bar是嵌套类Foo中的成员类
    class Bar {
        ...
    };
}
           

优点:

  • 当嵌套类只被外围类使用时非常有用;把它作为外围类作用域内的成员,而不是去污染外部作用域的同名类。嵌套类可以在外围类中做前置声明,然后在.cc文件中定义,这样避免在外围类的声明中定义嵌套类,因为嵌套类的定义通常只与实现相关。

缺点:

  • 嵌套类只能在外围类的内部做前置声明。因此,任何使用了Foo::Bar*的指针的头文件不得不包含类Foo的整个声明。

结论:

  • 不要讲嵌套类定义成为公有,除非它们是接口的一部分,比如嵌套类含有某些方法的一组选项。

非成员函数、静态成员函数和全局函数

使用静态成员函数或名字空间内的非成员函数,尽量不要用裸的全局函数。

优点:

  • 某些情况下,非成员函数和静态成员函数是非常有用的,将非成员函数放在名字空间内将避免污染全局作用域。

缺点:

  • 将非成员函数和静态成员函数作为新类的成员或许更有意义,当它们需要访问外部资源或者具有重要的依赖关系时更是如此。

结论:

  • 有时,把函数的定义同类的实例脱钩时有益的,甚至是必要的。这样的函数可以被定义成为静态成员,或者非成员函数。非成员函数不应依赖于外部变量,应尽量置于某个名字空间内。相比单纯为了封装若干不共享任何静态数据的静态成员函数而创建类,不如使用 2.1 名字空间。
  • 定义在同一编译单元的函数,被其他编译单元直接调用可能会引入不必要的耦合和链接时依赖;静态成员函数对此尤其敏感。可以考虑提取到新类中,或者将函数置于独立库的名字空间内。
  • 如果你必须定义非成员函数,又只是在.cc文件中使用它,可使用匿名namespace或者“static”链接关键字(如static int Foo() {…})限定其作用域。

局部变量

将函数变量尽可能置于最小作用域内,并在变量声明时进行初始化。

C++允许在函数的任何位置声明变量。我们提倡在尽可能小的作用域中声明变量,离第一次使用越近越好。这使得代码浏览者更容易定位变量声明的位置,了解变量的类型和初始值。特别是,应使用初始化的方式替代声明再赋值。

int i;
i = f();                    // 坏——初始化和声明分离
int j = g();                // 好——初始化时声明

vector<int> v;
v.push_back();             // 用花括弧初始化更好
v.push_back();

vector<int> v = {, };     // 好——v一开始就初始化
           
警告:如果变量是一个对象,每次进入作用域都要调用其构造函数,每次退出作用域都要调用其析构函数。
// 低效的实现
for (int i = ; i < ; ++i) {
    Foo f;                 // 构造函数和西沟函数分别调用1000000次!
    f.DoSomething(i);
}
           

静态和全局变量

禁止使用class类型的静态或者全局变量:它们会导致难以发现的bug和不确定的构造和析构函数调用顺序。不过constexpr变量除外,毕竟它们又不涉及动态初始化或者析构。

  静态生存周期的对象,即包括了全局变量,静态变量,静态类成员变量和函数静态变量,都必须是原生数据类型(POD: Plain Old Data):即int, char和float,以及POD类型的指针、数组和结构体。

  静态变量的构造函数、析构函数和初始化的顺序在C++中是不确定的,甚至是随着构建变化而变化,导致难以发现的bug,所以除了禁用类类型的全局变量,我们也不允许函数的返回值来初始化POD变量,除非该函数不涉及(比如getenv()或者getpid())任何全局变量。(函数作用域里的静态变量除外,毕竟它的初始化顺序是有明确定义的,而且只会在指令执行到她的声明那里才会发生)

  同理,全局和静态变量在程序中断时会被析构,无论所谓中断是从main()返回还是对exit()的调用。析构顺序正好与构造函数调用的顺序相反。但既然构造顺序未定义,那么析构顺序当然也就不定了。比如在程序结束时某静态变量已经被析构了,但代码还在跑——比如其它线程——并试图访问它且失败;再比如,一个静态string变量也许会在一个引用了前者的其它变量析构之前被析构掉。

  改善以上析构问题的办法之一是用quick_exit()来代替exit()并中断程序。它们的不同之处是前者不会执行任何析构,也不会执行atexit()所绑定的任何handles。如果您想在执行quick_exit()来中断执行某handler(比如刷新log),您可以把它绑定到_at_quick_exit()。如果您想在exit()和quick_exit()都用上该handler,都绑定上去即可。

  综上所述,我们只允许POD类型的静态变量,即完全禁用vector(使用C数组替代)和string(使用const char[])。

  如果您确实需要一个class类型的静态或者全局变量,可以考虑在main()函数或者pthread_once()内初始化一个指针并且永不回收。注意只能用raw指针,别用智能指针,毕竟后者的析构函数设计到上文指出的不定顺序问题。

  

总结

  1. .cc中的匿名名字空间可避免命名冲突,限定作用域,避免直接使用using关键字污染命名空间。
  2. 嵌套类符合局部使用原则,只是不能再其他头文件中前置声明,尽量不要public。
  3. 尽量不用全局函数和全局变量,考虑作用域和命名空间限制,尽量单独形成编译单元。
  4. 多线程中的全局变量(含静态成员变量)不要使用class类型(含STL容器),避免不明确行为导致的bug。
  5. 作用域的使用,除了考虑名称污染和可读性之外,主要是为了降低耦合,提高编译/执行效率。
  6. 注意using指示(using-directive)和using声明(using-declaration)的区别。
  7. 局部变量在声明的同时进行显式初始化,比起隐式初始化再赋值的两步过程要高效,同时也贯彻了计算机体系结构重要的概念局部性(locality)。
  8. 注意别在循环犯大量构造和析构的低级错误。

继续阅读