死码删除_编译器原理中编译最优化技术

死码删除

编译器原理中编译最优化技术

死码消除（Dead code elimination）是一种编译器原理中编译最优化技术，它的用途是移除对程序运行结果没有任何影响的代码。

概念

死码消除（Dead code elimination）是一种编译器原理中编译最优化技术，它的用途是移除对程序运行结果没有任何影响的代码。移除这类的代码有两种优点，不但可以减少程序的大小，还可以避免程序在运行中进行不相关的运算行为，减少它运行的时间。不会被运行到的代码（unreachable code）以及只会影响到无关程序运行结果的变量（Dead Variables），都是死码（Dead code）的范畴。

死码的删除

死码通常被视为无条件的（unconditionally），所以我们可以在编译时期透过死码删除来移除这些无用的代码。

然而，在实现上，只有在特定的情形才会标注一个代码区块是无用的，或是不会运行到的，这可能无法在编译时期所得知。例如在不同的运行环境有不同的结果（举例来说，目标环境可能会有不同的操作系统版本，或是不同的驱动程序及可用服务的组合），可能会在代码内要求不同特例的集合，同时在这些案例下就变成有条件的死码。然而，软件（例如驱动程序、或是常驻服务）可能会根据用户的设置，而配置或排除特定的功能，使得在一些特定的情境，会变成部分无用的死码。模块化软件实现方式，是在需要时才读取动态库，在多数的案例中，不可能仅从特定的库读取相关的程序，它仍然会包含一些程序片段，在特定的环境下是可被视为死码，但是这在编译时期是无法被排除的。

动态死码删除（dynamic dead code elimination）被使用在运行时动态侦测，可辨识及解析相依性，用以移除有条件的死码，在运行时期重新组合保留的代码。

多数的计算机语言、编译器、操作系统不提供，或是仅比动态读取库及后链接（late linking）提供多一点点的功能，能使用动态死码删除的软件是相当稀少的。

示例

下列的示例，以C语言写成：

int foo(void)

{

int a = 24;

int b = 25; /* 赋值给一个无用的变量*/

int c;

c = a << 2;

return c;

b = 24; /* 不会被执行的代码*/

return 0;

}

分析上述程序对于数值的使用，将会发现b的数值在第一次被赋值之后，就不再使用，而且b是在foo函数内宣告，无法在函数外面使用，所以变量b是无用的，最优化的过程可以回收他所使用的空间，并删除他的初始化。

当第一个return被运行，则代表函数已经结束，之后变量b的赋值行为则不会被运行，所以赋值行为是可以被删除的。如果程序有更复杂的控制流程，例如在第一个return之后加上一个标签，使得程序中任和一个地方都可以用goto来运行到这个程序段，那么变量b的赋值行为将有可能被运行。

尽管一些计算行为被包装成函数，他们的数值也无法被函数外所访问，但仍然还是有些函数仅会回传一个固定的数值，这或许可以将该数值取代所有函数的调用。（这个简化的过程被称之为常量折叠）

更高级的编译器则会有些选项可以启动死码删除的功能，而有些则是可以选择不同档次的死码删除，比较低级档次的死码删除仅会移除不会被运行到的指令，而较高阶的可能不会保留无用变量的空间，其他高阶档次的做法可能会判断哪些指令及函数没有任何用途，并且删除他们。

死码删除最普遍的做法，是透过预处理器来判断代码是否需要被编译，如下列这个示例：

int main(void) {

int a = 5;

int b = 6;

int c;

c = a * (b >> 1);

if (0) { /* DEBUG */

}

return c;

}

由于0将永远被视为False，所以if判断式内的程序将永远不会被运行，死码删除将会把它移除，这个技术在调试上相当常见，我们可以透过一个数值来决定程序段是否该被编译，使用死码删除的最优化过程，将会使用预处理器来进行相同的工作。

实现中，有些在最优化过程中找到的死码，是被其他最优化技术产生，举例来说，典型强度折减的技术，将会在代码内插入新的运算以取代昂贵的运算行为，而被取代的代码就成了死码，随后，死码删除会移除那些计算，以完成这个效果（没有复杂的强度折减算法）。

从历史上来看，死码删除使用来自数据流分析的信息，Cytronetal在原始文章中发布了一个基于静态单赋值形式的算法，Shillingsburg改进了这个算法，并开发了一个算法来移除无用的控制流（Control-flow）。

参考资料

最新修订时间：2022-08-25 16:46

条目作者

小编

资深百科编辑

概述

概念

死码的删除

参考资料