类型检查指验证操作接收的是否为合适的类型数据以及赋值是否合乎类型要求。最自然的方式是认为检查发生在运行时,即当涉及到具体的数据值时,即动态类型检查(即运行时检查)。
编译时检查(即静态检查)通过对程序的
静态分析,检查所有涉及值的使用的操作、调用和赋值,在程序运行前排除潜在的类型错误。类型检查需基于一定的环境,也就是要在一定的范围内确定类型说明与应用的正确与否,这与标识符的作用域关系密切。
数据类型
数据类型是程序设计语言中的一个重要概念。类型的引入有着如下基本动机:
(1)类型可帮助更好地理解和组织关于客观对象的思想;
(2)类型系统可帮助了解和讨论某些特殊类型的独特性质;
(3)类型可帮助检测错误,防止对象的不合适使用。
大多数程序设计语言都使用类型系统来分类数据并防止错误,程序中的类型信息一方面增加了程序的易读性,另一方面也用于防止无意义的程序构造。
类型错误是主要的程序错误。类型错有两种原因:一是某操作收到错误类型的操作数;二是附类型变量的错误使用,即将其他类型的值存入某附类型变量中。为防止类型错误,类型检查是必要的。
数据类型分类及其类型检查
程序设计语言从对类型的考虑大体可分为三类:
(1)无类型语言,如BCPL和Blsis,这类语言不考虑类型及类型检查,其编程中最常见的错误是不可检测操作符对错误类型操作数的作用;
(2)弱附类型语言,如Lisp。这类语言允许对程序附上部分类型信息,类型检查是在程序运行过程中进行的,即所谓动态检查或运行时检查;
(3)强附类型语言,如Algol和PASCAL等,这类语言需对程序附上完全的类型信息,类型检查是在程序运行前的编译过程中完成的,即所谓静态检查或编译时检查,这是大多数传统命令型语言所采用的方式。
类型检查的简介
为了进行类型检查,编译器需要给源程序的侮一个组成部分赋予一个类型表达式。然后,编译器要确定这些类型表达式是否满足一组逻辑规则。这些规则称为源语言的类型系统。
类型检查具有发现程序中的错误的潜能。原则上,如果目标代码在保存元素值的同时保存了元素类型的信息,那么任何检查都可以动态地进行。一个健全的类型系统可以消除对动态类型错误检查的需要,因为它可以帮助人们静态地确定这些错误不会在目标程序运行的时候发生。如果编译器可以保证它接受的程序在运行时刻不会发生类型错误,那么该语言的这个实现就被称为强类型的。
除了用于编译,类型检查的思想还可以用于提高系统的安全性,使得人们安全地导人和执行软件模块。Java程序被编译成为机器无关的字节码,在字节码中包含了有关字节码中的运算的详细类型信息。导入的代码在被执行之前首先要进行类型检查,以防止因疏忽造成的错误和恶意攻击。
类型检查的分类
类型检查可分为动态检查(即运行时检查)和静态检查(即编译时检查)。
动态检查
类型检查最自然的方式是认为检查发生在运行时,即当涉及到具体的数据值时,即动态类型检查。动态检查有着几个缺陷:(1)增加了程序运行时间,影响了效率;(2)需要数据具有类型标志;(3)错误发现太晚,不能防止运行错的出现。
动态检查的一个显著优点是它提供了宽松、少限制的程序设计环境,这在交互式语言中是十分有用的;动态检查允许对变量的后期约束,从而给予编程较大灵活性,还可以在引入某些新定义类型时,不需改变现行程序代码,即具有动态多态性;动态检查可允许更丰富的类型系统,特别地,易于将类型作为一阶对象处理,可允许异质的结构类型,便于数组下标分析。
静态检查
静态检查则可去除上述动态检查的缺点,它通过对程序的静态分析,检查所有涉及值的使用的操作、调用和赋值,在程序运行前排除潜在的类型错误。静态分析有利于错误的早时发现和代码优化、效率提高,也防止了关于类型的运行出错。
静态检查要求对程序的完全附类型,变量必须早期约束,从而没有了动态方式所具有的灵活性,引入新的类型可能需对原程序的修改和重编译;静态检查也必须要求类型系统是可判定的以保证终止性,从而使类型系统有较大限制,许多类型是不允许的。
类型检查规则
类型检查规则有两种形式:综合和推导。
类型综合
类型综合(type synthesis)根据子表达式的类型构造出表达式的类型。它要求名字先声明再使用。表达式的类型是根据和的类型定义的。一个典型的类型综合规则具有如下形式:
if f的类型为且x的类型为s
then 表达式f(x)的类型为t
这里,f和x表示表达式,而表示从s到t的函数。这个针对单参数函数的规则可以推广到带有多个参数的函数。只要稍做修改,上述规则就可以用于,只需要把它看作一个函数应用add(,,)就可以了。
类型推导
类型推导( type inference)根据一个语言结构的使用方式来确定该结构的类型。一个典型的类型推导规则具有下面的形式:
if f(x)是一个表达式,
then 对某些和, f的类型为且x的类型为
类型检查方法
一致化方法和替换方法是类型检查特别是对类属类型进行处理的有力工具。
一致化方法
类型一致化就是寻找两个类型表达式的最一般的一致化符mgu(使两个类型表达式一致的最小结构)。类型一致化有两个目的:一是比较两个类型是否一致;二是获得表达式的结果类型。
一致化有如下功能:
(1)用于类型推导:程序语言中的每个表达式(由常量、变量、模式名通过各类算符构成的式子)都有一个可决定的类型,但是表达式的类型有的是通过直接声明得到的(如常量、变量的类型),有的则需要经过类型推导而得到。类型推导中对代表不确定类型的类型变量的赋值由一致化过程实现。
(2)用于比较:对类型环境中谓词良类型的判别中是利用操作数的已有类型,再根据算符对操作数的类型要求,构造新的类型表达式进行一致化比较,如成功则谓词为良类型。
例如:环境Env下表达式E1的类型为t,表达式E2的类型为power t,需判别谓词是否为良类型。如果是良类型,则E1类型的幂类型应与E2的类型一致。用表达式E1的类型t构造新类型power t,然后与E2的类型power t进行一致化操作,如果一致化成功,则是良类型。
替换方法
类属定义的常量或变量是从定义处开始的全程量,为了使其能够被共享,每次对它进行不同的引用就有必要进行类型结构的复制,这在类型检查器中由替换函数实现。替换保证了类属类型重复引用的正确性。替换方法有如下功能:
(1)实现显式规则:在实例化等情况下,以实在的类属参数替换定义中给出的形式类属参数。
(2)实现隐式规则:在对类属类型变量标识的单独引用中,以未经约束的类型变量替换定义中给出的形式类属参数,以便获得实在的参数类型。
(3)实现类型修剪:在经过类型检查最终生成类属类型的过程中,将一致化过程中使用的类型变量以其确定值代替,节省顶层类型环境空间。