线程安全是多线程编程时的计算机程序代码中的一个概念。在拥有共享数据的多条线程并行执行的程序中,线程安全的代码会通过同步机制保证各个线程都可以正常且正确的执行,不会出现数据污染等意外情况。
简介
多个线程访问同一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替执行,也不需要进行额外的同步,或者在调用方进行任何其他操作,调用这个对象的行为都可以获得正确的结果,那么这个对象就是线程安全的。
或者说:一个类或者程序所提供的接口对于线程来说是
原子操作或者多个线程之间的切换不会导致该接口的执行结果存在二义性,也就是说我们不用考虑同步的问题。
线程安全问题大多是由
全局变量及
静态变量引起的,局部变量逃逸也可能导致线程安全问题。
若每个线程中对全局变量、静态变量只有读操作,而无写操作,一般来说,这个全局变量是线程安全的;若有多个线程同时执行写操作,一般都需要考虑
线程同步,否则的话就可能影响线程安全。
类要成为线程安全的,首先必须在
单线程环境中有正确的行为。如果一个类实现正确(这是说它符合规格说明的另一种方式),那么没有一种对这个类的对象的操作序列(读或者写公共字段以及调用公共方法)可以让对象处于无效状态,观察到对象处于无效状态、或者违反类的任何不可变量、前置条件或者后置条件的情况。
此外,一个类要
成为线程安全的,在被多个线程访问时,不管运行时环境执行这些线程有什么样的时序安排或者交错,它必须仍然有如上所述的正确行为,并且在调用的代码中没有任何额外的同步。其效果就是,在所有线程看来,对于线程安全对象的操作是以固定的、全局一致的顺序发生的。
正确性与
线程安全性之间的关系非常类似于在描述 ACID(原子性、一致性、独立性和持久性)
事务时使用的一致性与独立性之间的关系:从特定线程的角度看,由不同线程所执行的对象操作是先后(虽然顺序不定)而不是
并行执行的。
线程状态分类
线程安全性的分类方法包括:不可变、线程安全、有条件线程安全、线程兼容和线程对立。只要明确地记录下线程安全特性,那么您是否使用这种系统都没关系。这种系统有其局限性 -- 各类之间的界线不是百分之百地明确,而且有些情况它没照顾到 -- 但是这套系统是一个很好的起点。这种分类系统的核心是调用者是否可以或者必须用外部同步包围操作(或者一系列操作)。下面几节分别描述了
线程安全性的这五种类别。
不可变类
一个不可变的对象只要构建正确, 其外部可见状态永远不会改变, 永远也不会看到它处于不一致的状态。Java 类库中大多数基本数值类如Integer、String 和BigInteger 都是原子性的, 是不可变的, 但Long 和Double 就不能保证其操作的原子性, 可在声明变量的时候用volatile 关键字。不可变对象上没有副作用, 并且缓存不可变对象的引用总是安全的。一个不可变的对象的一个引用可以自由共享,而不用担心被引用的对象要被修改。
线程安全性类
线程安全性类的对象操作序列( 读或写其公有字段以及调用其公有方法) 都不会使该对象处于无效状态, 即任何操作都不会违反该类的任何不可变量、前置条件或者后置条件。
有条件的线程安全类
有条件的线程安全类对于单独的操作可以是线程安全的, 但是某些操作序列可能需要外部同步。为了保证其它线程不会在遍历的时候改变集合, 进行迭代的线程应该确保它是独占性地访问集合以实现遍历的完整性。通常, 独占性的访问是由对锁的同步机制保证的。
线程兼容类
线程兼容类不是线程安全的, 但可以通过正确使用同步从而在并发环境中安全地使用。或用一个synchronized 块包含每一个方法调用。
线程对立类
线程对立类是那些不管是否调用了外部同步都不能在并发使用时保证其安全的类。线程对立类很少见, 当类修改静态数据,而静态数据会影响在其它线程中执行的其它类的行为时, 通常会出现线程对立。
线程安全与可重入
如果一个函数能够安全地同时被多个线程调用而得到正确的结果,那么,我们说这个函数是线程安全的。所谓“安全”,一切可能导致结果不正确的因素都是不安全的调用。
线程安全,是针对多线程而言的。与可重入联系起来,我们可以断定:
可重入函数必定是线程安全的,但线程安全的不一定是可重入的。不可重入函数,函数调用结果不具有可再现性,可以通过互斥锁等机制使之能安全地同时被多个线程调用,那么,这个不可重入函数就是转换成了线程安全。
可重入(Reentrant)函数可以由多于一个任务并发使用,而不必担心数据错误。相反地,不可重入( Non - Reentrant)函数不能由超过一个任务所共享,除非能确保函数的互斥(或者使用信号量,或者在代码的关键部分禁用中断)。可重入函数可以在任意时刻被中断,稍后再继续运行,不会丢失数据。可重入函数要么使用本地变量,要么在使用全局变量时保护自己的数据。
①不为连续的调用持有静态数据;
②不返回指向静态数据的指针;所有数据都由函数的调用者提供;
③使用本地数据,或者通过制作全局数据的本地拷贝来保护全局数据;
④如果必须访问全局变量,记住利用互斥信号量来保护全局变量;
⑤绝不调用任何不可重入函数。
不可重入函数特征:
①函数中使用了静态变量,无论是全局静态变量还是局部静态变量;
②函数返回静态变量;
③函数中调用了不可重入函数;
④函数体内使用了静态的数据结构;
⑤函数体内调用了malloc()或者free()函数;
⑥函数体内调用了其他标准I/O函数;
⑦函数是singleton中的成员函数而且使用了未采用线程独立存储的成员变量。
总的来说,如果一个函数在重入条件下使用了未受保护的共享资源,那么它是不可重入的。
线程安全意义
线程安全, 是指变量或方法( 这些变量或方法是多线程共享的) 可以在多线程的环境下被安全有效的访问。这说明了两方面的问题:
(1)可以从多个线程中调用, 无需调用方有任何操作;
(2)可以同时被多个线程调用, 无需线程之不必要的交互。
举例
比如一个 ArrayList 类,在添加一个元素的时候,它可能会有两步来完成:1. 在 Items[Size] 的位置存放此元素;2. 增大 Size 的值。
在
单线程运行的情况下,如果 Size = 0,添加一个元素后,此元素在位置 0,而且 Size=1;
而如果是在多线程情况下,比如有两个线程,线程 A 先将元素存放在位置 0。但是此时 CPU 调度线程A暂停,线程 B 得到运行的机会。线程B也向此 ArrayList 添加元素,因为此时 Size 仍然等于 0 (注意哦,我们假设的是添加一个元素是要两个步骤哦,而线程A仅仅完成了步骤1),所以线程B也将元素存放在位置0。然后线程A和线程B都继续运行,都增加 Size 的值。
那好,我们来看看 ArrayList 的情况,元素实际上只有一个,存放在位置 0,而 Size 却等于 2。这就是“线程不安全”了。