故障是指系统不能执行规定功能的状态。在计算机中,系统故障是指系统在运行过程中,由于某种原因,造成系统停止运行,以致事务在执行过程中以非正常的方式终止,致使内存中的信息丢失,而存储在外存上的数据未受影响。
系统故障简介
故障是计算机程序的语法错误或逻辑错误。系统故障是指系统在运行过程中,由于某种原因,以致事务在执行过程中以非正常的方式终止。按故障的部件可将故障分为硬件故障和软件故障。硬件故障是指故障因硬件系统失效。软件故障是指程序运行一些非法指令,如特权指令。
事务
事务的定义
事务是用于访问和修改各种数据项的一个程序单位。事务也可以被看做是一系列相关读和写操作。被访问的数据可以分散地存放在同一文件的不同记录中,也可放在多个文件中。只有对分布在不同位置的同一数据所进行的读和写(含修改)操作全部完成时,才能再以托付操作(Commit Operation)来终止事务。只要有一个读、写或修改操作失败,便须执行夭折操作(Abort Operation)。读或写操作的失败可能是由于逻辑错误,也可能是系统故障所导致的。
一个夭折的事务,通常已执行了一些操作,因而可能已对某些数据做了修改。为使夭折的事务不会引起数据的不一致性,须将该事务内刚被修改的数据项恢复成原来的情况,使系统中各数据项与该事务未执行时的数据项内容完全相同。此时,可以说该事务“已被退回”(rolled back)。不难看出,一个事务在对一批数据执行修改操作时,要么全部完成,并用修改后的数据去代替原来的数据,要么一个也不修改。
事务记录(Transaction Record)
为了实现上述的原子修改,通常须借助于称为事务记录的数据结构来实现。这些数据结构被放在稳定存储器中,用来记录在事务运行时数据项修改的全部信息,故又称为运行记录(Log)。该记录中包括有下列字段:
· 事务名:用于标识该事务的惟一名字;
· 数据项名:指被修改数据项的惟一名字;
· 旧值:修改前数据项的值;
· 新值:修改后数据项将具有的值。
在事务记录表中的每一记录,描述了在事务运行中的重要事务操作,如修改操作、开始事务、托付事务或夭折事务等。在一个事务 T i 开始执行时, 〈T i 开始〉记录被写入事务记录表中;在 T i 执行期间,在 T i 的任何写(修改)操作之前,便写一适当的新记录到事务记录表中;当 T i 进行托付时,把一个〈T i 托付〉记录写入事务记录表中。
分类
按故障的持续时间分类
按故障的持续时问可将故障分为永久故障、瞬时故障和间歇故障。永久故障由元器件的不可逆变化所引发,其永久地改变元器件的原有逻辑.直到采取措施消除故障为止;瞬时故障的持续时间不超过一个指定的值.并f1只引起元器件当前参数值的变化,而不会导致不可逆的变化;间歇故障是可重复出现的故障,主要由元件参数的变化、不正确的设计和工艺方面的原因所引发。
按故障的发生和发展进程分类
按故障的发生和发展过程可将故障分为突发性故障和渐发性故障。突发性故障出现前无明显的征兆,很难通过早期试验或测试来预测;渐发性故障是由于元器件老化等其他原因,导致设备性能逐渐下降并最终超出正确值而引发的故障.因此具有一定的规律性,可进行状态监测和故障预防。
按故障的部件分类
按故障的部件可将故障分为硬件故障和软件故障。硬件故障是指故障因硬件系统失效
按故障的严重程度分类
按故障的严重程度可将故障分为破坏性故障和非破坏性故障。破坏性故障既是突发性的又是永久性的.故障发生后往往危及设备和人身的安全:而非破坏性的故障一般是渐发性的又是局部的,故障发生后暂时不会危及设备和人身的安全。
除此之外.还可以按照故障的因果关系分成物理性故障和逻辑性故障,按故障的表征分为静态故障和动态故障.按故障变量的值分为确定值故障和非确定值故障等。
闭环系统故障
随着科学技术的发展 , 现代工业系统的规模和复杂程度都在日益提高 . 这类复杂大系统一旦发生故障 , 就可能带来重大的财产损失和人员伤亡 . 因此 , 如何提高系统在运行中的安全性与可靠性 , 减少生产生活中的安全隐患 , 成为现代工业系统中的重大问题。故障诊断技术是提高系统运行可靠性、降低系统运行风险的重要方法。 故障诊断技术对系统运行状况进行监测 ,判断是否有故障发生 ,同时确定故障发生的时间、位置、大小和种类等情况 , 即完成故障检测、分离和估计。在过去的数十年时间里 , 故障诊断技术得到了广泛研究 。大量研究成果得到发表。
目前有部分学者认为,与开环系统相比,闭环系统中的故障诊断性能下降主要由于如下两个原因 : 1) 反馈系统的引入通常会使得系统对于外部扰动更鲁棒 , 因此当故障处于早期阶段或幅值较小时,所带来的影响可能会被控制量所掩盖 . 发生故障时残差信号可能仍在较小范围内变动,使得故障难以被检测到,导致了更高的漏报率。 2) 反馈控制可能使得故障在系统内传播,导致多处信号发生异常。以传感器故障为例,在开环系统中,某传感器发生的故障不会对系统中其他传感器造成影响,其他传感器的测量信号仍然处于正常范围之内 . 而在闭环系统中,由于引入了反馈信号,某个异常的测量值被反馈控制器采用之后 , 可能导致控制信号偏离正常值 , 进而通过反馈使得系统整体脱离正常工作范围 , 此时其他传感器测量得到的也同样是异常信号 . 这种故障传递现象也增加了故障分离的难度。