香农信息论
信息论术语
香农被称为是“信息论之父”。人们通常将香农于1948年10月发表于《贝尔系统技术学报》上的论文《A Mathematical Theory of Communication》(通信的数学理论)作为现代信息论研究的开端。
名称由来
信息论将信息的传递作为一种统计现象来考虑,给出了估算通信信道容量的方法。信息传输和信息压缩是信息论研究中的两大领域。这两个方面又由信息传输定理、信源-信道隔离定理相互联系。
香农被称为是“信息论之父”。人们通常将香农于1948年10月发表于《贝尔系统技术学报》上的论文《A Mathematical Theory of Communication》(通信的数学理论)作为现代信息论研究的开端。这一文章部分基于哈里·奈奎斯特和拉尔夫·哈特利先前的成果。在该文中,香农给出了信息熵(以下简称为“熵”)的定义:香农
这一定义可以用来推算传递经二进制编码后的原信息所需的信道带宽。熵度量的是消息中所含的信息量,其中去除了由消息的固有结构所决定的部分,比如,语言结构的冗余性以及语言中字母、词的使用频度等统计特性。
信息论中的概念与物理学中的热力学熵有着紧密的联系。玻耳兹曼与吉布斯在统计物理学中对熵做了很多的工作。信息论中的熵也正是受之启发。
互信息(Mutual Information)是另一有用的信息度量,它是指两个事件集合之间的相关性。两个事件X和Y的互信息定义为:
I(X,Y) = H(X) + H(Y) - H(X,Y)
其中H(X,Y) 是联合熵(Joint Entropy),其定义为:
互信息与多元对数似然比检验以及皮尔森χ2校验有着密切的联系。
研究的主要内容
香农信息论研究的主要内容,包含如下问题:
(1)什么是信息?如何度量?
(2)在给定的信道中,信息传输有没有极限?
(3)信息能否被压缩或恢复?极限条件是什么?
(4)从实际环境中提取信息,极限条件是什么?
(5)在允许一定失真的条件下,信息能否被更大程度地压缩?极限条件是什么?
(6)设计什么样的系统才能达到上述极限?
(7)现实中,接近极限的设备是否存在?
概括的讲,香农信息论是以概率论随机过程为基本研究工具,研究广义通信系统的整个过程,而不是整个环节,并以编、译码器为重点,其关心的是最优系统的性能及如何达到该性能(并不具体设计环节,也不研究信宿)。香农信息论方面值得注意的研究方向有信息概念的深化问题、信息失真理论的发展及在数据压缩中的应用、以计算机为中心的信息处理系统的基本理论等。
重要观点与方法
香农信息论中的关键之处在于香农利用抽象化的方法,对现实中各种不同的通信背景下的根本问题进行了刻画和抽象,主要依赖3种观点和方法,即形式化假说、不确定性和非决定论。建立了相对普通的关于通信的数学模型,用数学方法定量描述信息,从而得出了大量的定量的结论,特别是三大极限定理,均是对通信中重要问题的重要度量的极限结论。
形式化假说
香农说:“通信的基本问题,是在消息的接收端精确地或近似地复制发送端所挑选的信息。通信消息是有意义的,即是说,它按某种关系与某些物质或概念的实体联系着。通信的语义方面的问题与工程问题是没有关系的。”
可提出如下假设:虽然信息的语义因素和语用因素对于广义信息来说并不是次要因素,但对于作为“通信的消息”来理解的狭义信息时,可以先把语义和语用因素搁置起来,假定各种信息的语义信息量和语用信息量恒定不变,而只单纯考虑信息的形式因素。比如信息包含不同的语义,而且语义也存在远近等不同;有些信息可能是有益的,有些可能是有害的,但是信息论暂时不管这些,以放弃一些复杂的“包袱”,这样才能便于建立模型、减少参数。
这种通信工程的“形式化”假说,对复杂的信息问题进行分解,大胆地去掉了复杂、具有个性化特点的、难于处理的消息的语义和语用因素,巧妙地保留了容易用数学描述的通用形式,因此,这使应用数学工具定量度量信息成为可能。此外,通过形式化的方法从通信问题中提取最为简练的共性问题,这使得通信问题升华为能够解决相对广泛的信息问题的理论,而不是单纯的个别应用,这种抽象使得所有消息和数据都可以采用二进制数据的形式进行存储、传输和处理,使得信息化可以渗透到各行各业,给当今社会带来深远的影响。
非决定论
我们知道,在科学史上,直到20世纪初,拉普拉斯的决定论的观点始终处于统治的地位。这种观点认为,世界上一切事物的运动都严格地遵从一定的机械规律。因此,只要知道了它的原因,就可以唯一地确定它的结果;反过来,只要知道了它的结果,就可以唯一地确定它在各个时刻的运动状态。这种观点只承认必然性,排斥和否认偶然性。
香农并没有墨守成规,他说:“重要的是,一个实际的消息,总是从可能发生的消息集合中选择出来的。因此,系统必须设计得对每一种选择都能工作,而不是只适合工作于某一种选择。因为,各种消息的选择是随机的,设计者事先无法知道什么时候会选择什么消息来传送。”这种“非决定论”观点是对通信活动的总的认识观,它从原则上回答了应采用什么样的数学工具来解决信息度量的问题,概率、集合的理论和方法由此得以在信息论中广泛应用。这也使得信息论可以解决给定参数下的一类问题。
不确定性
香农指出:“人们只有在两种情况下有通信的需要。其一,是自己有某种形式的消息要告知对方,而估计对方不知道这个消息;其二,是自己有某种疑问要询问对方,而估计对方能做出一定的解答。”这里的不知道和疑问是在一般情况下归结为存在某种知识上的“不确定”。对于第一种情况,是希望消除对方的不确定性,对于第二种情况,则是请求对方消除不确定性,所以通信的作用是通过消息的传递,使接收者从收到的消息中获取一样东西,因而消除了通信前存在的“不确定性”。这种东西就是信息。这样,我们有理由给信息一个明确的定义:“信息就是用来消除不确定的东西。”进而,可合理地推断:通信后接收者获取的信息在数量上等于通信前后“不确定性”的消除量。这就是信息论中度量信息的基本观点。
那么,很自然的接着问这样一个问题:“不确定性”本身是否可度量?是否可用数学方法来表示呢?我们知道不确定性是与“多种结果的可能性”相联系的,而在数学上,这些“可能性”正是以概率来度量的。概率大,即“可能性”大;概率小,“可能性”小。显然,“可能性”大,即意味着“不确定性”小;“可能性”小,即意味着“不确定性”大。由此可见,“不确定性”与概率大小存在着一定的联系,“不确定性”应该是概率的某一函数;那么,“不确定性”的消除量(减少量),也就是狭义信息量,也一定可由概率的某一函数表示。这样就完全解决了作为“通信的消息”来理解的“狭义信息”的度量问题。这一点与非决定论有相似性。
以上三个观点可以说是信息论的三大理论支柱。信息论的建立,在很大程度上澄清了通信的基本问题。它以概率论为工具,刻划了信源产生信息的数学模型,导出了度量信息的数学公式;同时,描述了信道传输信息的过程,给出了表征信道传输能力的容量公式;此外,它还建立了一组信息传输的编码定理,论证了信息传输的一些基本界限。这些成果的取得,一方面使通信技术从经验走向科学,开辟了通信科学的新纪元。同时,也为整个信息科学的形成和发展奠定了必要的理论基础。但是我们也应该看到,在形式化的各种假设和通信系统的各种模型中,均存在各种各样的前提和假设,致使信息论只适合于一定的范围,给这个理论带来一定的局限性。
应用范围
编码学
密码学与密码分析学
数据传输
数据压缩
检测理论
估计理论
政治学(政治沟通)
信息论概述
信息论是一门用数理统计方法来研究信息的度量、传递和变换规律的科学。它主要是研究通讯和控制系统中普遍存在着信息传递的共同规律以及研究最佳解决信息的获限、度量、变换、储存和传递等问题的基础理论。
参考资料
最新修订时间:2022-08-25 12:53
目录
概述
名称由来
参考资料