乔姆斯基文法
计算机科学中刻画形式文法表达能力的一个分类谱系
乔姆斯基文法,也称乔姆斯基体系,是计算机科学中刻画形式文法表达能力的一个分类谱系,是由诺姆·乔姆斯基于1956年提出的。它包括四个层次:
诺姆·乔姆斯基
艾弗拉姆·诺姆·乔姆斯基(英语:Avram Noam Chomsky,1928年12月7日-),或译作“荷姆斯基”,美国哲学家、语言学家、认知学家、逻辑学家、政治评论家。乔姆斯基是麻省理工学院语言学的荣誉退休教授,他的生成语法被认为是20世纪理论语言学研究上的重要贡献。他对伯尔赫斯·弗雷德里克·斯金纳所著《口语行为》的评论,也有助于发动心理学认知革命,挑战1950年代研究人类行为语言方式中占主导地位的行为主义。他所采用以自然为本来研究语言的方法也大大地影响了语言和心智的哲学研究。他的另一大成就是建立了乔姆斯基层级:根据文法生成力不同而对形式语言做的分类。乔姆斯基还因他对政治的热忱而著名,尤其是他对美国和其它国家政府的批评。从1960年评论越南战争以来,他的媒体和政治评论便越来越著名。一般认为他是活跃在美国政坛左派的主要知识分子。乔姆斯基把自己归为自由意志社会主义者,并且是无政府工团主义的同情者。据艺术和人文引文索引说,在1980年到1992年,乔姆斯基是被文献引用数最多的健在学者,并是有史以来被引用数第八多的学者。
自动机理论
理论计算机科学中,自动机理论是对抽象机和它们能解决的问题的研究。自动机理论密切关联于形式语言理论,因为自动机经常按它们所能识别的形式语言类来分类。
自动机是有限状态机(FSM)的数学模型。FSM是给定符号输入,依据(可表达为一个表格的)转移函数“跳转”过一系列状态的一种机器。在常见的FSM的“米利型有限状态机”(Mealy)变体中,这个转移函数告诉自动机给定当前状态和当前字符的时候下一个状态是什么。
逐个读取输入中的符号,直到被完全耗尽(把它当作有一个字写在其上的磁带,通过自动机的读磁头来读取它;磁头在磁带上前行移动,一次读一个符号)。一旦输入被耗尽,自动机被称为“停止”了。
依赖自动机停止时的状态,称呼这个自动机要么是“接受”要么“拒绝”这个输入。如果停止于“接受状态”,则自动机“接受”了这个字。在另一方面,如果它停止于“拒绝状态”,则这个字被“拒绝”。自动机接受的所有字的集合被称为“这个自动机接受的语言”。
但要注意,自动机一般不必须有有限数目甚至可数个状态。比如,量子有限自动机有不可数无限个状态,因为所有可能状态的集合是在复投影空间中所有点的集合。所以,量子有限自动机有限状态机一样,都是更一般想法拓扑自动机的特殊情况,它的状态的集合是拓扑空间,而状态转移函数取自在这个空间上的所有可能函数。拓扑自动机经常叫做M-自动机,简单是半自动机加上接受状态集合的补充,这里的集合交集确定初始状态是被接受还是被拒绝。
一般的说,自动机不需要严格的接受或拒绝一个输入;它可以按某个在零和一之间的概率接受它。还是用量子有限自动机作为展示例子,它只按某个概率接受输入。这个想法也是更一般情况几何自动机或度量自动机的特殊情况,它的状态的集合是度量空间,一个语言被这个自动机接受如果在初始点和接受状态的集合之间的距离关于这个度量是足够的小。
形式文法
在计算机科学中,形式语言是:某个字母表上,一些有限长字串的集合,而形式文法是描述这个集合的一种方法。形式文法之所以这样命名,是因为它与人类自然语言中的文法相似的缘故。
形式文法描述形式语言的基本想法是,从一个特殊的初始符号出发,不断的应用一些产生式规则,从而生成出一个字串的集合。产生式规则指定了某些符号组合如何被另外一些符号组合替换。举例来说,假设字母表只包含'a'和'b'两个字符,初始符号是'S',我们应用下述规则:
乔姆斯基谱系
乔姆斯基体系是计算机科学中刻画形式文法表达能力的一个分类谱系,是由诺姆·乔姆斯基于1956年提出的。它包括四个层次:
正规语言类包含于上下文无关语言类,上下文无关语言类包含于上下文相关语言类,上下文相关语言类包含于递归可枚举语言类。这里的包含都是集合的真包含关系,也就是说:存在递归可枚举语言不属于上下文相关语言类,存在上下文相关语言不属于上下文无关语言类,存在上下文无关语言不属于正规语言类。
下表总结了上述四种类型的文法的主要特点:
参考资料
最新修订时间:2022-08-25 15:58
目录
概述
诺姆·乔姆斯基
参考资料