查理士·巴赫曼(Charles William Bachman),1924年12月11日出生于堪萨斯州的曼哈顿,毕业于
宾夕法尼亚大学,美国籍科学家,图灵奖获得者,著名成就是
数据库技术(Integrated Data Store)的研究。
个人履历
巴赫曼
1924年生于
堪萨斯州的
曼哈顿,高中在
密歇根州东兰辛度过。
二战爆发后,他加入美国陆军防空高炮师;从
1944年3月至
1946年2月,他在西南太平洋战场待了两年,到过
新几内亚,
澳大利亚和
菲律宾群岛等地。在这里,他首次使用90mm炮弹的
火力控制系统。之后,他离开军队,进入
密歇根州立大学学习,并于两年后获得了机械工程的
学士学位。
1950年,他在
宾夕法尼亚大学取得
硕士学位。同年,他在
沃顿商学院完成了三个季度的学习,取得
MBA学位。 巴赫曼的整个职业生涯基本上是在工业界里,而没有在学术界里作过研究或教职工作。
1950年他进入位于
密歇根州米德兰的
陶氏化工,任工程师,后来升至数据处理经理;
1960年加入
通用电气,在这里他开发出了第一代
网状数据库管理系统——IDS(集成数据存储,en:Integrated Data Store),并和韦尔豪泽·朗伯(Weyerhaeuser Lumber)一起开发了第一个用于访问IDS数据库的
多道程序(multiprogramming);离开GE后,他加入了一家小公司——Cullinane信息系统公司(后改名为Cullinet),该公司为
IBM主机提供与IDS类似的数据管理系统IDMS;
1983年,他创建了自己的公司——巴赫曼信息系统公司。 巴赫曼也为许多标准化组织工作,他积极推动与促成了数据库标准的制定,在美国数据系统语言委员会CODASYL下属的数据库任务组DBTG提出了网状数据库模型以及
数据定义(DDL)和
数据操纵语言(DML)规范说明,于1971年推出了第一个正式报告——DBTG报告。 1973年,他因“数据库技术方面的杰出贡献
[2]”而被授予
图灵奖,并做了题为“作为导航员的程序员(The Programmer as Navigator)”的演讲。
1977年因其数据库系统方面的开创性工作而被选为英国计算机学会的杰出研究员(Distinguished Fellow)。他也被列入数据库名人堂。
明尼苏达大学查尔斯巴贝奇研究所收集了巴赫曼从
1951年到
2007年的全部论文。论文集包含了详细的档案材料,描述了
数据库软件的开发,涉及他在
陶氏化工(
1951年-
1960年),
通用电气(
1960年-
1970年),
霍尼韦尔公司(
1970年-
1981年),Cullinet(
1972年-
1986年),巴赫曼信息系统公司(
1982年-
1996年),以及一些在其他专业组织的论文。
成就及荣誉
运筹工作 在
陶氏化工,巴赫曼作为工程师主要负责运筹方面的问题,在穿孔卡片机上开发
投资回报率的计算程序。
1957年,他被任命为中央数据处理部门的第一负责人,负责筹备公司的第一台大型
数字计算机。巴赫曼主持了一项可行性研究以选择新机器,并聘请了一些
程序员和
分析员。他研究
信息论,并参与了程序设计以简化
文件维护和报告生成过程。1961年,巴赫曼来到纽约市,任职于通用电气,在这里他提供企业集团内部咨询服务。他负责了一个涉及GE的所有部门的综合系统项目,即:使用全新的GE 225计算机,制造一个通用的生产信息和控制系统(MIACS)。 该MIACS应用系统包含了许多要素,最底层的是生产控制系统。它完成生产计划,配件扩充,工厂调度,新订单反馈、处理以及正确变更工厂状况等许多功能。该系统的底层是集成数据存储(IDS,en:Integrated Data Store),是原始的数据库管理系统,IDS建造在存储器上的
虚拟内存系统上,用于检索动态和静态的数据。它是通用电气IDS、IDS II,Cullinet的IDMS和其他基于巴赫曼网状模型的数据库的基础,也是第一个用于生产的基于磁盘数据库管理系统。巴赫曼抓住了当时的许多新机会,成就了一个独特的产品。
数据库管理系统
1964年,巴赫曼来到位于
亚利桑那州的通用电气计算机部门。在这里,他和朗伯一起完成了许多数据库相关的项目,如 GE 400 IDS、GE 600 IDS、DataBASIC、个人数据存储系统、以及WEYCOS 1、2等。WEYCOS是一个复杂的在线数据库
管理信息系统,巴赫曼认为WERCOS 2是第一个能支持多个应用程序并行访问的数据库管理系统。他们开发了“dataBasic”这个产品,为使用
BASIC语言的
分时系统用户提供数据库接口支持。1960年代末,他还与沃伦·西蒙斯、比尔·奥莱等人在
CODASYL数据库任务组一起工作,他们制作的数据库标准深受IDS和巴赫曼想法的影响。
三层结构模型
1970年霍尼韦尔收购GE的计算机事务后,巴赫曼来到
波士顿,在霍尼韦尔高级研究组从事合并后的运筹工作。仍然从事数据库方面的工作。他把自己研究数据模型称之为角色数据模型(role data model)。巴赫曼曾为ISO委员会开发
开放系统互连(Open Systems Interconnection,OSI)。曾担任
美国国家标准学会-标准规划和规定委员会(ANSI-SPARC)的DBMS研究组副主席,并尝试将数据库管理语言标准化。1971年DBTG小组提出了DBTG报告,描述了网状数据库系统参数接口和协议,以支持与数据无关的概念。报告也确立了现在被称为“三层模式方法”(Three schema approach)的
数据库模型,即外部,抽象和内部的分层模型。虽然申请美国国家标准失败,但该模型非常有影响力。1974年,巴赫曼与
关系数据库理论的首创者
埃德加·科德在参加了一个会议时,就两者的功过展开了讨论。
企业数据库设计
1972年,巴赫曼加入Gullinet数据库系统公司,一个IDMS软件的主要供应公司,为
营销提供支持。他主要研究企业数据库的高层模式建模工具和数据定义的翻译工具。他也研究伙伴集合数据模型(partnership set data model),是增强型网状数据库模型和抽象模型建模的基础。同时他也继续为ISO/OSI委员会工作。
巴赫曼信息系统
1983年,他成立了自己的公司——巴赫曼信息系统公司,开发了一些
计算机辅助软件工程产品。这些产品的核心的BACHMAN数据分析,提供了创建维护巴赫曼图(en:Bachman Diagrams)的图形支持工具。公司的特色是提供
IBM主机上的循环再造程序。包括:
废旧主机数据库的逆向工程
数据建模
新物理数据库的预研
优化物理数据库的性能和DBMS规格
该公司获得了
风险投资,迅速成长,并成功提出了的
首次公开招股。尽管公司在数据分析员产品,逆向工程和预研能力上获得一定的成功,但一直在财务和管理上挣扎。作为IBM的商业伙伴,公司获得初步成功,但仍命运多舛。最终它与Cadr系统公司合并成Cayenne软件公司,
1998年被Sterling软件公司收购,接着被
CA公司收购。
个人作品
巴赫曼发表了很多文章和论文,下面列出一部分:
ProCo Features. Supplement No 24, August 24. .
DPMA Quarterly, January 1965.
Datamation April 1965.
DataBase: A Quarterly Newsletter of SIGBDP. vol. 1, no. 2, Summer 1969.
Communications of the ACM vol. 15, no. 7, July 1972.
Encyclopedia of Computer Science, 1972-1973.
Communications of the ACM vol. 16, no. 11, November 1973.
Data Base Management Systems, 1974.
National Computer Conference vol. 46, 1977.
DM, March 1978.
Information Processing 80, 1980.
International Conference on Data Bases, March 24, 1980.
Computers and Standards 1, 1982.
Logic vol. 2, no. 1, Spring 1987.
个人称号
网状数据库之父
20世纪60年代中期以来,数据库技术的形成、发展和日趋成熟,使计算机数据处理技术跃上了一个新台阶,并从而极大地推动了计算机的普及与应用。因此,1973年的图灵奖首次授予在这方面作出杰出贡献的数据库先驱查尔斯·巴赫曼(Charles W.Bachman)。
为了说明巴赫曼的功绩,让我们先简要回顾一下计算机数据处理发展的历史。
算机在20世纪40年代诞生之初只用于科学与工程计算,不能用于数据处理,因为当时的计算机还只能处理数字,不能处理字母和符号,而字母和符号恰是数据处理中的主要处理对象。此外,当时的计算机也还没有数据处理所需要的
大容量存储器。20世纪50年代初,发明了字符发生器(Character Generator),使计算机具有了能显示、存储与处理字母及各种符号的能力;又成功地将高速磁带机用于计算机作存储器,这是对计算机得以进人数据处理领域具有决定意义的两大技术进展。但是磁带只能顺序读写,速度也慢,不是理想的存储设备。1956年,IBM公司和Remington Rand公司先后实验成功
磁盘存储器方案,推出了商用磁盘系统。磁盘不但转速快,容量大,还可以随机读写,为数据处理提供丁更加理想的大容量、快速存储设备。有了这些硬件的支持,计算机数据处理便日益发展起来。
但是,初期的数据处理软件只有文件管理(file management)这种形式,数据文件和应用程序一一对应,造成数据冗余,数据不一致性和数据依赖(data dependence)。所谓数据依赖就是编写程序依赖于具体数据,拿COBOL这种常用的商用语言来说吧,程序员必须在数据部的文件节(DATADIVISION,FILESECTION)中详细说明文件中各数据项的类型和长度、格式,在设备部的输入一输出节(ENVIRON—MENTDIVISION,INPUT-OUTPUTSECTION)中还要通过
SELECT语句和ASSIGN语句把文件和具体设备联系起来,并使用ORGANIZATION语句和ACCESSMODE语句严格规定文件的组织方式和存取方式。根据这些具体规定,程序员再在过程部(PROCEDUREDIVISION)中用一系列命令语句导航,才能使系统完成预期的数据处理任务。应用程序与数据的存储、存取方式密切相关这种状况给程序的编制、维护都造成很大的麻烦。
后来出现了文件管理系统FMS(Pile Management System)作为应用程序和数据文件之间的接口,一个应用程序通过FMS可以和若干文件打交道,在一定程度上增加了数据处理的灵活性。但这种方式仍以分散、互相独立的数据文件为基础,数据冗余、数据不一致性、处理效率低等问题仍不可避免。这些缺点在较大规模的系统中尤为突出。以美国在20世纪60年代初制定的
阿波罗登月计划为例,阿波罗飞船由约200万个零部件组成,它们分散在世界各地制造生产。为了掌握计划进度及协调工程进展,阿波罗计划的主要合约者Rock-well公司曾研制、开发了一个基于磁带的零部件生产计算机管理系统,系统共用了18盘磁带,虽然可以工作,但效率极低,18盘磁带中60%是冗余数据,维护十分困难。这个系统的状况曾一度成为实现阿波罗计划的重大障碍之一。
针对上述问题,各国学者、计算机公司、计算机用户以及计算机学术团体纷纷开展研究,为改革
数据处理系统进行探索与试验,其目标主要就是突破文件系统分散管理的弱点,实现对数据的集中控制,统一管理。结果就是出现了一种全新的高效的管理技术——数据库技术。Rockwell公司就与IBM公司合作,在当时新推出的IBM 360系列上研制成功了世界上最早的数据库管理系统之一IMS(1nformation Management System),为保证阿波罗飞船1969年顺利登月作出了贡献。IMS是基于层次模型的。几乎同时,巴赫曼在通用电气公司主持设计与实现了网状的数据库管理系统IDS(Integrated Data System)。
巴赫曼1924年12月11日生于堪萨斯州的曼哈顿。1948年在
密歇根州立大学取得工程学士学位,1950年在
宾夕法尼亚大学取得硕土学位。20世纪50年代在Dow化工公司工作,1961—1970年在
通用电气公司任程序设计部门经理,1970—1981年在Honeywell公司任总工程师,同时兼任Cullinet软件公司的副总裁和产品经理。Cullinet公司对中国人来说知之者不多,但这个公司当时在美国很有名气,它是1978年第一家在纽约股票交易所上市的软件公司,其时微软在新墨西哥州的阿尔伯克基开张不久,鲜为人知,它的股票是1986年上市的,比Cullinet晚8年之久。但Cullinet最终被CA公司购并。1983年巴赫曼创办了自己的公司Bachman Information System,Inc.。
巴赫曼在数据库方面的主要贡献有两项,第一就是前面说的,在
通用电气公司任程序设计部门经理期间,主持设计与开发了最早的网状数据库管理系统IDS。IDS于1964年推出后,成为最受欢迎的数据库产品之一,而且它的设计思想和实现技术被后来的许多数据库产品所仿效。其二就是巴赫曼积极推动与促成了数据库标准的制定,那就是美国数据系统语言委员会CODASYL下属的数据库任务组DBTG提出的网状
数据库模型以及数据定义和数据操纵语言即DDL和DML的规范说明,于1971年推出了第一个正式报告——DBTG报告,成为数据库历史上具有里程碑意义的文献。该报告中基于IDS的经验所确定的方法称为DBTG方法或CODASYL方法,所描述的网状模型称为DBTG模型或CODASYL模型。DBTG曾希望美国国家标准委员会ANSI接受DBTG报告为数据库管理系统的国家标准,但是没有成功。1971年报告之后,又出现了一系列新的版本,如1973、1978、1981年和1984年的修改版本。DBTG后来改名为DBLTG(Data Base Language Task Group,数据库语言工作小组)。DBTG首次确定了数据库的三层体系结构,明确了
数据库管理员DBA(Data Base Administrator)的概念,规定了DBA的作用与地位。DBTG系统虽然是一种方案而非实际的数据库,但它所提出的基本概念却具有普遍意义,不但国际上大多数网状数据库管理系统,如IDMS、PRIME DBMS、DMSl70、DMSⅡ和DMS 1100等都遵循或基本遵循DBTG模型,而且对后来产生和发展的关系数据库技术也有很重要的影响,其体系结构也遵循DBTG的三级模式(虽然名称有所不同)。下面我们简要介绍一下DBTG的系统结构。