纯
文本由可打印
字符组成,人可以直接阅读和理解其形式。例如:百科=百度百科、整数类型 甲变量。
纯文本并非意味着文本是无结构的;
标准通用标记语言和
HTML、
XML都是有良好定义的结构的纯文本的好例子。通过纯文本,你可以做你通过某种二进制格式所能做的每件事情,其中包括版本管理。
与直接的
二进制编码相比,纯文本所处的层面往往更高;前者通常直接源自实现。假定你想要
存储叫做uses_menus的属性,其值既可为
真true,也可为
假false。使用纯文本,你可以将其写为:myprop.uses_menus=FALSE 把它与0010010101110101对比一下。 大多数二进制格式的问题在于,理解数据所必需的语境与数据本身是分离的。你人为地使数据与其含义脱离开来。数据也可能加了密;没有应用逻辑对其进行解析,这些数据绝对没有意义。但是,通过纯文本,你可以获得自描述(self-describing)的、不依赖于创建它的应用的
数据流。
一般情况下,用
汇编语言或
高级语言撰写的
源代码文件(如*.ASM、*.
c、*.cpp、*.FOR、*.COB)以及脚本语言(如
JavaScript、
PHP)撰写的文件(
脚本文件)是纯文本文件。以
TXT、DIZ、
LOG、
BAT、CMD、CFG、IFO、
HTML、
XML、
SVG为扩展名的文件也是纯文本文件。