合字、连字、连结字或合体字,中文里指多个独体字组成的字,如:“昌”、“想”等,在西方字体排印学中一般表示将多于一个字母的合成一个字形。
历史起源
印刷合字单纯源于手写本中连写的字符。以发现的最早的
楔形文字手写本中就已经含有很多连写字符。中世纪的
拉丁文手写本中,誊写僧人为加快速度将字符连写,诞生了很多手写缩合字,如在
哥特体中,带右圈的字母 (b, o, 和 p) 和带左圈的字母 (c, e, o, d, g 和 q) 的圈部都被重叠书写。很多手写本字符如h, m和n的竖划都被重叠,而且诞生了很多手写缩合字。14世纪的手写本中含有很多这种手写缩合字。
当
活字印刷诞生后,很多合字直接被制造成了铅字。但是在1950年代无衬线字体广泛使用,以及1970年代
照相排版技术之后,合字就逐渐很少被使用。最早能进行合字电脑排版 (之后激光打印机)之一的是
高德纳的
TeX 程序 (详见下文)。这一潮流也影响到了
1985年之后的
桌面排版 技术。早期电脑软件 ( TeX除外)无法进行合字替换,大部分新制作的电脑字体里也没有合字。早期的个人电脑多使用英文,而英文中并不是必须使用合字,所以也没有实际需要。
随着现代电脑处理的多语言化和现代
电子排版技术(如
OpenType),合字开始逐渐恢复被使用。
拉丁文字
书法合字
许多合字都把字母f和其后的字符组合起来,最常用的就是fi (或 fi,显示为两个独立字符)。很多字体的这两个字母并排在一起后,字母i上的点会抵挡到字母f的弧形勾,无法正确排印,所以干脆就制造一个合字铅字,把 i 的点融入 f 的勾来直接使用。其他 f 合字包括 fj, fl (fl), ff (ff), ffi (ffi), 和 ffl (ffl)。其他合字包括fa, fe, fo, fr, fs, ft, fb, fh, fu, fy,以及f 后加
句号、
逗号或
连字符,还有不太常用的双写ff和 fft 。
使用这些合字是因为通常的
小写字母 f中弧形勾影响字符间距调整。
有时,跨词合字 (如 shelfful的'ff')是不希望出现的,电脑程序 (如
TeX)提供手动方式将它们分开。 一些字体带有 fff合字 (如
Requiem体甚至包括一个 fffl 合字)用于德语的复合词,如 SauerstoffflascheSchifffahrtfff)。正式的德文正字法,如 Duden所述,不赞成跨词合字,由于fff组合在德文中只会在组合词出现如 (Schiff-fahrt, Sauerstoff-flasche),所以这样跨词合字在德文中使用会被认为是不正确的
土耳其语中有带点和不带点的字母I,如单词 fırınfikirfi合字容易混淆,所以在土耳其文排印中一般不使用该合字。像 fl合字一般也不用,土耳其语本来就没有这样的拼写。
合字“ſʒtʒ
哥特体,现在街头、城市广场的标识中带Platz或者以-platz结尾时仍常被使用。
有时 st (st) ſt (ſt), ch, ct以及Qu的合字也被使用(如字体
Linux Libertine)。
起源字母
字母W是7世纪左右才被加入
拉丁字母表的,其发音不尽相同。
古英语使用
卢恩字母Wynn (Ƿ) ,但受到
诺曼人影响后废弃不用。14世纪,这个起源于双写的
V或
UW诞生并在字母表中占有一席。由于它相对于其他字母比较年轻,只有很少欧洲语言(
英语、
荷兰语、
德语、
波兰语、
威尔士语、
马耳他语和
瓦龙语)使用它来拼写本土词汇。
字符
Æ(小写æ,中世纪时称为aesc)作为一个字符在
丹麦语、
挪威语、
冰岛语以及
古英语中使用,并不是一个印刷用的合字。它是一个实在的
字母——代表一个
元音,且在字母表中有位置。现代英文正字法中Æ
Æ源自
中世纪A和E分开印刷。 同样,
Œ 和œ在法文中虽然通常印刷成合字,但在技术限制情况下仍可以拆开书写。
在德文正字法中,带两点的字母元音
ä,
ö和ü来自历史上的ae, oe, ue 合字(严格的说是上标的e,即aͤ, oͤ, uͤ)。现在当文字处理无法显示这三个字符的情况下仍可改写为二合字母ae, oe, ue。字母排序中它们不等价于ae, oe, ue,而是被简单看成 a, o, u。而
北欧语言则不同:带两点的字母被视为独立字母,并排在字母表最后。
一些元音中的圈形
附加符号,如
å起源于一个o合字。现在把旧式 aa 改写为 å 已经称为不成文习惯,但在此之前也可写成 a 上再加一个小 a (aͣ),如 Johannes Bureus, Runa ABC boken 。
uo 合字 ů 的使用实例也在早期现代
高地德语里找到,但其后来混同到u中(如中期
高地德语的fuosz、 早期现代
高地德语 fuͦß、现代
德语 Fuß)。它仍存在于
捷克语中,被称为kroužek。
西班牙语和
葡萄牙语中的上波浪线,分别用于字母
ñ和表示元音鼻音化,起源于一个nn合字(Espanna = España, anno = año)。同样法语中的抑扬符也源自不发音s。
法语、
葡萄牙语、
西班牙语等中的字母
ç 字母hwair(ƕ)仅用于转写
哥德语,代表hw合字。最早在1900年左右心理学者使用这个字用于代替二合字母 hv 用于表示有问题的现象,如Jacques Paul Migne在其1860年代的著作 (Patrologia Latina,第18卷).
拜占庭帝国有一个独特的合字o-u ligature (Ȣ) ,它源于
希腊字母的 ο-υ 两个字母的合字,并被加入到了字母表中。
Gha (ƣ)是一个罕见的字母,起源于 Q 和 G,但在
ISO的文件中误注成 O-I 合字 (参见
Unicode注解)
国际音标使用合字来表示
塞擦音,其中6个有Unicode编码: ʣ, ʤ, ʥ, ʦ, ʧ and ʨ。一个
擦音仍使用合字:ɮ,而
国际音标扩展里加入了后三个:ʩ , ʪ and ʫ.
起源符号
最常用的合字符号当属 &。它起源于E 和t的合字,即
拉丁文&c
同样,美元符号
$比塞塔(peseta)也有时被写作合字 ₧ (源自 Pts).
二合字母
二合字母,如
西班牙语和
威尔士语中的
ll,一般不被看成是合字,因为印刷上两个字母通常是分开的。正如上讨论的合字一样,一些二合字母在一些语言中有不同处理方式。西班牙1994年拼写改革时,二合字母
ch 和 ll 已经被考虑为分开的两个字母。
法文的情况也一样,œu被看成为合字
œ与字母 u的组合。
尽管如此,
荷兰语IJ流行于
荷兰,通常形状像是一个断左臂的U。更令人混淆的是,手写时可以把小写字母y写作没有点的 ij,和大写字母IJ (同样没有点)看起来只是大小差异而已。而 Y在本土荷兰语词汇中不被使用。
合字语言
丹麦语和挪威语
非拉丁字符
合字不仅出现在拉丁文本中:
婆罗米系文字的
元音附标文字频繁使用合字标注辅音。合字的数量依据语言而不同,如同样的
天城文,用于
梵文的合字就要比印地文多。总数为37的辅音中,在天城文两个字母组成的合字总数为1369,很少字体能全部显示这些合字。
微软[Windows]系统附带的''Mangal.ttf''字体带有
印地语支持,但不能正确处理在द, ट, ठ, ड, 和 ढ右边的辅音合字, 而只是加 virama后按照一般形式显示在辅音之后。
希腊字母中使用一些合字,特别是在 omicron (Ο) 和 upsilon (Υ)连写 which later gave rise to one of the letters of the Cyrillic alphabet —参见
Ou字母。 西里尔合字: Љ,
Њ,
Ы, Ѿ. Iotified 西里尔字母是早期西里尔illic decimal I和其他元音的合字: Ꙗ (
Я的祖先), Ѥ, Ѩ, Ѭ,
Ю(源自另外一个合字,Оу,早期的У形式)。
马其顿和
塞尔维亚字母表中的两个字母 lje 和 nje (љ, њ)在19世纪曾分别是
El En (л, н) 与
软音符 (ь)的合字。还有一个ya (Я)和 e 的合字:Ԙԙ,其他合字包括 Ꚅꚅ 和 Ꚉꚉ.
格拉哥里字母的一些手写形式:用于中世纪到19世纪书写 Slavic 语言,多为方形且常用合字。 在
希伯来语中字母
aleph 和
lamed 在一些前现代文本中(主要是宗教或“犹太-阿拉伯”文本)可组合为合字。该组合很常用,因为 [ʔ][a]l- (在希伯来文中写作
aleph加
lamed)是阿拉伯语中的
定冠词。
阿拉伯文:各个字母在词头,词中,词尾均有不同形式。如阿拉伯文的
mīm,单独书写为 م,三个连写 (mmm,显示为词头,词中,词尾形)就变为 ممم 。注意
lām + ʼalif 的情况是特殊的: ﻻ, 而 lām + ʼalif 词中,词尾形是ﻼ。在Unicode有一个特殊的
安拉 合字位于U+FDF2: ﷲ.
乌尔都语 使用
阿拉伯字母的手写体 (Nasta`līq Script) ,在电子排印中有大量合字。
乌尔都语最常用的排版工具 InPage使用 Nasta`līq Script字体多达 20,000个合字。
电脑排版
TeX是电脑排版系统中能使用合字的典型程序。 它能提供五个常用合字: ff、fi、fl、ffi 和 ffl。当TeX遇到这些组合时会自动替换成合字。当然操作者可以手动切换。
OpenType字体格式可以针对一个字符提供多个
字形,因此用来作为合字替换,但需要软件支持。
XeTeX是一个TeX 排版引擎用来调用这些功能。这种替换原先主要用于阿拉伯文排版,但现在已经广泛用于西文。
下表列出了常用文字对的合字以及Unicode代码。正确显示需要使用能正确处理合字的
操作系统和
浏览器 并调用正确的Unicode 电脑字体。
Unicode
这是一个不完整列表。U+A732到U+A73D 区域及其临近区域的一些字符没有列出。
另外,
Dz、 克罗地亚语和波斯尼亚语字母 DŽ, LJ, 和 NJ都有单独的码位。它们不是合字而是二合字母。 仅在语音转写中使用的合字
U+0238 和 U+0239 是二合字母,但实际上是合字。