在Unicode中, 私人使用区指其解释未在
Unicode标准中指定,而是由合作用户之间的私人协议决定其用途的一系列码位。Unicode定义了三个私人使用区:一个在
基本多文种平面(U+E000-U+F8FF)中,另外两个几乎包含了整个第15和第16平面(分别为U+F0000-U+FFFFD,U+100000-U+10FFFD)。
中国国家标准GB/T 20542-2006(“藏文编码字符集扩展A”)和GB / T 22238-2008(“藏文编码字符集扩展B”)使用私人使用区存放
藏文连字。
爱沙尼亚语言研究院使用私人使用区编码Unicode标准未收录的
拉丁字母和
西里尔字母。
美国国际语言暑期学院使用私人使用区编码Unicode标准未收录的语言中的字符。
私人使用区的订定只是
权宜之计,让尚无
统一码标准之前的字符可以临时使用。若日后被官方正式收录,那该从补充字应被剔除,移入正式字区。空下的码位被回收利用,再定义为其他新的补充字。因此每次新统一码标准发布后,都应该立即检查一次补充字,将已正式编码的字进行迁码处理。
例:【
䶮】曾经使用U+E863编码,在Unicode 3.0正式收录为U+4DAE后,则U+E863则不应继续使用。
该区段分为两个子区段:公司用途子区段,从U+F8FF位置开始往小的编码;终端用户子区段,从U+E000位置开始符号位置往大的编码。这只是一般约定,两个子区段只有私有约定的分割点。