当前位置:技术支持>字库相关知识

字 库 相 关 知 识

目录

字符集介绍-国标简体 字符集介绍-国标繁体 字符集介绍-GB18030-2000
字符集介绍-台湾Big5 TTF 字库 PostScript字库
OTF字库 点阵字库 单线体字库
为什么字库有新、旧笔形之分? 何为好字库?  

国标简体

      各国家和地区都有自己的多个标准字符集,中国常用的字符集标准有:GB2312-80国标简体、GB12345-90国标繁体、GB18030-2000新国标等。

国标简体GB2312-80是一个94区乘94位的字符集矩阵,分符号区、汉字区和造字区,总共有8836个码位,其中汉字6763个, 符号682个。汉字区又分两级,第一级有3755个汉字,按拼音排序。第二级有3008个汉字,按偏旁排序。如下图所示。

国标字符集中每个汉字或符号都对应一个标准编码和区位码, 如第一个汉字是"啊", 它的标准编码 是B0A1,区位码是1601。


返回目录


国标繁体GB12345-90

国标繁体GB12345-90与国标简体GB12345-80在编码方式上完全相同。其与国标简体的区别在于部
分简体字位上放的是繁体字形。

国标简体与国标繁体之关系:

注解:国标简体与国标繁体使用相同的编码,但部分字形不相同,如下:

国标简体字形:
啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊澳芭捌扒啊叭吧笆八
仃仉仂仨仡仫伛仵伧佶倬俣邗邬邰郅郇郓圪圹坫堀叽唱呗呤吠喊吮咙唉哓纭绐缄缃绀绲绷绶缨纲绸组

国标繁体字形:
啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊澳芭捌扒啊叭吧笆八
仃仉仂仨仡仫伛仵伧佶倬俣邗邬邰郅郇郓圪圹坫堀叽唱呗呤吠喊吮咙唉哓纭绐缄缃绀绲绷绶缨纲绸组

返回目录


新国标GB18030-2000

由国家质量技术监督局颁布于2000年,有如下特点:
1、从字汇上看是在GBK的基础上增加了CJK的扩充集A(6530汉字)和ASCII 符号。
2、总汉字数为21003+6530=27533字, 加 884 个全角符号和128 个ASCII符号。
3、前21003字的字形和编码与GBK完全相同,为双字节编码,后6530汉字为4字节编码,ASCII符号部分为单字节编码。

返回目录


台湾BIG-5字符集

BIG-5字符集并非台湾官方编码标准,而是一种业界流行的事实标准。台湾官方字符集编码标准为CNS,CNS的前13053字的编码与BIG-5完全相同,只有个别字序不同。

BIG-5字符集总共有码位:
126区*157位=19782个, 其中汉字数5401+7659=13060个,符号471个。
见图示:


返回目录


TTF字库

   TTF 是 TrueType Font 的缩写,是苹果公司及微软公司共同制定的一种字体格式 ,它采用二次曲线来描述字形轮廓 ,与其它早期的字库格式如点阵、矢量字库等比较,具有字库信息小,字形可以随意缩放、变形(旋转、倾斜、弯曲)而不失真等等优点。 TTF 字库作为一种标准字库格式兼容于所有流行的文字、图形处理软件,比如 Microsoft Word 、 Pagemake 、 Photoshop 等,用户可以用它进行文字编辑也可做低精度的打印输出。 TTF 分 Windows 和 MAC 两种版本, Windows 和 MAC 的 TrueType 版本是不兼容的,用户需要根据自己使用的系统环境选择不同版本的 TureType 字库产品。

    在计算机字体文件夹里, TrueType 字库被显示为:字库名 .TTF

    TrueType 字库可以被制作成可嵌入式或不可嵌入式,是否可嵌入完全由字库厂家来决定。如果 TrueType 字库是可嵌入式,其字型数据允许被嵌入 PDF 文件中,使 PDF 文件适合网上传输,因为对方可以在没有安装字库的情况下阅读和打印输出 PDF 文件。

返回目录


PostScript字库

    PostScript是由Adobe公司开发的页面描述语言,它将页面上的图像和文字用数学公式的方法描述,最后通过PostScript解释器(Interpreter)翻译成所需要的输出。它是国际上最流行的页面描述语言,也是事实上的工业标准。几乎所有的印前输出设备都支持PostScript语言。 Type 1、Type 3、Type4字体格式都是PostScript语言中描述文字部分的各个不同时期的不同版本,它们使用三次曲线的方式来描述字形轮廓, 使字库信息少、输出速度快、字形可以放大、缩小而不失真等。但一个Type1 字库最多只能存贮256个汉字或符号,不适合一个字库里面存贮成千上万个汉字。PostScript字库又可分为OCF和CID字库。

OCF (Original Composite Font)是Adobe公司在1990年推出的一种PostScript字体格式。它通过复杂的字形数据存储方式将多个Type 1、Type 3、Type4小字库有效地组织起来而成为一个大字库,解决汉字字数多的问题。

OCF字库主要安装在高精度的激光打印设备以及激光照排机等输出设备。对应前端排版所使用的True Type字库,可以获得高品质的输出效果。

CID ( Character Identifier ) 是 Adobe 公司于 1995 年发表的一种 PostScript 字库格式,由 CIDFont 与 CMap 表两大部分组成。其对字形的描述与 OCF 字库完全相同,都是用三次曲线来描述字形轮廓。所不同之处在于它采用 CMap 的对应关系去组织成千上万个字符,而不是将多个小 Type1 字库组织在一起。

因为应用了 CMap表,CID字库与OCF字库相比,有了更多的优势:

a、易扩充:可以很方便地扩充字库的字符集而支持多言语。只要向相应的CMap表中增加编码及相应的CID字形描述文件,就可以达到扩充字符集的目的。

b、速度快:由于CID的字形数据存储方式比OCF简单。所以PostScript解释器能够更快速的取得字形信息并打印输出,这样能够实现文档的高效处理。

c、实用性:CID字库可以做成可嵌入PDF的方式,目前大多数的输出设备都支持PDF流程,所以CID字库比OCF字库更受欢迎。

返回目录


OTF字库

    OTF(OpenType Font)是Adobe公司和微软公司联合开发的一种新型的数字化曲线轮廓字库格式。其对字形轮廓的描述可以与TrueType一样用二次曲线方式, 也可以与PostScript字库一样用3次曲线方式。 具有字库信息小,字形可以随意缩放、变形(旋转、倾斜、弯曲)而不失真等等优点 。它具有很强的兼容性,可以同时用于 MAC操作系统、Windows操作系统和Linux操作系统。并具有其它字库所没有的、丰富的排版特性,是目前国际上流行的字库格式。

    在计算机字体文件夹里,OpenType字库被显示为:字库名.OTF

    OpenType字库的字型数据允许被嵌入PDF文件中,当PDF文件被发送到远方打印输出时,远方的计算机和打印机均不需要安装该PDF文件中所嵌的字库。

    OpenType字库可用于排版、设计软件如Adobe的Indesign、PhotoShop、Illustrator、等,及Microsoft的Word等去获得专业的印刷版面如杂志、报刊、广告、书籍等。既可以用于排版时的屏幕显示,也可以用于激光打印机或激光照排机的输出胶片。

返回目录


点阵字库

    点阵是一种数字化字库的格式,每个字形以黑白象素点矩阵组成。常用点阵字库规格有 12 点阵、 14 、 16 、 24 、 32 、 48 点阵。因为电脑里一个字节有 8 位,对应显示屏的 8 个象素点,对一个 16 点阵字形而言,一行就需要用 2 个字节( 16 位)来描述,总供有 16 行,如图一所示,它的存贮信息量是 2*16=32 个字节。而一个 48 点阵字形一行就需要用 6 个字节( 48 位)乘 48 行组成,如图二所示,它的存贮信息量是 6*48=288 个字节。通常在电脑里每个点阵字库有几千上万个字组成,一个字库的存贮信息量可以跟据字库规格和字数计算出来,随着点阵矩阵的增加而增加。

    一般 16 以下的点阵用于各种电子设备的屏幕显示:如计算机、手机、好易通、记录仪、 MP3 、打印机等等。 24 以上点阵用于针式打印机或激光打印机输出。

    点阵字库相比曲线字库的缺点是存贮信息量大、字形放大后边缘有据齿。优点是在小字显示时比还原后的曲线字更清晰,显示速度快。

返回目录


单线体字库

    单线体字库是一种特殊的字体格式,字的笔画是由一节一节的线段组成,不分字体品种。 所以还原字型时所涉及的指令也相对简单,并且与点阵字库比较具有可以缩放的优点。而与 TTF字库比较具有还原速度快,字库信息量小的特点。

    目前汉仪的单线体字库已成功应用到 CAD软件并可方便地嵌入到外设设备,比如喷码机、绘图议。

返回目录


为什么字库有新、旧笔形之分?

    汉字有新、旧笔形之分,在一般的新华字典中有《新旧字形对照表》。旧字形已属于不规范字,国内不准使用。但日本、台湾、香港等使用汉字的国家和地区都使用旧笔形字。有的字体在早期设计原字模时就是旧笔形,有些古代的书写体也是旧笔形,不易改成新笔形(改后不易与原作风格一致),所以后期做成的数位化字库有的就是新笔形,有的是旧笔形 ,有的是新、旧笔形混合。

返回目录


何为好字库?

•  每一种字体都有自己独特的风格:字的点、横、撇、捺、折的起笔、落笔的形状、粗细和味道都是精心、优美    的设计。

•  同一种字体的字库里成千上万个汉字和符号的风格要保证一致。

•  每个字都必须有好的间架结构 : 稳定的重心、合适的笔划粗细、均匀的空白、很好的视觉效果等等。

•  每个笔画都要很光洁。

•  字库要加 hinting 技术,在小字情况下显示很清晰,打印也不掉线。

返回目录



Copyright 北京汉仪科印信息技术有限公司
京ICP备05019967