Unicode是什么意思?

Unicode是由联合国发布的一种代码编制规则,用来记录、标记、统一世界各种语言和文字的编码标准。Unicode是由联合国经济社会文化组织(ECOSOC)于1994年制定的,被称为国际编码标准,是一个国际通用的编码标准。其目标是规范并统一全世界的代码,实现全球统一编码。

Unicode目前有8大核心体系:

(1)世界文字:世界上所有语言,包括汉语、英语、法语、日语等都采用了这一系列标准。

(2)信息码是由26个字母和数字构成。每一个信息码都包括了一个由字母或数字构成的字符串。

(3)音标是一种以自然语言为基础的文字符号系统。

一、 Unicode编码规则

Unicode采用2^(32)个字符作为一个单元,其中前两位表示语言的类别,最后一位表示语言的字母数,中间用两个“+”(-)将字符串分割成两个单元,并用一条连续的字符串将它们连接起来,当这两个单元之间出现连续字符时,中间就没有再使用“+”和“-”符号。

Unicode在使用时,规定了每种语言或文字都必须有一个唯一的代码才能被用户识别。这种编码方法为全世界不同语言或文字的使用者提供了一种简单和一致的方式来使用电脑资源。从这点来看, Unicode在全世界范围内的应用都是统一的。因为所有语言的代码都必须采用相同的编码规则,而不同语言或文字之间很难通过统一的方式来进行编码转换。

Unicode将编码分为3类:字符代码、信息码和音标,它们是基于不同原理来实现编码的。从这点看, Unicode规范了计算机与其它设备之间相互识别的方法,也为以后进一步开发基于计算机实现新应用打下了良好基础。

二、使用方法

Unicode码(或称码组)的概念并不是第一次被提及,但是却是首次应用到电脑领域,并在其后的计算机发展中发挥了重要作用。从上世纪八十年代开始,人们发现,不同国家或地区的人们使用相同的语言表达文字时,不能互相理解。而使用不同的编码时,编码单位可以很容易地互相沟通,使文字能够在世界范围内自由流通。

Unicode码最早被引入到电脑领域是在1971年,当时出现了一种叫做“Unix”的系统。随后出现了两种基于 Unix的操作系统: DOS和 Windows。在 DOS和 Windows中都使用了 Unicode码,但由于 Unix采用了多码混合技术,使其使用非常麻烦。

三、应用程序

Unicode字符集的一个重要作用,就是把原来分散的字符统一起来,使其成为可以识别的一组字符。在程序设计中,我们可以把 Unicode字符串当作一种数据类型来处理,使之能够和其他数据类型一起工作。

在 Windows中, Unicode字符集主要有五个应用程序:

(1) Winsock API (在 Windows平台下主要用于创建和配置网络应用程序);

(2) System Code API (在 UNIX系统中主要用于创建和配置 UNIX应用程序);

本文原创地址:https://www.linuxprobe.com/ussmys.html编辑:刘遄,审核员:暂无