Word中ASCII和ANSI以及Unicode字符知识是什么

发布时间:2021-06-08 Word技巧

Word中ASCII、ANSI和Unicode字符知识

1. ASCII 字符

ASCII 码的全称是American Standard Code for Information Interchange(美国信息互换标准代码),使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。

标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的数字、大小写字母、英文标点符号,以及一些特殊的控制字符。

后128个称为扩展ASCII码。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。

ASCII 字符可用通过Word的菜单命令【插入】/【符号】中,来自“ASCII(十进制)”/“ASCII(十六进制)”。

注:在Word的查找替换中,一个ASCII字符可用^nnn来表示,范围是1~128,比如:字母X,可表示为^88。

另外,某些ASCII控制字符(即不能显示的字符,如:制表符、回车符),被赋予了特殊的含义,而不再代表一个字符。

标准ASCII字符集

代码说明代码说明代码说明

1嵌入式图形44,87W

2脚注标记45-88X

3 46.89Y

4 47/90Z

5 48091[

6 49192\

7表格竖线50293]

8退格键51394^

9制表符52495_

10换行符53596`

11手动换行符54697a

12分页符或分节符55798b

13回车符56899c

14分栏符579100d

15 58:101e

16 59;102f

17 60<103g

18 61=104h

19左侧域标志62>105i

20 63?106j

21右侧域标志64@107k

22 65A108l

23 66B109m

24 67C110n

25 68D111o

26 69E112p

27 70F113q

28 71G114r

29 72H115s

30 73I116t

31 74J117u

32半角空格75K118v

33!76L119w

34"77M120x

35#78N121y

36$79O122z

37%80P123{

38&81Q124|

39'82R125}

40(83S126~

41)84T127

42*85U128€

43+86V

2. ANSI字符

为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示1个字符。比如:汉字“中”在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。

不同的国家和地区制定了不同的标准,由此产生了GBK(简体中文), BIG5(繁体中文),JIS(日语)等各自的编码标准。这些使用2个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文操作系统下,ANSI 编码代表GBK编码。扩展ASCII 码可视为英文系统下的ANSI字符集。

注:在Word的查找替换中,一个ANSI字符可用^0nnn来表示,范围是1~255。比如:字母X,可表示为^088。另外,ANSI Character并不代表GBK字符,而似乎和扩展ASCII码相同。

3. Unicode字符

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换和处理的要求。

Unicode字符可用通过Word的菜单命令【插入】/【符号】中,选择“Unicode(十六进制)”即可。常用汉字(CJK统一汉字)的范围是4E00~9FA5(一~龥),因此,通配符“[一-龥]”可以表示一个汉字。