首页互联网 正文

ASCII码对照表【2024年汇总】

2024-03-25 6 0条评论

ASCII相关文章汇总如下:

  • ASCII码对照表(255个ascii字符汇总)
  • ASCII码对照表(Unicode 字符集列表)
  • ASCII码对照表(emoji表情符号)
  • ASCII码对照表(Python代码实现打印)
  • ASCII码对照表(C++17 实现ANSI、UTF8、Unicode编码互转)
  • ASCII码对照表(HTML颜色代码表)
  • ASCII码对照表(Matplotlib颜色对照表)
  • ASCII码对照表【2024年汇总】

文章目录

  • 1、简介
  • 2、表格形式
  • 3、图片形式
  • 4、常用转义字符
  • 5、ASCII、Unicode 和 UTF-8 之间的关系
    • 5.1 ASCII 编码
    • 5.2 非 ASCII 编码
    • 5.3 Unicode
    • 5.4 UTF-8
    • 5.5 Little endian 和 Big endian
  • 结语

1、简介

ASCII(发音:,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本延伸美国标准信息交换码则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。

ASCII 由电报码发展而来。靠前版标准发布于1963年 ,1967年经历了一次主要修订[5][6],最后一次更新则是在1986年,至今为止共定义了128个字符;其中33个字符无法显示(一些终端提供了扩展,使得这些字符可显示为诸如笑脸、扑克牌花式等8-bit符号),且这33个字符多数都已是陈废的控制字符。控制字符的用途主要是用来操控已经处理过的文字。在33个字符之外的是95个可显示的字符。用键盘敲下空白键所产生的空白字符也算1个可显示字符(显示为空白)。

  • 1、ASCII码 是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646 。在这个页面,你可以找到8位的256个字符、ASCII码表和Windows-1252 (code page 1252,它是国际标准ISO 8859-1的一个扩展字符集) 标准保持一致;
  • 2、ASCII码 是 American Standard Code for Information Interchange 的缩写,而不是ASCⅡ(罗马数字2),有很多人在这个地方产生误解;
  • 3、ASCII码 规范于1967年靠前次发布,最后一次更新是在1986年,它包含了33个控制字符(具有某些特殊功能但是无法显示的字符)和95个可显示字符;

ASCII ,它的全称是"美国信息交换标准代码"。它设计于60年代早期,是计算机和诸如打印机、磁带驱动器之类的硬件设备的标准字符集。
ASCII 是 7 比特字符集,包含了 128 个不同的字符值。
ASCII 支持 0-9 的数字,A-Z大写和小写英文字母,以及一些特殊字符。
被广泛使用于现代计算机、HTML和因特网上的字符集都是基于 ASCII 。

ASCII英文全称:American Standard Code for Information Interchange,即:美国信息交换标准代码,是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。ASCII靠前次以规范标准的类型发表是在1967年,1986年定义了常用的128个字符。
ASCII码对照表中文发音为阿斯克码表,标准ASCII码表通常作为各种符号的16进制对照表使用,但通常讲的ASCII码其实是指ASCII码的十进制值。比如:字母a的ascii码值为97,空格的ascii码值为32。

这里汇集了最完整的ASCII码对照表,包含32个字符的ASCII控制字符对照表(即非打印字符对照表)、96个字符的ASCII打印字符对照表、128个字符的ASCII扩展字符对照表。覆盖了常用的128个字符和128个扩展字符。常用的128个字符,对应ASCII十六进制编码范围为0x00-0x7F,即十进制的0-127,包含32个非打印控制字符和96个打印字符,打印字符包括可显示字符(数字、字母、符号)和空格及删除命令。

2、表格形式

0~31 之间的ASCII码常用于控制像打印机一样的外围设备。

十进制
DEC
八进制
OCT
十六进制
HEX
二进制
BIN
符号
Symbol
HTML
实体编码
中文解释
Description
英文解释
Description
0 000 00 00000000 NUL � 空字符 终止符 Null char
1 001 01 00000001 SOH  标题开始 Start of Heading
2 002 02 00000010 STX  正文开始 Start of Text
3 003 03 00000011 ETX  正文结束 End of Text
4 004 04 00000100 EOT  传输结束 End of Transmission
5 005 05 00000101 ENQ  询问 Enquiry
6 006 06 00000110 ACK  收到通知 Acknowledgment
7 007 07 00000111 BEL  Bell
8 010 08 00001000 BS  退格 Back Space
9 011 09 00001001 HT 	 水平制表符 Horizontal Tab
10 012 0A 00001010 LF 
 换行符 \n Line Feed
11 013 0B 00001011 VT  垂直制表符 Vertical Tab
12 014 0C 00001100 FF  换页符 Form Feed
13 015 0D 00001101 CR 
 回车符 \r Carriage Return
14 016 0E 00001110 SO  移出 Shift Out / X-On
15 017 0F 00001111 SI  移入 Shift In / X-Off
16 020 10 00010000 DLE  数据链路转义 Data Line Escape
17 021 11 00010001 DC1  设备控制 1 Device Control 1 (oft. XON)
18 022 12 00010010 DC2  设备控制 2 Device Control 2
19 023 13 00010011 DC3  设备控制 3 Device Control 3 (oft. XOFF)
20 024 14 00010100 DC4  设备控制 4 Device Control 4
21 025 15 00010101 NAK  拒绝接收 Negative Acknowledgement
22 026 16 00010110 SYN  同步空闲 Synchronous Idle
23 027 17 00010111 ETB  传输块结束 End of Transmit Block
24 030 18 00011000 CAN  取消 Cancel
25 031 19 00011001 EM  介质中断 End of Medium
26 032 1A 00011010 SUB  替换 Substitute
27 033 1B 00011011 ESC  换码符 Escape
28 034 1C 00011100 FS  文件分隔符 File Separator
29 035 1D 00011101 GS  组分隔符 Group Separator
30 036 1E 00011110 RS  记录分离符 Record Separator
31 037 1F 00011111 US  单元分隔符 Unit Separator
十进制 32~127 区间一共 127-32+1=96 个ASCII码表示的符号,在我们的键盘上都可以被找到。其中:32表示空格,127表示删除命令。
十进制
DEC
八进制
OCT
十六进制
HEX
二进制
BIN
符号
Symbol
HTML
实体编码
中文解释
Description
英文解释
Description
32 040 20 00100000     空格 Space
33 041 21 00100001 ! ! 感叹号 Exclamation mark
34 042 22 00100010 " " 双引号 Double quotes (or speech marks)
35 043 23 00100011 # # 井号 Number
36 044 24 00100100 $ $ 美元符 Dollar
37 045 25 00100101 % % 百分号 Per cent sign
38 046 26 00100110 & & Ampersand
39 047 27 00100111 ' ' 单引号 Single quote
40 050 28 00101000 ( ( 左括号 Open parenthesis (or open bracket)
41 051 29 00101001 ) ) 右括号 Close parenthesis (or close bracket)
42 052 2A 00101010 * * 星号 Asterisk
43 053 2B 00101011 + + 加号 Plus
44 054 2C 00101100 , , 逗号 Comma
45 055 2D 00101101 - - 连字号或减号 Hyphen
46 056 2E 00101110 . . 句点或小数点 Period, dot or full stop
47 057 2F 00101111 / / 斜杠 Slash or pide
48 060 30 00110000 0 0 0 Zero
49 061 31 00110001 1 1 1 One
50 062 32 00110010 2 2 2 Two
51 063 33 00110011 3 3 3 Three
52 064 34 00110100 4 4 4 Four
53 065 35 00110101 5 5 5 Five
54 066 36 00110110 6 6 6 Six
55 067 37 00110111 7 7 7 Seven
56 070 38 00111000 8 8 8 Eight
57 071 39 00111001 9 9 9 Nine
58 072 3A 00111010 : : 冒号 Colon
59 073 3B 00111011 ; &#059; 分号 Semicolon
60 074 3C 00111100 < &#060; 小于 Less than (or open angled bracket)
61 075 3D 00111101 = &#061; 等号 Equals
62 076 3E 00111110 > &#062; 大于 Greater than (or close angled bracket)
63 077 3F 00111111 ? &#063; 问号 Question mark
64 100 40 01000000 @ &#064; 电子邮件符号 At symbol
65 101 41 01000001 A &#065; 大写字母 A Uppercase A
66 102 42 01000010 B &#066; 大写字母 B Uppercase B
67 103 43 01000011 C &#067; 大写字母 C Uppercase C
68 104 44 01000100 D &#068; 大写字母 D Uppercase D
69 105 45 01000101 E &#069; 大写字母 E Uppercase E
70 106 46 01000110 F &#070; 大写字母 F Uppercase F
71 107 47 01000111 G &#071; 大写字母 G Uppercase G
72 110 48 01001000 H &#072; 大写字母 H Uppercase H
73 111 49 01001001 I &#073; 大写字母 I Uppercase I
74 112 4A 01001010 J &#074; 大写字母 J Uppercase J
75 113 4B 01001011 K &#075; 大写字母 K Uppercase K
76 114 4C 01001100 L &#076; 大写字母 L Uppercase L
77 115 4D 01001101 M &#077; 大写字母 M Uppercase M
78 116 4E 01001110 N &#078; 大写字母 N Uppercase N
79 117 4F 01001111 O &#079; 大写字母 O Uppercase O
80 120 50 01010000 P &#080; 大写字母 P Uppercase P
81 121 51 01010001 Q &#081; 大写字母 Q Uppercase Q
82 122 52 01010010 R &#082; 大写字母 R Uppercase R
83 123 53 01010011 S &#083; 大写字母 S Uppercase S
84 124 54 01010100 T &#084; 大写字母 T Uppercase T
85 125 55 01010101 U &#085; 大写字母 U Uppercase U
86 126 56 01010110 V &#086; 大写字母 V Uppercase V
87 127 57 01010111 W &#087 大写字母 W Uppercase W
88 130 58 01011000 X &#088; 大写字母 X Uppercase X
89 131 59 01011001 Y &#089; 大写字母 Y Uppercase Y
90 132 5A 01011010 Z &#090; 大写字母 Z Uppercase Z
91 133 5B 01011011 [ &#091; 左中括号 Opening bracket
92 134 5C 01011100 \ &#092; 反斜杠 Backslash
93 135 5D 01011101 ] &#093; 右中括号 Closing bracket
94 136 5E 01011110 ^ &#094; 音调符号 Caret - circumflex
95 137 5F 01011111 _ &#095; 下划线 Underscore
96 140 60 01100000 ` &#096; 重音符 Grave accent
97 141 61 01100001 a &#097; 小写字母 a Lowercase a
98 142 62 01100010 b &#098; 小写字母 b Lowercase b
99 143 63 01100011 c &#099; 小写字母 c Lowercase c
100 144 64 01100100 d &#100; 小写字母 d Lowercase d
101 145 65 01100101 e &#101; 小写字母 e Lowercase e
102 146 66 01100110 f &#102; 小写字母 f Lowercase f
103 147 67 01100111 g &#103; 小写字母 g Lowercase g
104 150 68 01101000 h &#104; 小写字母 h Lowercase h
105 151 69 01101001 i &#105; 小写字母 i Lowercase i
106 152 6A 01101010 j &#106; 小写字母 j Lowercase j
107 153 6B 01101011 k &#107; 小写字母 k Lowercase k
108 154 6C 01101100 l &#108; 小写字母 l Lowercase l
109 155 6D 01101101 m &#109; 小写字母 m Lowercase m
110 156 6E 01101110 n &#110; 小写字母 n Lowercase n
111 157 6F 01101111 o &#111; 小写字母 o Lowercase o
112 160 70 01110000 p &#112; 小写字母 p Lowercase p
113 161 71 01110001 q &#113; 小写字母 q Lowercase q
114 162 72 01110010 r &#114; 小写字母 r Lowercase r
115 163 73 01110011 s &#115; 小写字母 s Lowercase s
116 164 74 01110100 t &#116; 小写字母 t Lowercase t
117 165 75 01110101 u &#117; 小写字母 u Lowercase u
118 166 76 01110110 v &#118; 小写字母 v Lowercase v
119 167 77 01110111 w &#119; 小写字母 w Lowercase w
120 170 78 01111000 x &#120; 小写字母 x Lowercase x
121 171 79 01111001 y &#121; 小写字母 y Lowercase y
122 172 7A 01111010 z &#122; 小写字母 z Lowercase z
123 173 7B 01111011 { &#123; 左大括号 Opening brace
124 174 7C 01111100 | &#124; 垂直线 Vertical bar
125 175 7D 01111101 } &#125; 右大括号 Closing brace
126 176 7E 01111110 ~ &#126; 波浪号 Equivalency sign - tilde
127 177 7F 01111111 &#127; 删除 delete
后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。
十进制
DEC
八进制
OCT
十六进制
HEX
二进制
BIN
符号
Symbol
HTML
实体编码
中文解释
Description
英文解释
Description
128 200 80 10000000 &#128; 欧盟符号 Euro sign
129 201 81 10000001      
130 202 82 10000010 &#130; 单低 9 引号 Single low-9 quotation mark
131 203 83 10000011 ƒ &#131; 带钩的
拉丁小写字母f
Latin small letter f with hook
132 204 84 10000100 &#132; 双低 9 引号 Double low-9 quotation mark
133 205 85 10000101 &#133; 水平省略号 Horizontal ellipsis
134 206 86 10000110 &#134; 剑号 Dagger
135 207 87 10000111 &#135; 双剑号 Double dagger
136 210 88 10001000 ˆ &#136; 修正字符
抑扬音符号
Modifier letter circumflex accent
137 211 89 10001001 &#137; 千分号 Per mille sign
138 212 8A 10001010 Š &#138; 带弯音号的
拉丁大写字母 S
Latin capital letter S with caron
139 213 8B 10001011 &#139; 左单书名号 Single left-pointing angle quotation
140 214 8C 10001100 Œ &#140; 拉丁大写组合 OE Latin capital ligature OE
141 215 8D 10001101      
142 216 8E 10001110 Ž &#142; 带弯音号的
拉丁大写字母 z
Latin capital letter Z with caron
143 217 8F 10001111      
144 220 90 10010000      
145 221 91 10010001 &#145; 左单引号 Left single quotation mark
146 222 92 10010010 &#146; 右单引号 Right single quotation mark
147 223 93 10010011 &#147; 左双引号 Left double quotation mark
148 224 94 10010100 &#148; 右双引号 Right double quotation mark
149 225 95 10010101 &#149;   Bullet
150 226 96 10010110 &#150; 半长破折号 En dash
151 227 97 10010111 &#151; 全长破折号 Em dash
152 230 98 10011000 ˜ &#152; 小波浪线 Small tilde
153 231 99 10011001 &#153;   Trade mark sign
154 232 9A 10011010 š &#154; 带弯音号的
拉丁小写字母 s
Latin small letter s with caron
155 233 9B 10011011 &#155; 右单书名号 Single right-pointing
angle quotation mark
156 234 9C 10011100 œ &#156; 拉丁小写组合 oe Latin small ligature oe
157 235 9D 10011101      
158 236 9E 10011110 ž &#158; 带弯音号的
拉丁小写字母 z
Latin small letter z with caron
159 237 9F 10011111 Ÿ &#159; 带弯音号的
拉丁大写字母 Y
Latin capital letter Y with diaeresis
160 240 A0 10100000   &#160;   Non-breaking space
161 241 A1 10100001 ¡ &#161; 反向感叹号 Inverted exclamation mark
162 242 A2 10100010 ¢ &#162; 分币符号 Cent sign
163 243 A3 10100011 £ &#163; 英磅符号 Pound sign
164 244 A4 10100100 ¤ &#164;   Currency sign
165 245 A5 10100101 ¥ &#165; 人民币符号 Yen sign
166 246 A6 10100110 ¦ &#166;   Pipe, Broken vertical bar
167 247 A7 10100111 § &#167; 章节符号 Section sign
168 250 A8 10101000 ¨ &#168; 通用货币符号 Spacing diaeresis - umlaut
169 251 A9 10101001 © &#169; 版权符号 Copyright sign
170 252 AA 10101010 ª &#170; 阴性顺序
指示符号
Feminine ordinal indicator
171 253 AB 10101011 « &#171; 左角引号 Left double angle quotes
172 254 AC 10101100 ¬ &#172;   Not sign
173 255 AD 10101101 ­ &#173;   Soft hyphen
174 256 AE 10101110 ® &#174;   Registered trade mark sign
175 257 AF 10101111 ¯ &#175;   Spacing macron - overline
176 260 B0 10110000 ° &#176; 温度符号 Degree sign
177 261 B1 10110001 ± &#177; 加/减号 Plus-or-minus sign
178 262 B2 10110010 ² &#178; 上标 2 Superscript two - squared
179 263 B3 10110011 ³ &#179; 上标 3 Superscript three - cubed
180 264 B4 10110100 ´ &#180;   Acute accent - spacing acute
181 265 B5 10110101 µ &#181; 微符号 Micro sign
182 266 B6 10110110 &#182; 段落符号,
pilcrow
Pilcrow sign - paragraph sign
183 267 B7 10110111 · &#183; 中点 Middle dot - Georgian comma
184 270 B8 10111000 ¸ &#184;   Spacing cedilla
185 271 B9 10111001 ¹ &#185; 上标 1 Superscript one
186 272 BA 10111010 º &#186; 阳性顺序
指示符
Masculine ordinal indicator
187 273 BB 10111011 » &#187; 右角引号 Right double angle quotes
188 274 BC 10111100 ¼ &#188; 分数四分之一 Fraction one quarter
189 275 BD 10111101 ½ &#189; 分数二分之一 Fraction one half
190 276 BE 10111110 ¾ &#190;   Fraction three quarters
191 277 BF 10111111 ¿ &#191; 反向问号 Inverted question mark
192 300 C0 11000000 À &#192; 带重音符
的大写字母 A
Latin capital letter A with grave
193 301 C1 11000001 Á &#193; 带尖锐重音
的大写字母 A
Latin capital letter A with acute
194 302 C2 11000010 Â &#194; 带音调符号
的大写字母 A
Latin capital letter A with circumflex
195 303 C3 11000011 Ã &#195; 带代字号
的大写字母 A
Latin capital letter A with tilde
196 304 C4 11000100 Ä &#196; 带元音变音
(分音符号)
的大写字母 A
Latin capital letter A with diaeresis
197 305 C5 11000101 Å &#197; 带铃声
的大写字母 A
Latin capital letter A with ring above
198 306 C6 11000110 Æ &#198; 大写字母 AE
双重元音
Latin capital letter AE
199 307 C7 11000111 Ç &#199; 带变音符号
的大写字母 C
Latin capital letter C with cedilla
200 310 C8 11001000 È &#200; 带重音符
的大写字母 E
Latin capital letter E with grave
201 311 C9 11001001 É &#201; 带尖锐重音
的大写字母 E
Latin capital letter E with acute
202 312 CA 11001010 Ê &#202; 带音调符号
的大写字母 E
Latin capital letter E with circumflex
203 313 CB 11001011 Ë &#203; 带元音变音
(分音符号)
的大写字母 E
Latin capital letter E with diaeresis
204 314 CC 11001100 Ì &#204; 带重音符
的大写字母 I
Latin capital letter I with grave
205 315 CD 11001101 Í &#205; 带尖锐重音
的大写字母 I
Latin capital letter I with acute
206 316 CE 11001110 Î &#206; 带音调符号
的大写字母 I
Latin capital letter I with circumflex
207 317 CF 11001111 Ï &#207; 带元音变音
(分音符号)
的大写字母 I
Latin capital letter I with diaeresis
208 320 D0 11010000 Ð &#208;   Latin capital letter ETH
209 321 D1 11010001 Ñ &#209; 带代字号
的大写字母 N
Latin capital letter N with tilde
210 322 D2 11010010 Ò &#210; 带重音符
的大写字母 O
Latin capital letter O with grave
211 323 D3 11010011 Ó &#211; 带尖锐重音
的大写字母 O
Latin capital letter O with acute
212 324 D4 11010100 Ô &#212; 带音调符号
的大写字母 O
Latin capital letter O with circumflex
213 325 D5 11010101 Õ &#213; 带代字号
的大写字母 O
Latin capital letter O with tilde
214 326 D6 11010110 Ö &#214; 带元音变音
(分音符号)
的大写字母 O
Latin capital letter O with diaeresis
215 327 D7 11010111 × &#215; 大写字母
OE 连字
Multiplication sign
216 330 D8 11011000 Ø &#216; 带斜杠
的大写字母 O
Latin capital letter O with slash
217 331 D9 11011001 Ù &#217; 带重音符
的大写字母 U
Latin capital letter U with grave
218 332 DA 11011010 Ú &#218; 带尖锐重音
的大写字母 U
Latin capital letter U with acute
219 333 DB 11011011 Û &#219; 带音调符号
的大写字母 U
Latin capital letter U with circumflex
220 334 DC 11011100 Ü &#220; 带元音变音
(分音符号)
的大写字母 U
Latin capital letter U with diaeresis
221 335 DD 11011101 Ý &#221; 带元音变音
(分音符号)
的大写字母 Y
Latin capital letter Y with acute
222 336 DE 11011110 Þ &#222;   Latin capital letter THORN
223 337 DF 11011111 ß &#223; 德语高调
小写字母 s
Latin small letter sharp s - ess-zed
224 340 E0 11100000 à &#224; 带重音符
的小写字母 a
Latin small letter a with grave
225 341 E1 11100001 á &#225; 带尖锐重音
的小写字母 a
Latin small letter a with acute
226 342 E2 11100010 â &#226; 带音调符号
的小写字母 a
Latin small letter a with circumflex
227 343 E3 11100011 ã &#227; 带代字号
的小写字母 a
Latin small letter a with tilde
228 344 E4 11100100 ä &#228; 带元音变音
(分音符号)
的小写字母 a
Latin small letter a with diaeresis
229 345 E5 11100101 å &#229; 带铃声的
小写字母 a
Latin small letter a with ring above
230 346 E6 11100110 æ &#230; 小写字母 ae
双重元音
Latin small letter ae
231 347 E7 11100111 ç &#231; 带变音符号
的小写字母 c
Latin small letter c with cedilla
232 350 E8 11101000 è &#232; 带重音符
的小写字母 e
Latin small letter e with grave
233 351 E9 11101001 é &#233; 带尖锐重音
的小写字母 e
Latin small letter e with acute
234 352 EA 11101010 ê &#234; 带音调符号
的小写字母 e
Latin small letter e with circumflex
235 353 EB 11101011 ë &#235; 带元音变音
(分音符号)
的小写字母 e
Latin small letter e with diaeresis
236 354 EC 11101100 ì &#236; 带重音符
的小写字母 i
Latin small letter i with grave
237 355 ED 11101101 í &#237; 带尖锐重音
的小写字母 i
Latin small letter i with acute
238 356 EE 11101110 î &#238; 带音调符号
的小写字母 i
Latin small letter i with circumflex
239 357 EF 11101111 ï &#239; 带元音变音
(分音符号)
的小写字母 i
Latin small letter i with diaeresis
240 360 F0 11110000 ð &#240;   Latin small letter eth
241 361 F1 11110001 ñ &#241; 带代字号
的小写字母 n
Latin small letter n with tilde
242 362 F2 11110010 ò &#242; 带重音符
的小写字母 o
Latin small letter o with grave
243 363 F3 11110011 ó &#243; 带尖锐重音
的小写字母 o
Latin small letter o with acute
244 364 F4 11110100 ô &#244; 带音调符号
的小写字母 o
Latin small letter o with circumflex
245 365 F5 11110101 õ &#245; 带代字号
的小写字母 o
Latin small letter o with tilde
246 366 F6 11110110 ö &#246; 带元音变音
(分音符号)
的小写字母 o
Latin small letter o with diaeresis
247 367 F7 11110111 ÷ &#247; 小写字母 oe
连字
Division sign
248 370 F8 11111000 ø &#248; 带斜杠
的小写字母 o
Latin small letter o with slash
249 371 F9 11111001 ù &#249; 带重音符
的小写字母 u
Latin small letter u with grave
250 372 FA 11111010 ú &#250; 带尖锐重音
的小写字母 u
Latin small letter u with acute
251 373 FB 11111011 û &#251; 带音调符号
的小写字母 u
Latin small letter u with circumflex
252 374 FC 11111100 ü &#252; 带元音变音
(分音符号)
的小写字母 u
Latin small letter u with diaeresis
253 375 FD 11111101 ý &#253; 带元音变音
(分音符号)
的小写字母 y2
Latin small letter y with acute
254 376 FE 11111110 þ &#254;   Latin small letter thorn
255 377 FF 11111111 ÿ &#255;   Latin small letter y with diaeresis

3、图片形式

  • 可显示字符
    可显示字符编号范围是32-126(0x20-0x7E),共95个字符。
  • 控制字符
    ASCII控制字符的编号范围是0-31和127(0x00-0x1F和0x7F),共33个字符。
  • 靠前部分:ASCII非打印控制字符表
    ASCII表上的数字0–31分配给了控制字符,用于控制像打印机等一些外围设备。
  • 第二部分:ASCII打印字符
    数字 32–126 分配给了能在键盘上找到的字符,当您查看或打印文档时就会出现。
  • 第三部分:扩展ASCII打印字符
    扩展的ASCII字符满足了对更多字符的需求。
    扩展的ASCII包含ASCII中已有的128个字符,又增加了128个字符,总共是256个。
    即使有了这些更多的字符,许多语言还是包含无法压缩到256个字符中的符号。因此,出现了一些ASCII的变体来囊括地区性字符和符号。例如,许多软件程序把ASCII表(又称作ISO8859-1)用于北美、西欧、澳大利亚和非洲的语言。

ASCII码又分为: 标准ASCII码和扩展ASCII码。

  • 标准ASCII码
    标准ASCII 码也叫基础ASCII码,使用7 位二进制数来表示所有的大写和小写字母,数字0 到9、标点符号, 以及在美式英语中使用的特殊控制字符。

    • 其中0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

    • 32~126(共95个)是字符(32是空格),其中48~57为0到9十个***数字。
      65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
      同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。

  • 扩展ASCII码

    • 扩展ASCII 字符是从128 到255(0x80-0xff)的字符。许多基于x86的系统都支持使用扩展(或“高”)ASCII。它将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。针对扩展的ASCII码,不同的国家有不同的字符集,所以它并不是国际标准。

4、常用转义字符

转义字符 意义 ASCII码值(十进制)
\a 响铃(BEL)

7

\b 退格(BS)

8

\f 换页(FF)

12

\n 换行(LF)

10

\r 回车(CR)

13

\t 水平制表(HT)

9

\v 垂直制表(VT)

11

\\ 反斜杠

92

\? 问号字符

63

\' 单引号字符

39

\" 双引号字符

34

\0 空字符(NULL)

0

\ddd 任意字符 三位八进制
\xhh 任意字符 二位十六进制

5、ASCII、Unicode 和 UTF-8 之间的关系

5.1 ASCII 编码

计算机内部,所有信息最终都是一个二进制值。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从00000000到11111111。

上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为 ASCII 码,一直沿用至今。

ASCII 码一共规定了128个字符的编码,比如空格SPACE是32(二进制00100000),大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的一位统一规定为0。

5.2 非 ASCII 编码

英语用128个符号编码就够了,但是用来表示其他语言,128个符号是不够的。比如,在法语中,字母上方有注音符号,它就无法用 ASCII 码表示。于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号。比如,法语中的é的编码为130(二进制10000010)。这样一来,这些欧洲国家使用的编码体系,可以表示最多256个符号。

5.3 Unicode

可以想象,如果有一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个具特色的的编码,那么乱码问题就会消失。这就是 Unicode,就像它的名字都表示的,这是一种所有符号的编码。

Unicode 当然是一个很大的***,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示***字母Ain,U+0041表示英语的大写字母A,U+4E25表示汉字严。具体的符号对应表,可以查询unicode.org,或者专门的汉字对应表。

需要注意的是,Unicode 只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。

比如,汉字严的 Unicode 是十六进制数4E25,转换成二进制数足足有15位(100111000100101),也就是说,这个符号的表示至少需要2个字节。表示其他更大的符号,可能需要3个字节或者4个字节,甚至更多。

它们造成的结果是:1)出现了 Unicode 的多种存储方式,也就是说有许多种不同的二进制格式,可以用来表示 Unicode。2)Unicode 在很长一段时间内无法推广,直到互联网的出现。

5.4 UTF-8

互联网的普及,强烈要求出现一种统一的编码方式。UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。其他实现方式还包括 UTF-16(字符用两个字节或四个字节表示)和 UTF-32(字符用四个字节表示),不过在互联网上基本不用。重复一遍,这里的关系是,UTF-8 是 Unicode 的实现方式之一。

UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。

UTF-8 的编码规则很简单,只有二条:

1)对于单字节的符号,字节的靠前位设为0,后面7位为这个符号的 Unicode 码。因此对于英语字母,UTF-8 编码和 ASCII 码是相同的。 2)对于n字节的符号(n > 1),靠前个字节的前n位都设为1,第n + 1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的 Unicode 码。 

下表总结了编码规则,字母x表示可用编码的位:

Unicode符号范围(十六进制) UTF-8编码方式(二进制)
0000 0000-0000 007F 0xxxxxxx
0000 0080-0000 07FF 110xxxxx 10xxxxxx
0000 0800-0000 FFFF 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
跟据上表,解读 UTF-8 编码非常简单。如果一个字节的靠前位是0,则这个字节单独就是一个字符;如果靠前位是1,则连续有多少个1,就表示当前字符占用多少个字节。
1)ANSI是默认的编码方式。对于英文文件是ASCII编码,对于简体中文文件是GB2312编码(只针对 Windows 简体中文版,如果是繁体中文版会采用 Big5 码)。 2)Unicode编码这里指的是notepad.exe使用的 UCS-2 编码方式,即直接用两个字节存入字符的 Unicode 码,这个选项用的 little endian 格式。 3)Unicode big endian编码与上一个选项相对应。我在下一节会解释 little endian 和 big endian 的涵义。 4)UTF-8编码,也就是上一节谈到的编码方法。 

5.5 Little endian 和 Big endian

UCS-2 格式可以存储 Unicode 码(码点不超过0xFFFF)。以汉字严为例,Unicode 码是4E25,需要用两个字节存储,一个字节是4E,另一个字节是25。存储的时候,4E在前,25在后,这就是 Big endian 方式;25在前,4E在后,这是 Little endian 方式。

靠前个字节在前,就是"大头方式"(Big endian),第二个字节在前就是"小头方式"(Little endian)。

那么很自然的,就会出现一个问题:计算机怎么知道某一个文件到底采用哪一种方式编码?

Unicode 规范定义,每一个文件的最前面分别加入一个表示编码顺序的字符,这个字符的名字叫做"零宽度非换行空格"(zero width no-break space),用FEFF表示。这正好是两个字节,而且FF比FE大1。

如果一个文本文件的头两个字节是FE FF,就表示该文件采用大头方式;如果头两个字节是FF FE,就表示该文件采用小头方式。

结语

如果您觉得该方法或代码有一点点用处,可以给作者点个赞,或打赏杯咖啡;╮( ̄▽ ̄)╭
如果您感觉方法或代码不咋地//(ㄒoㄒ)//,就在评论处留言,作者继续改进;o_O???
如果您需要相关功能的代码定制化开发,可以留言私信作者;(◡‿◡)
感谢各位大佬童鞋们的支持!( ´ ▽´ )ノ ( ´ ▽´)っ!!!

  • TAG:e000011

  • 文章版权及转载声明

    本文作者:admin 网址:http://news.edns.com/post/52572.html 发布于 2024-03-25
    文章转载或复制请以超链接形式并注明出处。

    取消
    微信二维码
    微信二维码
    支付宝二维码