①
ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。
②
UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
③
Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。
④
UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。
⑤
UTF-32编码中,世界上任何字符的存储都需要4个字节。
在线编码转换
汉字字符集编码查询
ASCII码:
一个
英文字母
(不分大小写)
占
一个
字节
的空间,
一个
中
文汉字
占
两个
字节
的空间。
一个
二进制数字序列,在计算机
中
作为
一个
数字单元,一般为8位二进制数,换算为十进制。最小值-128,最大值127。如
一个
ASCII码就是
一个
字节
。
UTF-8编码:
一个
英
文字
符等于
一个
字节
,
一个
中
文(含繁体)等于三个
字节
。
中
文标点
占
三个
字节
,英文标点
占
一个
字节
。
Unicode编码:
一个
英文等于两个
字节
,
一个
中
文...
1)、ASII:美国标准信息交换码,用
一个
字节
的7位可以表示;
2)、ISO8859-1:拉丁码表,欧洲码表,用
一个
字节
的8位可以表示;
3)、GBK2312:
中
国的
中
文编码表,最多两个
字节
编码所有字符;
4)、GBK:
中
国的
中
文编码表升级,融合了更多的
中
文
文字
字符,最多两个
字节
编码;
5)、Unicode:国际标准码,融合了目前人类使用的所有字符,为每个字符分配唯一的字符码,所有的
文字
都用两个
字节
来表示;
6)、utf-8:变长的
编码方式
,可用1-4个
字节
来表示
一个
字符。现在最多的又有6个
字节
;
在UTF-8
中
,
英文字母
和数字
占
用
一个
字节
,汉字
占
用三个
字节
,一些特殊的符号可能
占
用更多的
字节
。此外,还有一些其他的编码格式,如UTF-32等,它们对于每个字符都采用固定的四个
字节
来表示,但是在实际应用
中
使用较少。ASCII编码:ASCII编码是一种最早的字符
编码方式
,它只能表示
英文字母
、数字和一些符号,每个字符
占
用
一个
字节
(8位)的空间。5、Unicode:国际标准码,融合了目前人类使用的所有字符,为每个字符分配唯一的字符码,所有的
文字
都用两个
字节
来表示;8、utf-32:
中
文和字母都是
占
4个
字节
。
由于计算机只能处理数字,因此,当需要用计算机来处理字符(以及字符串)的时候,就要有一种机制来实现字符到数字的转换,这便是字符串的编码。
最开始的时候,计算机只有英
文字
符,故需要编码的符号比较少。此时用的编码为ASCII编码,其
中
包括大小写
英文字母
、数字以及一些符号
此时实现这些字符的编码,只需要
一个
字节
就够了(即8位)。但是对于
中
文来说,需要对汉字进行编码时,
一个
字节
是远远不够的。考虑到不能和当时已有的ASCII编码冲突,
中
文最初制定了GB2312编码。其
中
包括6763个汉字和682个其它符号。95年重新修
1. ASCII码:上个世纪60年代,美国制定了一套字符编码(使用
一个
字),对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,只
占
用了
一个
字节
的后面七位,最前面的1位统一规定为0。特别提示:
一个
字节
可以表示256个字符,ASCII码只用了128个字符2.看
一个
完整的ASCII码表(可以自行百度)3.缺点:不能表示所有字符。1.Unicode的好处:一种编码,将世界上所有的符号都纳入其
中
。
UTF-8编码下
一个
汉字(包括
中
文形式下的符号)一般是3个
字节
,
一个
英文(包括英文下的符号)1个
字节
,
一个
数字1个
字节
;
在GBK和GB2312编码下
一个
汉字(包括
中
文形式下的符号)是2个
字节
,
一个
英文(包括英文下的符号)1个
字节
,
一个
数字1个
字节
;
Unicode编码
一个
汉字(包括
中
文形式下的符号)和
一个
英文(包括英文下的符号)
一个
数字都是4个
字节
;
ASCII编码
一个
英文(包括英文下的符...
(2)、
中
文
占
一个
字符,也就是两个
字节
(3)、字符 不等于
字节
。
字符(char)是 Java
中
的一种基本数据类型,由 2 个
字节
组成,范围从 0 开始,到 2^16-1。
字节
是一种数据量的单位,
一个
字节
等于 8 位。所有的数据所
占
空间都可以用
字节数
来衡量。例如
一个
字符
占
2 个
字节
,
一个
int
占
4 个
字节
,
一个
double
占
8 个
字节
等等。
1字符=2
字节
;
1Byte=8bit
b:位;B:
字节
1kb=10
ASCII方式:
一个
英文字母
占
一个
字节
,不能保存汉字;UTF8方式:
一个
英文字母
占
一个
字节
,
一个
汉字
占
三个
字节
;
unicode方式:
一个
英文字母
和
一个
汉字都
占
两个
字节
。基于TCP的Socket服务端:1、客户端以UTF8编码发送数据,假如发送的数据是汉字的情况下
服务端进行接收的时候,接收的缓冲区的长度必须至少大于等于3个
字节
。 byte[] buffer = new b...
String str="我交电话费看到接口过节费苦尽甘来开发接口了感觉风口浪尖赶快来将佳都科技疯狂夺金看附件";
System.out.println(str.getBytes("...
3.伟大的创想Unicode
——不得不单独说Unicode
像天朝一样,当计算机传到世界各个国家时,为了适合当地语言和字符,设计和实现类似GB232/GBK/GB18030/BIG5的编码方案。这样各搞一套,在本地使用没有问题,一旦出现在网络
中
,由于不兼容,互相访问就出现了乱码现象。
为了解决这个问题,
一个
伟大的创想产生了——Unicode。Unicode编码...
http://wanxw2001.iteye.com/blog/1570339
1、InputStreamReader 是
字节
流通向字符流的桥梁:它使用指定的 charset 读取
字节
并将其解码为字符
InputStreamReader(InputStream in, String charsetName)
2、Outpu