byte转换字节_百度百科

夜夜南宁  4月前
0

  声明:百科词条人人可编纂,词条建立和点窜均免费,毫不具有官方及代办署理商付费代编,请勿被骗被骗。详情

  字节(Byte )是用于计量存储容量的一种计量单元,作为一个单元来处置的一个二进制数字串,是形成消息的一个小单元。最常用的字节是八位的字节,即它蕴含八位的二进制数。

  字节是二进制数据的单元。一个字节凡是8位长。可是,一些老型号计较机布局利用分歧的长度。为了避免紊乱,在大大都国际文献中,利用词取代byte。在大都的计较机体系中,一个字节是一个8位长的数据单元,大大都的计较机用一个字节暗示一个字符、数字或其他字符。一个字节也能够暗示一系列二进制位。在一些计较机体系中,4 个字节代表一个字,这是计较机在施行指令时可以或许无效处置数据的单元。一些言语形容必要2个字节暗示一个字符,这叫做双字节字符集。一些处置器可以或许处置双字节或单字节指令。字节凡是简写为“B”,而位凡是简写为小写“b”,计较机存储器的巨细凡是用字节来暗示

  :一个英文字母(不分巨细写)占一个字节的空间。一个二进制数字序列,在计较机中作为一个数字单位,正常为8位二进制数。换算为十进制,最小值-256,最大值255。如一个ASCII码就是一个字节。

  :一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节

  1GB(Gigabyte,吉字节,十亿字节,又称“千兆”)=1024MB= 2^30 B;

  1GiB(Gibibyte,吉字节,十亿字节,又称“千兆字节”)=1024MB= 2^30 B;

  任何数据类型的数组都必要 20 个字节的内存空间,加上每一数组维数占 4 个字节,再加上数据自身所占用的空间。数据所占用的内存空间能够用数据元数目乘上每个元素的巨细加以计较。比方,以 4 个 2字节之 Integer 数据元所构成的一维数组中的数据,占 8 个字节。这 8 个字节加上分外的 24 个字节,使得这个数组所需总内存空间为 32 个字节。蕴含一数组的 Variant 比零丁的一个数组必要多 12 个字节。

  数据存储是以“字节”(Byte)为单元,数据传输大多是以“位”(bit,别名“比特”)为单元,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)构成一个字节(Byte,简写为B),是最小一级的消息单元。

  硬盘出产商是以GB(十进制,即10的3次方=1000,如1MB=1000KB)计较的,而电脑(操作体系)是以GiB(2进制,即2的10次方, 如1MiB=1024KiB)计较的,可是国内用户正常理解为1MiB=1M=1024 KB, 所认为了便于中文化的理解,翻译MiB为MB也是能够的。

  同样按照硬盘厂商与用户对付1MB巨细的分歧理解,所以很多多少160G的硬盘现实容量按计较机现实的1MiB=1024KB算都不到160G,这也能够注释为什么新买的硬盘“缺斤短两”并没有它所标示的那么大。

  Byte数据类型(字节型)用一个字节(Byte)贮存,可区别256个数字,取值范畴:0到255。 Byte是从0-255的无符号类型,所以不克不及暗示正数。

  在VC++中,byte型数据的界说蕴含在windows.h头文件中,挪用byte必要增添代码#include windows.h

  在计较机中,一串数码作为一个全体来处置或运算的,称为一个计较机字,简称字。字凡是分为若干个字节(每个字节正常是8位)。在存储器中,凡是每个单位存储一个字,因而每个字都是能够寻址的。字的长度用位数来暗示。

  在计较机运算器节制器中,凡是都是以字为单元进行传递的。字在分歧的地点呈现其寄义是不不异。比方,送往节制器去的字是指令,而送往运算器去的字就是一个数。

  计较机的每个字所蕴含的位数称为字长。按照计较机的分歧,字长有固定的和可变的两种。固定字长,即字长度非论什么环境都是固定稳定的;可变字长,则在必然范畴内,其长度是可变的。

  正常地,大型计较机的字长为32-64位小型计较机为12-32位,而微型计较机为4-16位。字长是权衡计较机机能的一个主要要素。

  比方,在C++的数据类型暗示中,凡是char为1个字节,int为4个字节,double为8个字节。

  理解编码的环节,是要把字符的观点和字节的观点理解精确。这两个观点容易混合,咱们在此做一下区分:

  字节计较机中存储数据的单位,一个8位的二进制数,是一个很具体的存储空间。0x01, 0x45, 0xFA……

  在内存中,若是“字符”是以ANSI编码情势具有的,一个字符可能利用一个字节或多个字节来暗示,那么咱们称这种字符串为ANSI字符串或者多字节字符串。如,中文123 (占8字节,包罗一个躲藏的\0)。

  对付ANSI编码体例,具有分歧的字符集(Charset)。同样的字节序列,在分歧的字符集下暗示的字符纷歧样。要准确解析一个ANSI字符串,还要取舍准确的字符集,不然就可能导致所谓的乱码征象。分歧言语版本的操作体系,都有一个默认的字符集。在不指定字符集的环境下,体系会利用此字符集来解析ANSI字符串。也就是说,若是咱们在简体中文版的Windows下翻开了一个由日文操作体系保留的ANSI文本文件(仅蕴含ANSI字符串的文本文件),咱们看到的将是乱码。可是,若是咱们利用Visual Studio之类的带编码取舍的文本编纂器翻开此文件,而且取舍准确的字符集,咱们将能够看到它的原貌。留意:简体中文字符集中的繁体字和繁体中文字符集中的繁体字,编码不必然不异。

  每个字符集都有一个确定的编号,称为代码页(Code Page)。简体中文(GB2312)的代码页为936,而体系默认字符集的代码页为0,它暗示按照体系的言语设置来取舍一个符合的字符集。

  字符串在内存中,若是“字符”是以在Unicode中的序号具有的,那么咱们称这种字符串为Unicode字符串或者宽字节字符串。在Unicode中,每个字符都占两个字节。如,中文123(占10字节)。Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。

  因为分歧ANSI编码所划定的尺度是不不异的(字符集分歧),因而,对付一个给定的多字节字符串,咱们必需晓得它采用的是哪一种字符集则,才可以或许晓得它蕴含了哪些“字符”。而对付Unicode字符串来说,不管在什么情况下,它所代表的“字符”内容老是稳定的。Unicode 有着同一的尺度,它界说了世界上绝大大都的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文等都能以统一种编码体例保留。

回复 0  
游客  现在