详情介绍
小西编码一键转换是一款十分不错的编码一键转换工具,软件支持将汉字、GBK、UTF-8、Unicode等常见字符互相转换,该软件是由吾爱网友开发,本站提供的是该软件的绿色版本,需要的朋友不妨前来本站下载使用。
软件功能
1、对汉字、GBK、UTF-8、Unicode等编码的文件自动识别并按要求互相转换
2、对DOS格式、UNIX格式、MAC格式的文本自动识别并互相转换
3、对中文简繁体及台湾BIG5编码互相转换(需要指定源、目的编码格式)
4、支持文件及文件夹操作,支持鼠标拖拽
5、完全绿色软件,直接使用不需安装
常见字符集编码
1、ASCII
ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x1F和0x7F共33个控制字符。
只支持ASCII码的系统会忽略每个字节的最高位,只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输中文而设计的编码。早期很多邮件系统也只支持ASCII编码,为了传输中文邮件必须使用BASE64或者其他编码方式。
2、GBK
GBK编码是GB2312编码的超集,向下完全兼容GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。同 GB2312一样,GBK也支持希腊字母、日文假名字母、俄语字母等字符,但不支持韩语中的表音字符(非汉字字符)。GBK还收录了GB2312不包含的 汉字部首符号、竖排标点符号等字符。
GBK的整体编码范围是为0x8140-0xFEFE,不包括低字节是0×7F的组合。高字节范围是0×81-0xFE,低字节范围是0x40-7E和0x80-0xFE。
低字节是0x40-0x7E的GBK字符有一定特殊性,因为这些字符占用了ASCII码的位置,这样会给一些系统带来麻烦。
有些系统中用0x40-0x7E中的字符(如“|”)做特殊符号,在定位这些符号时又没有判断这些符号是不是属于某个 GBK字符的低字节,这样就会造成错误判断。在支持GB2312的环境下就不存在这个问题。需要注意的是支持GBK的环境中小于0x80的某个字节未必就 是ASCII符号;另外就是最好选用小于0×40的ASCII符号做一些特殊符号,这样就可以快速定位,且不用担心是某个汉字的另一半。Big5编码中也存在相应问题。
CP936和GBK的有些许差别,绝大多数情况下可以把CP936当作GBK的别名。
3、BIG5
Big5是双字节编码,高字节编码范围是0x81-0xFE,低字节编码范围是0x40-0x7E和0xA1-0xFE。和GBK相比,少了低字节是0x80-0xA0的组合。0x8140-0xA0FE是保留区域,用于用户造字区。
Big5收录的汉字只包括繁体汉字,不包括简体汉字,一些生僻的汉字也没有收录。GBK收录的日文假名字符、俄文字符Big5也没有收录。因为Big5当中收录的字符有限,因此有很多在Big5基础上扩展的编码,如倚天中文系统。Windows系统上使用的代码页CP950也可以理解为是对Big5的扩展,在Big5的基础上增加了7个汉字和一些符号。Big5编码对应的字符集是GBK字符集的子集,也就是说Big5收录的字符是GBK收录字符的一部分,但相同字符的编码不同。
因为Big5也占用了ASCII的编码空间(低字节所使用的0x40-0x7E),所以Big5编码在一些环境下存在和GBK编码相同的问题,即低字节范围为0x40-0x7E的字符有可能会被误处理,尤其是低字节是0x5C("/")和0x7C("|")的字符。可以参考GBK一节相应说明。
尽管有些区别,大多数情况下可以把CP950当作Big5的别名。
4、UTF-8
UTF-8是UCS字符集的另一种编码方式,UTF-16的每个单元是两个字节(16位),而UTF-8的每个单元是一个字节(8位)。UTF-16中用一个或两个双字节表示一个字符,UTF-8中用一个或几个单字节表示一个字符。
可以认为UTF-8编码是根据一定规律从UCS-2转换得到的,从UCS-2到UTF-8之间有以下转换关系:
UCS-2 UTF-8
U+0000 - U+007F 0xxxxxxx
U+0080 - U+07FF 110xxxxx 10xxxxxx
U+0800 - U+FFFF 1110xxxx 10xxxxxx 10xxxxxx
例如“啊”字的UCS-2编码是0x554A,对应的二进制是0101 0101 0100 1010,转成UTF-8编码之后的二进制是1110 0101 10 010101 10 001010,对应的十六进制是0xE5958A。
UCS-4也是一种UCS字符集的编码方式,是使用4个字节的等宽编码,可以用UCS-4来表示BMP之外的辅助面字符。UCS-2中每两个字节前再加上0x0000就得到了BMP字符的UCS-4编码。从UCS-4到UTF-8也存在转换关系,根据这种转换关系,UTF-8最多可以使用六个字节来编码UCS-4。
根据UTF-8的生成规律和UCS字符集的特性,可以看到UTF-8具有的特性:
UTF-8完全和ASCII兼容,也就是说ASCII对应的字符在UTF-8中和ASCII编码完全一致。范围在0x00-0x7F之内的字符一定是ASCII字符,不可能是其他字符的一部分。GBK和Big5都存在的缺陷在UTF-8中是不存在的。
大于U+007F的UCS字符,在UTF-8编码中至少是两个字节。
UTF-8中的每个字符编码的首字节总在0x00-0xFD之间(不考虑UCS-4支持的情况,首字节在0x00-0xEF之间)。根据首字节就可以判断之后连续几个字节。
非首字节的其他字节都在0x80-0xBF之间;0xFE和0xFF在UTF-8中没有被用到。
GBK编码中的汉字字符都在UCS-2中的范围都在U+0800 - U+FFFF之间,所以每个GBK编码中的汉字字符的UTF-8编码都是3个字节。但GBK中包含的其他字符的UTF-8编码就不一定是3个字节了,如GBK中的俄文字符。
在UTF-8的编码的传输过程中即使丢掉一个字节,根据编码规律也很容易定位丢掉的位置,不会影响到其他字符。在其他双字节编码中,一旦损失一个字节,就会影响到此字节之后的所有字符。从这点可以看出UTF-8编码非常适合作为传输编码。
下载地址
人气软件
NTLEA(NT Locale Emulator Advance) v0.92 绿色版(解决游戏或软
print2flash(32&64位版)特别版 V3.5.1 官方特别版 文档转换
GBK与UTF8,big5编码批量转换工具集合(支持子目录)
IPLook QQ IP数据库绿色纯真版 2017.10.5 access(ip双精度)数据
小葵多功能转换工具 编码转换工具 v1.1 中文绿色免费版
迅捷jpg转换成pdf转换器 v6.5 官方安装版
vb转exe工具(Vbs To Exe) v3.0.9 免费绿色汉化版
Word2CHM Word转换CHM 小工具特别版
DATAKIT CrossManager(cad文件格式转换工具) v2024.4 64位 官方
htm2chm(HTML转换CHM文件) V3.0.9.3 免费绿色版
相关文章
-
文字转语音合成工具 VPot v2411 免费无广告单文件版(支持win7-11)
VPot是一款免费无广的文字转语音的工具,内置多语种多声音角色,可将任意文字内容转换为流畅的语音文件,完全调用微软及edge公共API接口,纯CPU处理,适用于譬如短视频配音...
-
易兴VCF通讯录转换器 V1.0.2.11 官方安装版
易兴VCF通讯录转换器是一款专业的VCF格式转换工具,支持批量Excel/CSV转VCF和VCF转Excel/CSV等功能,适合需要批量转换通讯录格式的用户...
-
iw3(AI裸眼3D转换图片视频一键转换为3D) v1.0 免费开源版(支持VR观看)
iw3 是一款强大的工具,能够帮助你将任何普通的2D图片或视频转换成并排的3D效果。只需简单几步操作,你就可以在屏幕上看到立体的画面,非常适合那些希望体验3D效果的用户...
-
AsrTools 智能语音转文字工具 v1.0.0 绿色免费版
AsrTools是一款一款开源免费的智能语音转字幕文本工具,提供剪映、快手和必剪三大接口,欢迎需要的朋友下载使用...
-
CleverPDF(多功能PDF工具) v3.0.0 单文件绿色免费版
CleverPDF 是一款专业的pdf转换器,...
-
MOFA-Video 开源可控制图转视频 v1.0 免费版
MOFA-Video是一款具有突破性的视频控制技术,它允许用户通过简单的箭头指示来控制视频中的运动方向,欢迎需要的朋友下载使用...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的小西编码一键转换 V1.0 绿色免费版资源来源互联网,版权归该下载资源的合法拥有者所有。