JScript中使用ADODB.Stream判断文件编码的代码

更新时间：2008年06月09日 12:08:12 作者：

在实现TextStraem的时候，找到判断文件编码的代码是VBS的，但是在JScript中是没有ASC等函数的，也不能对二进制数据进行处理，因此需要通过一个特别的方法来获取文件开关的编码标识。

一开始使用ASCII编码来读取文本数据，模拟读取二进制数据，但是发现如果字符编码大于127时，只会得到小于128的值，相当于和128取余了，因此ASCII编码是不行的。

继续寻找，在CodeProejct.com找到一篇文章《Reading And Writing Binary Files Using JScript》，里面刚好有我需要的内容。

其实说来也简单，就是把编码换一下，使用437，这个是IBM扩展过的ASCII编码，把ASCII编码的最高位也利用起来，将字符集中的字符从128个扩展到256个，而使用这个字符集读取的字符数据就相当于原始二进制数据了。

解决了障碍后，就要开始识别文件的编码了，通过使用ADODB.Stream对象来读取文件的开始两个字节，然后根据这两个字节就可以判断文件编码是什么了。

UTF-8文件如果带BOM的话，那么头两个字节就是0xEF、0xBB，再例如Unicode文件的开始两个字节是0xFF、0xFE，这些就是判断文件编码的依据。

需要注意的是，在ADODB.Stream读取字符时，并不是一一对应的，也就是说，如果二进制数据是0xEF，读取出来的字符经过charCodeAt之后，并不是0xFE，而是另外的值，这个对应表可以在上面提到的文章里查到。

程序代码：

复制代码代码如下:

function CheckEncoding(filename) {  
    var stream = new ActiveXObject("ADODB.Stream");  
    stream.Mode = 3;  
    stream.Type = 2;  
    stream.Open();  
    stream.Charset = "437";  
    stream.LoadFromFile(filename);  
    var bom = escape(stream.ReadText(2));  
    switch(bom) {  
        // 0xEF,0xBB => UTF-8  
        case "%u2229%u2557":  
            encoding = "UTF-8";  
            break;  
        // 0xFF,0xFE => Unicode  
        case "%A0%u25A0":  
        // 0xFE,0xFF => Unicode big endian  
        case "%u25A0%A0":  
            encoding = "Unicode";  
            break;  
        // 判断不出来就使用GBK，这样可以在大多数情况下正确处理中文  
        default:  
            encoding = "GBK";  
            break;  
    }  
    stream.Close();  
    delete stream;  
    stream = null;  
    return encoding;  
} 

这样，在需要的时候，通过调用CheckEncoding函数就可以获取文件的编码了。
希望此文对你有所帮助。

您可能感兴趣的文章:

JS实现超简洁网页title标题跑动闪烁提示效果代码
这篇文章主要介绍了JS实现超简洁网页title标题跑动闪烁提示效果代码,涉及JavaScript结合定时函数动态操作页面元素属性的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-10-10
JavaScript this指向相关原理及实例解析
这篇文章主要介绍了JavaScript this指向相关原理及实例解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-07-07
JavaScript闭包相关知识解析
这篇文章主要介绍了JavaScript闭包相关知识解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-10-10
Selenium执行Javascript脚本参数及返回值过程详解
这篇文章主要介绍了Selenium执行Javascript脚本参数及返回值过程详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-04-04
JavaScript 数组遍历的五种方法
这篇文章主要介绍了JavaScript 数组遍历的五种方法，帮助大家更好的理解和学习使用JavaScript，感兴趣的朋友可以了解下
2021-03-03
js实现随机点名功能
这篇文章主要为大家详细介绍了js实现随机点名功能，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-12-12
Javascript函数式编程简单介绍
什么是函数式编程？根据百度百科的描述，“函数式编程是种编程典范，它将电脑运算视为函数的计算。函数编程语言最重要的基础是 λ 演算（lambda calculus）。而且λ演算的函数可以接受函数当作输入（参数）和输出（返回值）。”
2015-10-10
js常用方法、检查是否有特殊字符串、倒序截取字符串操作完整示例
这篇文章主要介绍了js常用方法、检查是否有特殊字符串、倒序截取字符串操作,结合完整实例形式分析了JavaScript字符串转换、检测、倒序、截取等相关操作技巧,需要的朋友可以参考下
2020-01-01
通用的javascript　换行色换列色的小js
通用的javascript　换行色换列色的小js...
2007-04-04
详解js的事件代理（委托）
JavaScript事件代理（委托）一般用于以下情况：1. 事件注册在祖先级元素上，代理其子级元素。可以减少事件注册数量，节约内存开销，提高性能。2. 对js动态添加的子元素可自动绑定事件。本文主要介绍用原生 js 实现该功能。下面跟着小编一起来看下吧
2016-12-12