源码网商城,靠谱的源码在线交易网站 我的订单 购物车 帮助

源码网商城

用javascript实现gb2312转utf-8的脚本

  • 时间:2022-07-25 07:28 编辑: 来源: 阅读:
  • 扫一扫,手机访问
摘要:用javascript实现gb2312转utf-8的脚本
信息交换用汉字编码字符集-基本集 汉字标准交换码共分两级。第一级为常用字,有3755字,按汉语拼音字母顺序排列,第二级为次常用字,有3008字,按部首排列。GB2312的编码范围为2121H-777EH. UNICODE 是两字节的全编码,对于ASCII字符它也使用两字节表示。代码页是通过高字节的取值范围来确定是ASCII字符,还是汉字的高字节。如果发生数据损坏, 某处内容破坏,则会引起其后汉字的混乱。UNICODE则一律使用两个字节表示一个字符,最明显的好处是它简化了汉字的处理过程。 关于编码的文章可以参考: http://blog.iyi.cn/tech/2005/10/unicode_2.html http://blog.iyi.cn/tech/2005/10/unicode.html 百度的页面是gb2312的,URL编码自然也是从gb转换而来,比如“一”这个字,百度转换的结果是D2%BB,而从Utf-8转换来的结果是%E4%B8%80比如google(gb是2字节编码,utf-8是3字节变长编码) 可以用javascript的encodeURI和decodeURI来得到这些结果,设置页面编码就可以看到不同结果了。 在网上找,也没找到现成的转换程序,只得自己写。还好网上不缺gb-utf的对照表,修改了一下就可以用了:gb-utf.txt 这个对照表是将gb字节编码转到utf的16进制编码,而不是字节编码。 javascript中escape和unescape是转换16进制编码用的,因此gb汉字到utf汉字的转换思路是:encodeURI("gb汉字"),到对照表中查找utf的16进制编码,unescape("16进制utf编码"),得到utf汉字。 中间那一步最关键,我的转换只用到了这一步,其他两步直接调用那两个函数就可以了。下面是转换程序:   
[url=http://www.1sucai.cn/article/23421.htm]如需引入外部Js需刷新才能执行[/url]]
  • 全部评论(0)
联系客服
客服电话:
400-000-3129
微信版

扫一扫进微信版
返回顶部