版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。
经常上网的人有时候会发现出来的网页,上面的字居然不认识,这就是所谓的”乱码“。
这是因为浏览器不能识别网页原有的文字编码方式,而使用了不同的文字编码方式造成的。
例如在百度首页的编码是用的Utf-8:
在网页上点击鼠标右键查看编码一项,可以看出,浏览器自动选择了”UTF-8“:
如果强制转为GB2312,那么就会产生乱码:
同样的,打开文本文件时,需要指定编码方式,这样才能获得正确的文字。
计算机最开始只有ASCII编码,包含了字母、数字、一些标点符号和特殊符号。
但是随着计算机广泛运用,ASCII越来越不能满足计算机发展需要。
于是相继产生了Unicode、中文的GB2312、繁体中文Big5、日语shift_jis等等。
不同的编码获得的内容不同。
.net中直接提供了
Encoding.ASCII
Encoding.Unicode
Encoding.UTF32
Encoding.UTF7
Encoding.UTF8
可以使用,
如果要使用其他编码,可以使用如下方式,例如使用GB2312编码:
Dim enc As Encoding
enc = Encoding.GetEncoding("gb2312")
.net还提供了
Encoding.Default
这也是后面几节代码中主要用到的,虽然.net不提倡用:
我这里使用主要是为了简化。实际文本编码的时候最好请使用Unicode编码。
关于更多编码的详细内容请参看 System.Text.Encoding一章 或 自行在网上搜索相关内容。
下一节,我将用一个简单的例子说明。
学习更多vb.net知识,请参看 vb.net教程 目录
————————————————
版权声明:本文为CSDN博主「VB.Net」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。