vb.net 教程 4-7 文本文件编码 1- VB

经常上网的人有时候会发现出来的网页，上面的字居然不认识，这就是所谓的”乱码“。

这是因为浏览器不能识别网页原有的文字编码方式，而使用了不同的文字编码方式造成的。

例如在百度首页的编码是用的Utf-8:

在网页上点击鼠标右键查看编码一项，可以看出，浏览器自动选择了”UTF-8“：

如果强制转为GB2312，那么就会产生乱码：

同样的，打开文本文件时，需要指定编码方式，这样才能获得正确的文字。

计算机最开始只有ASCII编码，包含了字母、数字、一些标点符号和特殊符号。

但是随着计算机广泛运用，ASCII越来越不能满足计算机发展需要。

于是相继产生了Unicode、中文的GB2312、繁体中文Big5、日语shift_jis等等。

不同的编码获得的内容不同。

.net中直接提供了

Encoding.ASCII
Encoding.Unicode
Encoding.UTF32
Encoding.UTF7
Encoding.UTF8

可以使用，

如果要使用其他编码，可以使用如下方式，例如使用GB2312编码：

Dim enc As Encoding
enc = Encoding.GetEncoding("gb2312")
.net还提供了

Encoding.Default

这也是后面几节代码中主要用到的，虽然.net不提倡用：

我这里使用主要是为了简化。实际文本编码的时候最好请使用Unicode编码。

关于更多编码的详细内容请参看 System.Text.Encoding一章或自行在网上搜索相关内容。

下一节，我将用一个简单的例子说明。

学习更多vb.net知识，请参看 vb.net教程目录

————————————————
版权声明：本文为CSDN博主「VB.Net」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。

vb.net 教程 4-7 文本文件编码 1