我们常常会遇到别人在Windows下编辑生成的文本文件。按照Windows的传统,文件采用的默认字符集是GBK。尽管Windows下很多程序(如记事本)本身还是支持UTF8编码的,不过用户们大多不会留意这个问题。当我们在Linux中要打开这些文件的时候就比较郁闷了。遇到好点的编辑器,能够自动识别编码,也就无所谓了。稍微差一点的,能够手动调整编码,还勉强可以。再次一些的,如果不能识别,就崩溃了。

另外,在WEB中的HTML文件编码,也常常遇到这样的情况。

所以,就有了转换编码的需求了。参考肖建彬的博客中到一篇文章,我撰写了如下脚本:

用法很简单,执行脚本,第一个参数是要转换的目录,第二个参数是保存的目录。