python3对文件编码的转换处理

前言：

数据来源有高斯和ORACLE, 数据文件保存格式有UTF-8和GBK。

当我在做测试导入的时候发现SQLSERVER 2008数据库的WITH选项不支持CODEPAGE=‘65001’, 即UTF-8文件编码格式导入。所以需要把UTF-8编码的文件统一转换成GBK，代码如下。

示例一：

在转换生产数据的时候还算好用，但有些字符还是无法很好的识别，导致转换失败。在网上又看到了一个专门用来编码转换的包:codecs, 用法大同小异

示例二：

通过 Unicode 编码来进行不同编码之间的相互转化

1、不同的编码之间不能互相识别，不能相互转化，会报错或出现乱码

2、国际通用标准：文字通过网络传输、或硬盘存储等不能使用 Unicode 编码方式，因为 Unicode 使用的是升级版 32 位的，太费流量和空间

3、在 Python3 版本中，唯独 string 在内存中的编码方式是 Unicode，所以字符串不能直接进行网络传输及进行文件的存储

4、bytes：也是一种数据类型，不是字节，与 string 类型就像是孪生兄弟

5、为啥要有 bytes ？—— bytes 内部编码不是 Unicode 方式，因此可以进行网络传输和文件的存储

6、不同编码之间相互转化都需要先变成unicode编码, encode编码， decode解码

示例：

在python3版本中, 字符串的编码方式就是Unicode，所以中国==u"中国"

各系统的默认编码方式

WINDOWS: GBK

LINUX: UTF-8

IOS: UTF-8

示例：

如果encoding不对，打开内容是乱码

python3对文件编码的转换处理

乌情报总局局长：俄S-500防空系统部件运抵克里米亚

欧洲杯被中文广告包围？破案了：均为虚拟广告牌，与现场不一样！

朱婷腰部不适缺席比赛，中国女排3比2逆转土耳其豪取三连胜

新华社消息｜中国代表呼吁国际社会倡导文明对话

运营已有22年，上海这座高架桥进入全面大修施工

奔驰车主持棍打女骑手后续：真实身份及朋友圈曝光，竟是个假富豪

记者辟谣三元里成空城，村民表示适应，商户生意也没受太大影响

31岁河南禹州市医保局局长任小龙，拟遴选进入省政府办公厅

英媒奉劝美国：与其把精力放在压制中国科学上，不如放在推动自己进步上

全额奖学金邀请姜萍？香港中文大学回应：消息不实

上海7条搜救犬领养公告网友：这不得抢疯了

“辛追夫人”数字人疑似复原专家自己，该如何解开观众的疑问

美国将向乌克兰提供超15亿美元援助涉及能源行业

罗琼（女）出任湖南省总工会党组书记、副主席

学生吐槽上课吹空调需扫码付费：一节课24块钱

人民日报：忙起来，就没那么多迷茫了，只要不懈怠，日子就有奔头

国家卫健委：中国超三成3岁以下婴幼儿家庭有入托需求

重庆体彩·欧洲杯战报 | 杜亚首秀就建功瑞士3:1战胜匈牙利

游客因购物太少被导游骂“不要脸”？成都文旅：正在核查

30人“倒挂”高空近半小时美一游乐园上演惊险一幕

python3对文件编码的转换处理

乌情报总局局长：俄S-500防空系统部件运抵克里米亚

欧洲杯被中文广告包围？破案了：均为虚拟广告牌，与现场不一样！

朱婷腰部不适缺席比赛，中国女排3比2逆转土耳其豪取三连胜

新华社消息｜中国代表呼吁国际社会倡导文明对话

运营已有22年，上海这座高架桥进入全面大修施工

奔驰车主持棍打女骑手后续：真实身份及朋友圈曝光，竟是个假富豪

记者辟谣三元里成空城，村民表示适应，商户生意也没受太大影响

31岁河南禹州市医保局局长任小龙，拟遴选进入省政府办公厅

英媒奉劝美国：与其把精力放在压制中国科学上，不如放在推动自己进步上

全额奖学金邀请姜萍？香港中文大学回应：消息不实

上海7条搜救犬领养公告 网友：这不得抢疯了

“辛追夫人”数字人疑似复原专家自己，该如何解开观众的疑问

美国将向乌克兰提供超15亿美元援助 涉及能源行业

罗琼（女）出任湖南省总工会党组书记、副主席

学生吐槽上课吹空调需扫码付费：一节课24块钱

人民日报：忙起来，就没那么多迷茫了，只要不懈怠，日子就有奔头

国家卫健委：中国超三成3岁以下婴幼儿家庭有入托需求

重庆体彩·欧洲杯战报 | 杜亚首秀就建功 瑞士3:1战胜匈牙利

游客因购物太少被导游骂“不要脸”？成都文旅：正在核查

30人“倒挂”高空近半小时 美一游乐园上演惊险一幕

上海7条搜救犬领养公告网友：这不得抢疯了

美国将向乌克兰提供超15亿美元援助涉及能源行业

重庆体彩·欧洲杯战报 | 杜亚首秀就建功瑞士3:1战胜匈牙利

30人“倒挂”高空近半小时美一游乐园上演惊险一幕