在线字符集编码转换工具 - UTF-8/GBK/Big5互转

说明文档

关于字符集转换工具

该工具用于不同字符编码之间的文本与文件转换，支持自动识别、BOM 处理及多种输入输出格式。

核心功能

多编码互转：支持 UTF 系列、GB 系列、BIG5、Shift-JIS、EUC-KR、ISO/Windows 编码等。
自动检测：可自动识别源编码并给出检测结果。
BOM 选项：支持添加或移除 BOM。
格式转换：支持文本、Base64、Hex、空格 Hex、C 风格 Hex 等输入输出。
文本/文件双模式：既可处理文本，也可处理文件内容。

使用说明

选择文本或文件模式。
设定源编码与目标编码（或源编码自动检测）。
配置输入/输出格式与 BOM 选项。
输入内容并执行转换。
查看输出与字节统计，必要时复制或下载结果。

适用场景

老系统迁移中的编码统一。
多语言数据导入导出前的编码整理。
乱码排查与字节级诊断。

支持的编码参考

Unicode 编码

编码	说明	字节范围	规范文档
UTF-8	可变长度 Unicode 编码，Web 上最广泛使用，向后兼容 ASCII。	1-4 bytes	RFC 3629
UTF-16 LE	UTF-16 小端序，Windows 常用。	2/4 bytes	RFC 2781
UTF-16 BE	UTF-16 大端序，常见于部分协议与 Java 场景。	2/4 bytes	RFC 2781

中文编码

编码	说明	使用场景	规范文档
GBK	GB2312 扩展，支持更多简繁汉字。	简体中文 Windows、旧网站	IANA GBK
GB2312	早期简体中文国家标准。	旧系统、邮件	GB 2312-1980
GB18030	中国现行重要字符集标准，覆盖全部 Unicode 字符。	现代中文系统、政府文档	GB 18030-2005
Big5	繁体中文编码。	台湾、香港网站	IANA Charset

日文编码

编码	说明	使用场景	规范文档
Shift_JIS	微软常用日文编码。	Windows、旧网站、游戏	IANA Charset
EUC-JP	日文扩展 Unix 编码。	Unix/Linux 系统、旧网站	IANA Charset
ISO-2022-JP	使用转义序列的 7 位日文编码。	日文邮件、旧系统	RFC 1468

韩文编码

编码	说明	使用场景	规范文档
EUC-KR	基于 KS X 1001 的韩文扩展 Unix 编码。	韩文网站、旧系统	RFC 1557

西欧编码

编码	说明	适用语言	规范文档
ISO-8859-1	Latin-1，覆盖常见西欧字符。	英语、法语、德语、西班牙语、葡萄牙语、意大利语	ISO/IEC 8859-1
ISO-8859-15	Latin-9，补充欧元符号和部分西欧字符。	带欧元符号的西欧语言	ISO/IEC 8859-15
Windows-1252	微软对 Latin-1 的扩展。	Windows 上的西欧语言	Unicode.org

西里尔文编码

编码	说明	适用语言	规范文档
Windows-1251	微软西里尔文编码。	俄语、乌克兰语、保加利亚语、塞尔维亚语	Unicode.org
KOI8-R	面向俄语的经典 8 位编码。	俄语	RFC 1489
ISO-8859-5	ISO 标准西里尔文编码。	俄语、保加利亚语、马其顿语、塞尔维亚语	ISO/IEC 8859-5

其他编码

编码	说明	使用场景	规范文档
ASCII	现代编码体系基础的 7 位编码。	基础英文文本、编程	RFC 20
Macintosh	旧版 Mac OS Classic 的 Mac Roman 编码。	旧版 Mac 文件、旧 Mac 应用程序	Unicode.org

常见问题

为什么会乱码？

通常是源编码判断错误或输入格式不一致，建议先用“自动检测”并核对原始文件来源。

何时需要 BOM？

部分编辑器或平台依赖 BOM 识别 UTF 编码，是否添加取决于目标系统要求。