文本转Unicode
Unicode转文本
Unicode编码结果:
文本结果:
Unicode编码说明
Unicode是一种字符编码标准,旨在支持世界上所有书写系统的字符。它为每个字符分配一个唯一的数字,无论平台、程序或语言如何。
Unicode编码格式
- UTF-8: 可变长度编码,兼容ASCII,是Web上最常用的编码
- UTF-16: 可变长度编码,使用16位代码单元
- UTF-32: 固定长度编码,每个字符使用32位
- 十六进制表示: U+XXXX格式,其中XXXX是十六进制数字
- 十进制表示: 直接使用Unicode代码点的十进制值
常见Unicode表示方法
格式 | 示例 | 说明 |
---|---|---|
U+ notation | U+4E2D | 标准Unicode表示法 |
JavaScript escape | u4E2D | JavaScript中的Unicode转义序列 |
HTML entity | 中 | HTML中的十六进制实体 |
HTML entity (dec) | 中 | HTML中的十进制实体 |
Python escape | u4E2D | Python中的Unicode转义序列 |
使用示例
文本转Unicode:
输入: "Hello, 世界!"
输出: U+0048 U+0065 U+006C U+006C U+006F U+002C U+0020 U+4E16 U+754C U+0021
Unicode转文本:
输入: "U+0048 U+0065 U+006C U+006C U+006F U+002C U+0020 U+4E16 U+754C U+0021"
输出: "Hello, 世界!"