(点击上方 如果U0×1,U的UTF-16编码就是U对应的16位无符号整数(为书写简便,下文将16位无符号整数记作WORD)。中文范围4E00-9FBF,所以在UTF-16编码里中文2个字节编码。如果U≥0×1,我们先计算U’=U-0×1,然后将U’写成二进制形式:yyyyyyyyyyxxxxxxxxxx,U的UTF-16编码(二进制)就是:yyyyyyyyyy11xxxxxxxxxx。
UTF-32
UTF-32编码以32位无符号整数为单位。Unicod的UTF-32编码就是其对应的32位无符号整数。
字节序
根据字节序(对字节序不太了解的同学请参考鍖椾含娌荤枟鐧界櫆椋庢渶濂戒笓绉戝尰闄?璐靛窞鐧界櫆椋庢不鐤椾腑蹇?