1 历史层面:先有万国码,后有“大一统”
2 技术层面:多一套码位=多一次转换地狱
3 生态层面:语言运行时、库、协议倒逼
法律/商业层面:标准组织强推
任何想继续维护第二套码位的系统,都会面临“没人用、没人维护、到处转码”的死亡循环,于是自然淘汰。
当然运行时高级语言的“字符串对象”存在内存中都是字节,而非字符,运行时内部按某种编码(UTF-8/UTF-16/UTF-32)排布好的字节块,并且对象头里自带“这就是 Unicode”的语义标签,已经不是“一串字节”
序列化阶段先把“字符串对象”里的字节块解码成逻辑码位,
\u4f60
或原样字符)。