gb2312转换为utf8代码 如何区分给定的字符串是UTF8还是GB2312?
如何区分给定的字符串是UTF8还是GB2312?例如,utf8的两个字符:e5a6a4e5a6a9对应于GB2312的三个字符:e5a6a4e5a6a9。虽然对应的汉字不同,但都是有效汉字。所以严格地
如何区分给定的字符串是UTF8还是GB2312?
例如,utf8的两个字符:e5a6a4e5a6a9对应于GB2312的三个字符:e5a6a4e5a6a9。虽然对应的汉字不同,但都是有效汉字。所以严格地说,是不可能判断的。但是,从utf8编码规则来看,有几种固定的字符串组合:110xxxxx、10xxxxxx、10xxxxxxxx1110xxxxx、10xxxxxx、10xxxxxx、10xxxxxx、10xxxxxx、10xxxxxx等,如果满足这个条件,可以说“utf8进行字符串编码的可能性非常大”。