遇到一坑,以前用的是Gson库,现在改为Android自带的JSON解析,后端收到数据有时会解析失败,查找原因,发现Gson库和Android自带JSON解析对转义字符的处理存在稍许的不同。
举例如下:
String s1 = "https://blog.csdn.net/robotech_er/article/details/40260377";
String s2 = "host is \"www.baidu.com\"!";
// Android自带JSON解析
JSONArray ja = new JSONArray();
ja.put(s1);
ja.put(s2);
Log.d("json", ja.toString());
// Gson库
JsonArray array = new JsonArray();
array.add(new JsonPrimitive(s1));
array.add(new JsonPrimitive(s2));
Log.d("gson", array.toString());
输出为:
D/json: ["https:\/\/blog.csdn.net\/robotech_er\/article\/details\/40260377","host is \"www.baidu.com\"!"]
D/gson: ["https://blog.csdn.net/robotech_er/article/details/40260377","host is \"www.baidu.com\"!"]
可发现:
(1)Gson库和Android自带JSON解析都对引号(")进行了转义,转为了"。
(2)Android自带JSON解析对“/”进行了转义,转为了“/”,但是Gson库没这么做。
猜测:Gson只对影响json格式的符号进行了转义,比如引号,但是没转义不影响json格式的符号,比如“/”。
查看代码验证==>>
Gson库源码地址:https://github.com/google/gson
Gson库对String的转义在gson/src/main/java/com/google/gson/stream/JsonWriter.java中
static {
REPLACEMENT_CHARS = new String[128];
for (int i = 0; i <= 0x1f; i++) {
REPLACEMENT_CHARS[i] = String.format("\\u%04x", (int) i);
}
REPLACEMENT_CHARS['"'] = "\\\"";
REPLACEMENT_CHARS['\\'] = "\\\\";
REPLACEMENT_CHARS['\t'] = "\\t";
REPLACEMENT_CHARS['\b'] = "\\b";
REPLACEMENT_CHARS['\n'] = "\\n";
REPLACEMENT_CHARS['\r'] = "\\r";
REPLACEMENT_CHARS['\f'] = "\\f";
HTML_SAFE_REPLACEMENT_CHARS = REPLACEMENT_CHARS.clone();
HTML_SAFE_REPLACEMENT_CHARS['<'] = "\\u003c";
HTML_SAFE_REPLACEMENT_CHARS['>'] = "\\u003e";
HTML_SAFE_REPLACEMENT_CHARS['&'] = "\\u0026";
HTML_SAFE_REPLACEMENT_CHARS['='] = "\\u003d";
HTML_SAFE_REPLACEMENT_CHARS['\''] = "\\u0027";
}
Android自带的JSON解析对String的转义实现在org/json/JSONStringer
private void string(String value) {
out.append("\"");
for (int i = 0, length = value.length(); i < length; i++) {
char c = value.charAt(i);
switch (c) {
case '"':
case '\\':
case '/': // Gson库少了对这个的转义~~~
out.append('\\').append(c);
break;
case '\t':
out.append("\\t");
break;
case '\b':
out.append("\\b");
break;
case '\n':
out.append("\\n");
break;
case '\r':
out.append("\\r");
break;
case '\f':
out.append("\\f");
break;
default:
if (c <= 0x1F) {
out.append(String.format("\\u%04x", (int) c));
} else {
out.append(c);
}
break;
}
}
out.append("\"");
}
对比一下可以发现,Gson库对HTML有几个特殊处理,不太懂HTML所以先忽略,
除此之外,Android自带的JSON解析就比Gson库多了对"/"的转义处理!!
那么官方是怎么规定这个转义的呢,
http://www.json.org上有张图片很容易说明
可以看到,里面是有对“/”转义的
在看下RFC文档:
可以看到,里面也是有对“/”转义的说明的。可能是Google认为无需对这个“/”进行转义吧,因为对于json格式来说,没什么影响。