当国际化遇上大小写转化(Java),可能需要知道的这个坑。
发现问题
在PUBG内嵌社群用户可以发布想法结交好友。最近线上监控到视频上传失败率过高,引起了我们的注意,随即联系了云团队。
定位原因
云后台给到最近一天的视频上传日志,排除网络问题、用户手动取消等可预见问题外,发现一个异常日志最近24h报了将近300条,且集中在土耳其和阿塞拜疆地区。在本地切换系统语言为土耳其,发布视频后也确实会有异常提示"发送失败,原因:视频上传失败"。
日志提示有无法识别的参数,正是
q-url-param-list=uploadıd
中的ı
字符应该是i
字符,因此无法识别出正确的上传id信息导致上传失败。
CosXmlClientException:com.tencent.qcloud.core.common.QCloudClientException: java.lang.IllegalArgumentException: Unexpected char 0x131 at 205 in Authorization value:...q-url-param-list=uploadıd...
那这个字符又是如何产生的?这一串参数信息是在云客户端拼接的,q-url-param-list
对应的值会经过toLowerCase()
转成小写。
authorization.append("q-url-param-list").append("=").append(sourceProvider.getRealParameterList().toLowerCase().append("&");
再看toLowerCase()
的实现,传入的语言是Locale.getDefault()
,也就是使用当前系统语言。
而在土耳其、阿塞拜疆、立陶宛,İ(\u0130,土耳其语大写i)对应的小写字符为i(\u0069,英语小写i),I(\u0049,英语大写i)对应的小写字符为ı(\u0131,土耳其语小写i)。所以当系统是土耳其语时候,转
UPLOADID
就转出了'ı'字符。参考: İ-维基百科解决办法
其实在toLowerCase()
注释里官方已经给出了解决办法,使用toLowerCase(Locale.ROOT)
这个方法转换就好了。区别在于传入的Locale不同,Locale.ROOT是空串对象,区域不敏感,如此一来就不会当做特殊地区语言去处理了。
下面演示了系统语言为土耳其情况下不同接口转化
UPLOADID
的结果:同样的,将小写
i
转大写也有类似问题:改完之后视频也可以上传成功了!
另外提一句,在Dart(Futter)中大小写转化本身就是语言无关的。
总结
对于海外产品,尤其涉及到土耳其、阿塞拜疆、立陶宛区域的,需要注意在大小写转化时 ,有无可能对i
字符进行转化(包括 大写i
转小写、 小写i
转大写)?转化结果是否不仅用作展示,还有其他用途,比如字符串比较?比如像下面这种转小写且比较对象包含了i
字符,就要考虑加Locale.ROOT
了。