关键词: 西班牙语字符串转NSString字符串 HTML标签语言转OC的NSString NSAttributedString NSMutableAttributedString
背景:最近做的APP有海外用户,还是西班牙语(以下称西语)地区的。所以一些请求接口的提示文案,或者阐述说明文案服务器就返回了西语字符串。再加之后台偷懒,甚至直接把网页版的阐述文案直接丢了过来,所以这个字符串还带有HTML的标签,我们在APP中展示时则要把其转为NSString类型。
话不多说,上图:
其中,repaymentLead对应的value就是需要展示的内容,无疑多了很多本不该出现的标签符。
<div>¿Cómo pagar?</div>
<ol>
<li>Pagar a la cuenta bancaria indicada por transferencia bancaria.</li>
<li>En concepto de pago únicamente poner el número telefónico registrado en la APP.</li>
<li>No incluir palabras adicionales, ya que no se verá reflejado su pago.</li>
</ol>
形如<ol>,<li>这样的标签的本质是什么?是格式,这个时候我们就可以用同样能处理格式的字符串NSAttributedString/NSMutableAttributedString来处理这个字符串。
NSMutableAttributedString *attributedString = [[NSMutableAttributedString alloc] initWithData:[repaymentCodeDict[@"repaymentLead"] dataUsingEncoding:NSUTF8StringEncoding] options:@{NSDocumentTypeDocumentAttribute: NSHTMLTextDocumentType} documentAttributes:nil error:nil];
字典 @{NSDocumentTypeDocumentAttribute: NSHTMLTextDocumentType} 的NSHTMLTextDocumentType就是对应的可以处理HTML语言的value。此时我们按住command点进去看看这个枚举还有什么值
NSAttributedStringDocumentType const NSPlainTextDocumentType //纯文本文档类型
NSAttributedStringDocumentType const NSRTFTextDocumentType //RTF格式文档类型
NSAttributedStringDocumentType const NSRTFDTextDocumentType //RTFD格式文档类型
NSAttributedStringDocumentType const NSHTMLTextDocumentType //HTML格式文档类型
RTF和RTFD格式的文本苹果就能生成(打开文本编辑新建一个文件,这个文件就是RTF。下次遇到对应的格式就自选方式解析)。
但是,此时问题并没有全部解决,如果你把上面的代码粘进去,run,会发现,虽然没有标签了,但是会存在乱码,如下图:
开头明明是“¿Cómo pagar?” 为什么变成了图里的乱码,其实还是因为文本解析的原因,通常的中文data转string解码,用NSUTF8StringEncoding就可以满足了,但UTF-8字符集中并没有很多西语的字符串,或者对应顺序有所不同,所以就显示了非目标码值。此时我们进一步调试,将NSUTF8StringEncoding改为NSUTF16StringEncoding
NSMutableAttributedString *attributedString = [[NSMutableAttributedString alloc] initWithData:[repaymentCodeDict[@"repaymentLead"] dataUsingEncoding:NSUTF16StringEncoding] options:@{NSDocumentTypeDocumentAttribute: NSHTMLTextDocumentType} documentAttributes:nil error:nil];
UILabel *lab = [[UILabel alloc] init];
lab.attributedText = attributedString;
这样他就能正常显示了,如图
同理,如果小伙伴下次遇到了乱码/其他语言/NSUTF16StringEncoding解决不了的情况,可以试试data转String的其他解码方式,总有一款适合你。
typedef NSUInteger NSStringEncoding;
NS_ENUM(NSStringEncoding) {
NSASCIIStringEncoding = 1, /* 0..127 only */
NSNEXTSTEPStringEncoding = 2,
NSJapaneseEUCStringEncoding = 3,
NSUTF8StringEncoding = 4,
NSISOLatin1StringEncoding = 5,
NSSymbolStringEncoding = 6,
NSNonLossyASCIIStringEncoding = 7,
NSShiftJISStringEncoding = 8, /* kCFStringEncodingDOSJapanese */
NSISOLatin2StringEncoding = 9,
NSUnicodeStringEncoding = 10,
NSWindowsCP1251StringEncoding = 11, /* Cyrillic; same as AdobeStandardCyrillic */
NSWindowsCP1252StringEncoding = 12, /* WinLatin1 */
NSWindowsCP1253StringEncoding = 13, /* Greek */
NSWindowsCP1254StringEncoding = 14, /* Turkish */
NSWindowsCP1250StringEncoding = 15, /* WinLatin2 */
NSISO2022JPStringEncoding = 21, /* ISO 2022 Japanese encoding for e-mail */
NSMacOSRomanStringEncoding = 30,
NSUTF16StringEncoding = NSUnicodeStringEncoding, /* An alias for NSUnicodeStringEncoding */
NSUTF16BigEndianStringEncoding = 0x90000100, /* NSUTF16StringEncoding encoding with explicit endianness specified */
NSUTF16LittleEndianStringEncoding = 0x94000100, /* NSUTF16StringEncoding encoding with explicit endianness specified */
NSUTF32StringEncoding = 0x8c000100,
NSUTF32BigEndianStringEncoding = 0x98000100, /* NSUTF32StringEncoding encoding with explicit endianness specified */
NSUTF32LittleEndianStringEncoding = 0x9c000100 /* NSUTF32StringEncoding encoding with explicit endianness specified */
};
以上,问题解决。
- 最后,若有错误,恳请斧正。