Android Html类

Android中的Html类可以把一些html标签转换成Android对应的Spanned,因此我们可以解析服务端返回的Html来显示富文本信息。
有两个核心方法fromHtml把html转为span,另一个方法把span转为html。
public static Spanned fromHtml(String source, int flags, ImageGetter imageGetter,
TagHandler tagHandler)
source:包含Html的字符串。
imageGetter:imageGetter对象。当系统解析到img标签时就会调用imageGetter对象的getDrawable方法,并将src属性值传递传入getDrawable方法。至于src属性的具体含义,就要在getDrawable方法中确定了。getDrawable方法返回一个Drawable对象。我们可以从res/drawable资源、assets资源、SD卡以及网络上获得图像资源,并分装成Drawable对象。
tagHandler:TagHandler对象。系统没处理的标签,会调用该对象的handleTag方法。

Html源码分析

一开始所有的fromHtml方法都会调用到下边这个方法

public static Spanned fromHtml(String source, int flags, ImageGetter imageGetter,
            TagHandler tagHandler) {
        Parser parser = new Parser();
        try {
            parser.setProperty(Parser.schemaProperty, HtmlParser.schema);
        } catch (org.xml.sax.SAXNotRecognizedException e) {
            // Should not happen.
            throw new RuntimeException(e);
        } catch (org.xml.sax.SAXNotSupportedException e) {
            // Should not happen.
            throw new RuntimeException(e);
        }

        HtmlToSpannedConverter converter =
                new HtmlToSpannedConverter(source, imageGetter, tagHandler, parser, flags);
        return converter.convert();
    }

这里解析Html使用了开源组件TagSoup,它的核心类是Parser。fromHtml方法主要就是创建了Parser类,用于解析Html的类。然后创建HtmlToSpannedConverter对象,它实现了ContentHandler接口主要用于监听Parse的解析过程,在内部构建Spanned。

ContentHandler作为解析Html的回调,ContentHandler有三个核心方法

//遇到开始标签执行
 public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
}

//遇到标签中的文字执行
public void endElement(String uri, String localName, String qName) throws SAXException {
}

//遇到结束标签执行
public void characters(char ch[], int start, int length) throws SAXException {
}

Parser顺序读取html,遇到开始标签调用startElement方法,遇到标签中的文字调用characters方法,遇到结束标签调用endElement方法。
例如<p><span>文字文字</span></p>,首先会调用startElement参数localName为p,start,再次调用startElement参数为span,然后调用characters,ch为『文字文字』,最后调用两次endElement,参数分别为span,p。

继续往下看startElement调用了handleStartTag,可以看handleStartTag方法中有大量的各种Html标签处理


image.png

最终会调用start方法,每个开始标签的位置都会在SpannableStringBuilder中通过setSpan插入一个标记。提供给后边用。方法如下。

private static void start(Editable text, Object mark) {
    int len = text.length();
    text.setSpan(mark, len, len, Spannable.SPAN_INCLUSIVE_EXCLUSIVE);
}

接着遇到文字characters主要就是把文字追加到SpannableStringBuilder后边。
最后遇到结束标签,endElement方法会调用handleEndTag,handleEndTag中也有大量Html标签的处理


image.png

最终会调用end相关方法

private static void end(Editable text, Class kind, Object repl) {
   int len = text.length();
    Object obj = getLast(text, kind);
    if (obj != null) {
        setSpanFromMark(text, obj, repl);
    }
}

 private static void setSpanFromMark(Spannable text, Object mark, Object... spans) {
    int where = text.getSpanStart(mark);
    text.removeSpan(mark);
    int len = text.length();
    if (where != len) {
        for (Object span : spans) {
            text.setSpan(span, where, len, Spanned.SPAN_EXCLUSIVE_EXCLUSIVE);
        }
    }
}

end方法中getLast是获取start方法中设置的标记(相同标记有很多获取最后一个),在setSpanFromMark方法中,根据上边的标记找到标记的位置,然后把文字样式的span设置给这段文字(标记位置开始,文字长度结束)。

画图举个例子,上边表示本来的Html,箭头指示当前解析的位置,下边为构造出来的SpannableString


1.png
2.png
3.png
4.png
5.png
6.png
7.png
8.png
9.png

然后toHtml方法就是个逆向的过程比较简单,有兴趣可以自己看代码。

扩展与修改

设置tagHandler可以处理Html类没有处理的标签。
然而要支持

<span style="font-size:15px;color:#ff0000"></span>

这种解析需要费电力气,查看源码发现Android高版本的Html类里支持一些css样式处理,但是没扩展接口,因此我们扩展css只能修改Html类了,我这里直接copy了系统的Html类做了修改。

主要修改他的startCssStyle与endCssStyle方法就可以了,主要就是正则匹配出要修改的属性,进行对应span的设置。添加了个font-size解析和多属性解析如下。

private void startCssStyle(Editable text, Attributes attributes) {
        String styleStr = attributes.getValue("", "style");
        if (styleStr != null) {
            String[] styles = styleStr.split(";");
            for (String style : styles) {
                Matcher m = getForegroundColorPattern().matcher(style);
                if (m.find()) {
                    int c = getHtmlColor(m.group(1));
                    if (c != -1) {
                        start(text, new Foreground(c | 0xFF000000));
                    }
                }

                m = getBackgroundColorPattern().matcher(style);
                if (m.find()) {
                    int c = getHtmlColor(m.group(1));
                    if (c != -1) {
                        start(text, new Background(c | 0xFF000000));
                    }
                }

                m = getTextDecorationPattern().matcher(style);
                if (m.find()) {
                    String textDecoration = m.group(1);
                    if (textDecoration.equalsIgnoreCase("line-through")) {
                        start(text, new Strikethrough());
                    }
                }
                m = getTextSizePattern().matcher(style);
                if (m.find()) {
                    String textSize = m.group(1);
                    if (textSize.endsWith("px")) {
                        //px换成android的dp
                        int size = Integer.parseInt(textSize.replace("px", ""));
                        start(text, new FontSize(size, true));
                    }
                }
            }
        }
    }

    private static void endCssStyle(Editable text) {
        Strikethrough s = getLast(text, Strikethrough.class);
        if (s != null) {
            setSpanFromMark(text, s, new StrikethroughSpan());
        }

        Background b = getLast(text, Background.class);
        if (b != null) {
            setSpanFromMark(text, b, new BackgroundColorSpan(b.mBackgroundColor));
        }

        Foreground f = getLast(text, Foreground.class);
        if (f != null) {
            setSpanFromMark(text, f, new ForegroundColorSpan(f.mForegroundColor));
        }

        FontSize fs = getLast(text, FontSize.class);
        if (fs != null) {
            setSpanFromMark(text, fs, new AbsoluteSizeSpan(fs.mSize, fs.mIsDip));
        }

    }
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 196,264评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,549评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,389评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,616评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,461评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,351评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,776评论 3 387
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,414评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,722评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,760评论 2 314
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,537评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,381评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,787评论 3 300
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,030评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,304评论 1 252
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,734评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,943评论 2 336

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,517评论 18 139
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 6,331评论 0 17
  • 在使用TextView的时候,我们经常需要在TextView中进行图文混排,比如在QQ中聊天的消息中的表情,底部t...
    Ruheng阅读 33,261评论 3 126
  • <a name='html'>HTML</a> Doctype作用?标准模式与兼容模式各有什么区别? (1)、<...
    clark124阅读 3,452评论 1 19
  • CSS基础 本文包括CSS基础知识选择器(重要!!!)继承、特殊性、层叠、重要性CSS格式化排版单位和值盒模型浮动...
    廖少少阅读 3,043评论 0 40