用Inseq库来深入解析一下AI自然语言的生成吧

ChatGPT实在是太火了，以至于带动了整个NLP（Natural Language Processing 自然语言生成）的研究和认知度大受关注。在整个NLP的研究和应用中，除了最上层的仅仅是应用这些类似GPT工具的普通用户，和最底层的模型算法开发研究人员，还有很多像我这样中间层的，喜欢基于机器学习的模型做一些应用开发，在需要的场景里为自己定制服务。

在这个过程中，了解所用模型的内在机理会大大帮助我们理解语句形成预测上的原因，还能在早期发现模型的缺陷或潜在的一些偏见及固化思维。过去在自然语言处理可解释性（Interpretability）方面的工作主要集中在分类（Classification）上，而在很大程度上忽视了生成（generation）方向的解析，主要原因还是缺乏专用工具。最近看了几篇论文，分享一下Inseq，这是一个 Python 库，用于对序列生成模型（Sequence Generation Models）的进行解释并提供直观的显示。 Inseq 支持对流行的Transformers 架构的模型内部信息和特征重要性进行直观的打分和提取。

本文中，除了介绍Inseq基本用法，我还将举一个利用Inseq的解释能力来检测AI的性别偏见的demo。

Inseq

Inseq作为一种比较新的开源Python 库，它提供了序列生成模型的可解释性分析（interpretability analysis）。

下图展示了 Inseq 在某个AI文本补全的过程中（任务为“To innovate one should”， AI生成“think outside the box”.），每个特征（这里可以理解为词语）为整个生成语句中的每个元素的重要性贡献程度，以及该词出现的概率，以热图形式展现给用户。

Inseq库安装

安装Inseq的pip命令如下：

!pip install inseq
# install extras for visualization in Jupyter Notebooks
!pip install inseq[notebook,datasets]

Inseq需要在Jupyter Notebook环境下运行其可视化组件，因此请务必安装该环境，可以通过直接安装Anaconda Navigator完成，在此下载：Anaconda | The World's Most Popular Data Science Platform

如果可以访问谷歌，也可以使用免费的Google Colab Notebook进行开发，省去了对本地环境的影响。

AI语句翻译分析

用几行 Python 生成快速分析图非常简单。导入Inseq模块后，加载模型，并为后续的输入选择合适的归因（Attribution method）。在此示例中，我们使用英语到西班牙语的翻译模型 Helsinki-NLP/opus-mt-en-es，并选择 integrated_gradients 作为我们的Attribution method。

import inseq

model = inseq.load_model("Helsinki-NLP/opus-mt-en-es", "integrated_gradients")

接下来我们提供一段英语句子，让其生成翻译结果和解析出来的热图。

out = model.attribute(
  "It's not surprising that bias is always a more serious issue in NLP than wrong information provided.",
  n_steps=100
)
out.show()

输出的热图如下所示：

X轴方向是输入的英语句子，Y轴方向是生成的西班牙语句子，可以看到每个输入的单词对于生成的单词都有对应的分数，代表了其对生成的具体内容的重要性。

AI文本补全的分析

我们展示的下一个示例是使用 GPT-2 模型和 gradient_shap 归因法的文本补全。
这次我提供开头词“To introduce my”，让 GPT-2 用 9 个Token（可以大致理解为单词）完成句子：

import inseq

model = inseq.load_model("gpt2", "gradient_shap")
model.attribute(
    "To introduce my",
    generation_args={"max_new_tokens": 9},
    n_steps=150,
    internal_batch_size=50
).show()

输出的热图如下所示：

从结果中，我们可以看到 Inseq 为我们提供了每个有助于AI生成语句“new book, The Art of The Deal,”的属性标记（我的输入词和生成的词）的分数，通过这些分数，我们可以大致对该NLP 模型的逻辑有了了解。

AI模型的偏见分析

知道了Inseq如何使用后，我们就可以用它来做一下关于AI偏见的验证。这个是近期发布在HuggingFace平台上的叫做Bias in MT的有趣应用：

https://huggingface.co/spaces/oskarvanderwal/MT-bias-demo

这个应用的目的是评估当输入标记不包含对性别的明确定义的时候，AI如何生成与性别相关的句子。这其实是我们日常生活中普遍存在的一种性别偏见，请在脑海中快速想象他们是男是女：

护士
科学家
工程师
大厨
幼儿园老师
公司CEO

要从脑子里去掉这些固有思维其实是很难的，同样地，AI也有这个问题，因为他们训练的大量语料难免包含我们人类创造的那些偏见思维。

该Demo巧妙地选择匈牙利语作为源标记，而英语作为目标翻译标记，因为匈牙利语没有像“he”和“she”这样的性别词，两者都为“ő”。这样的话，我们就可以尝试输入“ő”+职业，看看AI是如何将这些职业解读为男性或女性的。

从Simple translation的demo页面，你可以选择Occupation in Hungarian和Target language，这里我选择“vezérigazgató”意思是CEO，“en”代表Target Language为英语，然后点击Translate & Attribute按钮：

我们观察到：
该模型自然地将匈牙利语句子翻译成“他是CEO”。显着性热图显示，当“ő”不那么重要，因为它不能表示性别时，属性标记“CEO”在翻译中生成“He”词的重要性非常高，也就是AI很自然地认为CEO应该是男的。

当你在使用该模型进行翻译工作时，很可能需要在正式发布文本之前，手动介入修改以避免这种偏见产生。

下面是这个Demo的处理逻辑代码：

import inseq
from inseq.data.aggregator import AggregatorPipeline, SubwordAggregator, SequenceAttributionAggregator, PairAggregator
model = inseq.load_model("Helsinki-NLP/opus-mt-hu-en", "integrated_gradients")
out = model.attribute(
"ő vezérigazgató",
  n_steps=150
)
squeezesum = AggregatorPipeline([SubwordAggregator, SequenceAttributionAggregator])
out.show(return_html=True, display=True, aggregator=squeezesum)

然后，如果你对偏见或其他方面的评估有更多想法时，可以将 Helsinki-NLP/opus-mt-hu-en 替换为你要评估的模型，将 integrated_gradients 替换为其他支持的归因方法。

该应用程序还提供了一个称为Contrastive Pair（对比法）的功能块。这是为了评估如果手动将目标翻译“ő”从“He”更改为“She”，概率有多大（或多小）。该功能是基于Inseq 中称为“对比特征归因”的高级技术。

从“He's”到“She's”的结果为负数，说明该模型为“CEO”场景选择“男性”而不是“女性”是非常自然地。

与第一个Demo一样，你也可以尝试更改下面的 Python 代码，通过替换模型、归因方法、源词和目标词对，来评估自己感兴趣的其他对比标记。

import inseq
from inseq.data.aggregator import AggregatorPipeline, SubwordAggregator, SequenceAttributionAggregator, PairAggregator

model = inseq.load_model("Helsinki-NLP/opus-mt-hu-en", "integrated_gradients")
source = "ő vezérigazgató"
target = model.generate(source)[0]

out = model.attribute(
[
    source,
    source,
],
[
    target.replace("She", "He"),
    target.replace("He", "She"),
],
n_steps=150,
return_convergence_delta=False,
attribute_target=False,
step_scores=["probability"],
internal_batch_size=100,
include_eos_baseline=False,
)
 
squeezesum = AggregatorPipeline([SubwordAggregator, SequenceAttributionAggregator])
masculine = out.sequence_attributions[0].aggregate(aggregator=squeezesum)
feminine = out.sequence_attributions[1].aggregate(aggregator=squeezesum)

html = masculine.show(aggregator=PairAggregator, paired_attr=feminine, return_html=True, display=True)

最后编辑于：2023.03.10 02:36:09

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,482评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,377评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,762评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,273评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,289评论 5赞 373
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,046评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,351评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,988评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,476评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,948评论 2赞 324
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,064评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,712评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,261评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,264评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,486评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,511评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,802评论 2赞 345