【InternLM 实战营第二期笔记】书生·浦语大模型全链路开源体系

课程链接GitHub:InternLM/Tutorial at camp2

第一次课程录播链接:书生·浦语大模型全链路开源体系_哔哩哔哩_bilibili

InternLM2技术报告

一、书生浦语大模型简介

2023年6月7日,InternLM大模型发布

2024年1月,上海 AI Lab正式发布书生 · 浦语 2.0(InternLM2),包括1.8B、7B 及 20B 两种参数规格及Base、Chat等多个版本

3320162b27ea4b74a2838d4592b298d4.png

InternLM2_Base:高质量、强可塑性的基座模型
InternLM2:在Base基础上,在多个能力进行了强化,更优秀的基座模型
Chat-SFT:在Base基础上,经过有监督微调SFT后的对话模型
InternLM2-Chat:经过SFT和RLHF,面向对话交互进行优化的模型

ce320fd293ff4418ac58dca216119e81.png

回归语言建模的本质,InternLM2使用新一代数据清洗过滤技术,包括:

1.多维度数据价值评估
2.高质量语料驱动的数据富集
3.有针对性的数据补齐

开源数据集平台OpenDataLab:OpenDataLab

111.png

InternLM2的主要亮点:

1.20万token上下文
2.chat-20B在推理数学等重点评测上比肩ChatGPT
3.结构化创作,超越GPT3.5
4.工具多轮调用,复杂智能体创建
5.计算能力,加入代码解释后,和GPT-4相仿水平


3345ea32395a4d09bdbe9fa2ed2e0627.png

对于其他参数量类似的开源模型,基本是全方位的超越,特别是推理、数学、代码等方面的能力提升尤为显著


4170b7b0bb2f4646a9c03bacb3a728f4.png

举例:旅游规划、人文关怀对话、科幻创作、工具调用能力……


7fa59e3106694691a95817252fd03305.png

举例:内生计算能力:配合代码解释器,20B模型已经可以完成大学的微积分题目


e22c8a654919425ead61c187dafb177f.png

数据分析能力:上传表格,可以画出趋势发展图,调用机器学习算法,做出后续预测

二、从模型到应用流程

6283e2d8c2534107b1f8647e808fdb10.png
1.典型流程图
128033c227654f65bc23d3dbc43049a3.png

书生浦语对整个流程实现了全覆盖:数据-预训练-微调-部署-评测-应用


a70ccd0e7d2d4681aba92813782372df.png
2.数据

数据环节,书生CC做到了高质量语料驱动、安全性能高


ddeec563ebdb475b943f40d9f23835a6.png
3.预训练

预训练环节,支持8卡到千卡训练,支持HuggingFace等配置、支持多种规格语言模型,能够修改配置即可训练


9310bcd4e51f4c62aa1a4a977a91b28b.png
582d2f140b794fecadfdff66ef507117.png
4.微调

微调环节,支持增量续训和有监督微调(全量参数微调、部分参数微调)

使用XTuner框架,适配多种生态:

1.支持多种输入数据的格式

2.支持优化加速(Flash Attention, DeepSpeed)

3.支持多种微调算法(LoRA, QLoRA, 全量微调)

适配多种硬件,最低只需8GB显存即可微调7B模型


47e017820d8947f6a5c8a84bf3a34621.png
bfe261528f4047339501933f8592f313.png
5.评测

评测环节,opencompass2.0评测体系,可以对市面上常见的大模型进行评测,评测内容包括:

1.数据污染检查

2.更丰富的模型推理接入

3.长文本能力检测

4.中英文双语主观评测

同时构建了评测基准社区,汇聚专家、学者的评测数据集

opencompass也是Meta官方推荐的唯一国产大模型评测体系


7a5ff648aa184d389f63f20855e49f5f.png

OpenCompass对大模型进行循环评测方法,得到的大模型评测年度榜单


b95e85233cb740d58cd0354302869f1c.png
23943aab97d848d98ecd9610fc5d04fc.png
6.部署

部署环节,LMDeploy提供了完整的部署工具链,提供包括Python、grpc、restful的接口,提供模型从轻量化、推理和服务的全流程


9c5124ce29e04a79b70eb5c51bcc18b9.png
a928094fe37b4d1795d14611b54759ef.png
7.智能体

智能体框架,Lagent,支持多种大语言模型、支持多个主流智能体系统

同时开发了AgentLego智能体工具箱,提供了多种工具接口的封装

三、InternLM2 技术报告学习

文档链接https://arxiv.org/pdf/2403.17297.pdf

使用文心一言解读文档

引言

随着人工智能技术的飞速发展,大型语言模型(Large Language Models,简称LLMs)如ChatGPT和GPT-4的出现,标志着人工智能在自然语言处理领域取得了重大突破,引发了关于人工通用智能(Artificial General Intelligence,简称AGI)即将到来的广泛讨论。然而,在开源环境中复制这样的进步一直是一个挑战。为此,我们介绍了InternLM2,一个开源的大型语言模型,通过创新的预训练和优化技术,在多个维度和基准测试中均超越了其前代模型。

模型概述

InternLM2是在多个研究机构和企业的共同努力下开发的。它汇聚了来自上海AI实验室、商汤科技、香港中文大学、复旦大学等众多顶尖科研团队的智慧和资源。该模型采用了先进的深度学习架构和算法,旨在提高自然语言处理任务的准确性和效率。

技术亮点
  1. 创新的预训练技术:InternLM2在预训练过程中采用了多项创新技术,包括无监督学习和自监督学习相结合的方法,以充分利用大量的无标注数据。这种预训练方式使得模型能够更好地捕捉语言的内在规律和结构,为后续的任务提供强大的基础。
  2. 多维度评估体系:为了全面评估InternLM2的性能,我们设计了一个涵盖6个维度和30个基准测试的综合评估体系。这些基准测试涵盖了语言理解、语言生成、文本分类、情感分析等多个方面,确保了模型在各个方面的表现都能得到准确评估。
  3. 长上下文建模能力:InternLM2具有出色的长上下文建模能力,能够处理长达数千个词的文本输入。这使得模型在处理复杂对话、长篇文档等任务时具有更高的准确性和灵活性。
  4. 开放式主观评价:除了客观评估指标外,我们还进行了开放式主观评价,以评估模型在真实应用场景下的表现。这些评价涉及了模型的生成质量、语义连贯性、多样性等方面,为模型的改进提供了有价值的反馈。
实验结果

在综合评估中,InternLM2在多个维度和基准测试中均取得了优异的成绩。特别是在长上下文建模和开放式主观评价方面,模型表现出了显著的优势。这些实验结果证明了InternLM2在自然语言处理领域的先进性和实用性。

结论与展望

InternLM2的成功开发为开源大型语言模型的发展提供了新的思路和方法。未来,我们将继续优化模型架构和算法,提高模型的性能和效率。同时,我们也期待更多的研究者和开发者能够加入到开源大型语言模型的研究和开发中来,共同推动人工智能技术的发展和应用。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容