AI的未来在哪里？

LLM火了，但通用大模型最终只可能像操作系统一样，只有少数几个玩家能活下来。于是垂直大模型又火了，但垂直大模型可能压根是个伪命题。

为什么你觉得需要垂直大模型呢？因为通用大模型在某个具体的领域，知识没有深度对吧？那么其实有三个思路可以解决，成本从低到高依次是：

1、RAG，外挂一个本地知识库。RAG其实是没有推理能力的，只有检索能力。然后通过LLM把检索出来的本地知识库片断以说人话的方式说给用户。成本低。

2、训练一个小模型，然后用tools的方式，被LLM调用。小模型不用那么多参数，甚至不用预训练，直接用打标数据训练一个专项的模型。比如IBM的沃森，就算今天有了大模型，它仍然只需要做个小模型就好，参数顶天了上万个够不够？小模型有垂直领域知识，有推理能力，成本也不算高，而且可维护性可扩展性上都和LLM解耦了。是最佳实践了吧。

3、基于LLM基座，加入垂直领域的预训练、微调和增强训练，得到一个垂直大模型。成本很大啊，训练成本很大，哪怕是Lora，而且有可能让LLM基座造成灾难性遗忘，更让人头大的是，如果LLM基座升级了怎么办？要基于新基座再重新训练垂直大模型吗？调岀来的结果是好是坏未知，毕竟基座那么多参数是黑盒，调参就是摸彩票啊。另一个值得高度重视的问题是，fine tuning和传统的打标数据小模型完全不是一回事，fine tuning的作用更多的是sample打样，引导LLM从pre-train积攒的信息，以更可控的方式输出。fine tuning是重质不重量的，不需要太多样本。LLM本质上还是文字接龙，对于严肃的场景，它是完全不如传统的打标数据小模型可靠的，比如医疗、无人驾驶，你敢拿命来玩吗？

反思一下出发点：我们为什么需要LLM基座呢？只是因为LLM的交互方式更加接近自然语言交流对吧？我们要的是它的NLP、多模交互、情感识别等等基础能力对吧？那么1、2完全可以达到目的啊，成本低还没有任何负作用。所以，垂直大模型会不会压根就是伪命题？

AI的未来在哪里？或者说，如何避开和chatgpt为首的基座大模型正面竞争？

RAG不是。RAG是最容易上手的方向，本地知识库没什么门槛，应用场景也很浅。RAG的地位类似于web1.0的cms一样，是个LLM工程师就得会的基本功。

AI agent是。function call是个好东西，多模交互是个好东西，ReAct更是个好东西。有了它们就有了贾维思的条件，连上硬件更可以得到幻视！问题的关键是，如果chatgpt这种基座大模型公司自己下场做agent呢？注意，chatgpt有最聪明的LLM，通过gpts它还有最全的tools，gpt4-o证明它还有最强的多模交互。做通用型的agent就像做通用大模型一样，一定干不过chatgpt这种公司。只能往这几个方向深入下去，才能立住脚：

1、软硬结合，通过丰富多样的硬件传感器拉开和通用agent能力的差距，无论是对真实世界的感知力，还是action能力，都是硬件的强项。LLM再怎么发展，触手也仅限在缸中之脑上，chatgpt的优势无法延伸过来。关键点在硬件传感器上。

马斯克的人形机器人就符合这个方向。从贾维思到幻视，次元壁就这么突破了。

2、垂直领域私人助理。在长期memery、RAG和定制action的联合作用下，让agent既具备垂直领域能力，同时还知道用户的长期个人档案，不仅是行业专家，还特别了解你懂你。而且2和1不冲突，叠加起来威力更惊人。

下一代的windows和iphone都在朝这个方向推进，让我们设想一下：在本地记录用户的行为并保存下来，最强memory！让用户和操作系统之间的交互不再是stateless；而且ReAct思想之下，所有的software都可以api接口化，可以是本地api，也可以是网络api，直接在操作系统级别运行tools。微软、苹果、google这种公司可以直接在操作系统层面截胡agent，比gpts还可怕，所以chatgpt自己成为系统级入口肯定是势在必行的，gpt4-o的多模交互和实时性响应也证明它们确实有成为系统级入口的资本。

我们普通公司肯定是挤不进系统级入口这个赛道的。但包括chatgpt在内的操作系统、准操作系统们都没法在垂直方向上深挖。我们只需在应用层做垂直agent即可。通过树莓派之类的做个独立于操作系统的小而美硬件也是个方向。

3、多agent合作，集团作战。多个垂直agent如果合作起来，会发生什么化学反应？道生一，一生二，二生三，三生万物，众妙之门。

这是最让人兴奋的方向，因为想象力才是唯一天花板。想想看，你的erp、oa直接变成了虚拟员工，采购啊、hr啊都可以裁了。photoshop、eclipse、axure、jira变成设计师、程序员、产品经理和项目经理，it外包都省了。以前编程是面向对象编程，以后是面向agent编程。

福特说的“我需要的是一双手，结果得到了一个人”问题就可以解决了。比流水线还流水线。

多agent可以是虚拟的一套系统，只服务于电子世界，也可以连上硬件服务于现实世界。多agent的关键是对业务的深度理解，既是挑战也是壁垒。

上面提到的123并不冲突，可以组合。LLM的发展很快，垂直大模型方向不对，属于不动脑子地蹭热点。而RAG只是个hello world，真正的精彩是见证下一代操作系统（LLM作为用户入口，和应用层基座），以及下一代应用（上文提到的123）。我很期待，也很想恭身入局，问题是，总被挑战廉颇老矣尚能饭否。能。

最后编辑于：2024.05.30 10:38:11

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,126评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,254评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,445评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,185评论 1赞 278
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,178评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,970评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,276评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,927评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,400评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,883评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,997评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,646评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,213评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,204评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,423评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,423评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,722评论 2赞 345

AI的未来在哪里？

推荐阅读更多精彩内容