python version 太新也是个问题 我的python是3.13版本。pip install torch 都不行。原来是太新了,没有匹配的ERROR: Could n...
python version 太新也是个问题 我的python是3.13版本。pip install torch 都不行。原来是太新了,没有匹配的ERROR: Could n...
目前各家大模型厂商的API接口,基本上都是参照openai的接口格式,所以不管是chat/compelete,还是function-call接口格式都是一样的,这个给不同厂家...
我们天天说想要公司的产品增长10倍,其实非常难。就拿自己做的自媒体来说,现在1k个粉丝,然后想要增长10倍到1w个粉丝。还是挺难。 自己的一点反思: 目前的商业价值量 有一点...
找重要的事件 比如给定一个主题,我们取召回素材,然后把素材给到大模型,在prompt里面让他挑选重要的事件,并总结。 效果上看,一般都会做的比较泛泛。总结的内容可能也包含多个...
tool工具的使用 当前只设定一个工作流,回答上市公司的问题,使用kimi模型,在agent 人设上要求所有问题使用工作流工具。 效果一般,agent第一步就是选择工具,比如...
向量召回的先决条件 你的query 比较明确,越具体越好。 如果是比较泛的问题,比如 xxx公司怎么样? 无论如何都不好召回。 这个时候需要好的改写,将问题具体话,比如 从主...
步骤 cp /var/lib/mysql 到新的目录 设置 mysql:mysql owner 设置 conf配置,看起来都ok。 service restart 就是起不来...
转化成int8的模型 AutoGPTQ的方式量化:https://github.com/QwenLM/Qwen/issues/464[https://github.com/Q...
工具篇 尝试各类文本生成的工具,从https://www.waytoagi.com/[https://www.waytoagi.com/]开始。 尝试了阿里妈妈的营销文本,选...
Autogent:1,适合将各个agent 拆分,组合和调用,主要在规划层面。 实际上做的事情,类似与autogpt调用各个agent,未来可能有非常多的大量agent之后,...
最新的论文或者必看榜单 2023-RAG-非常全面: Retrieval-Augmented Generation for Large Language Models: A ...
背景 比如我们有比较确定的几十类实体,并且每一类实体的值都是已知的,也就是在一个有限集合类做NER实体识别。 基于lucene的召回 把实体做成字典,比如 公司名,公司简称 ...
幻觉评测工具 factool https://github.com/GAIR-NLP/factool/issues[https://github.com/GAIR-NLP/f...
参考标准 gpt4 作为目前公开的天花板,gpt4的价格可以作为一个参考 1000token应该是英文,输入token 0.03刀,也就是10K 一万token=0.3刀=2...
现有方案 基本都是搜索的路子,将doc 中所有的文本进行向量化,然后query,将query 做成向量,然后用相似性算法去召回段落来回答问题。现有方案的缺点: 缺失了很多文档...
持续迭代的嵌入模型 论文: C-Pack: Packaged Resources To Advance General Chinese Embedding 测试效果看,比m3...
1、中文数据集 AGIEval AGIEval:https://github.com/ruixiangcui/AGIEval[https://github.com/ruixi...
典型的场景 比如我想模仿一篇报告的风格,比如第一段写 对一个公司的历史进程。 推理或者问答的方式 写公司的进程,可以要写公司创立的时间,经历过哪些阶段,每个阶段有什么重大事件...