240 发简信
IP属地:广东
  • LangChain 十行代码实现 向量库构建+RAG链路

    文心一言的key申请,参考:LangChain 三行代码实现 文心一言 Prompt+LLM 大模型问答https://www.jianshu....

  • LangChain 三行代码实现 文心一言 Prompt+LLM 大模型问答

    先在百度智能云千帆这里,申请文心的API KEY: https://console.bce.baidu.com/qianfan/overview...

  • Resize,w 360,h 240
    Python 多进程处理Pandas

    1 怎么多进程处理 比如,对于一个pd.DataFrame 数据,需要对其中的每一行进行一个gen_new_df操作,然后将所有的结果拼接起来。...

  • Resize,w 360,h 240
    大模型Prompt技巧

    1 方法论 1.1 整体思想: 描述清晰明确,避免模糊和歧义; 细节上尽量详细充分全面,越是复杂的任务,提示词就要尽可能的详细,列出逻辑和步骤;...

  • 大模型出现幻觉的原因

    幻觉的类型: 事实性幻觉:事实错误; 忠实性幻觉:大模型的回答与用户的Query有偏离。 幻觉的原因: 数据漏洞: 训练数据可能有毒性,训练数据...

  • 文档分句/分段方式汇总

    文档分割方式 1 固定长度/分割符 如:RecursiveCharacterTextSplitter, CharacterTextSplitte...

  • Resize,w 360,h 240
    同一个汉字竟有不同编码 - 程序中汉字比较的坑

    1 背景 部分汉字 存在 兼容表意文字 问题,同一字源中不同写法的汉字,在Mac上看起来一样,实际上编码不同。比如在Python中运行如下代码:...

  • Karatsuba's Algorithm Karatsuba 算法

    1 复数乘法 假如现在有两个复数: 和 则,两个复数相乘,则是:也就是说,共需要计算4次乘法,3次加法 2 一个更好的方法: 计算a*c 计算b...

  • Mac M1芯片 安装Tesseract库 适用Java

    libtesseract.dylib 1 背景 适用于解决如下报错:在Java中执行 报错: 整体思路:找一个libtesseract.dyli...