240 发简信
IP属地:湖北
  • Huggingface国内镜像

    由于不知名原因,现在下载huggingface的模型和数据集非常慢,甚至无法下载。https://hf-mirror.com是一个非常好用的hu...

  • Resize,w 360,h 240
    信息熵、联合熵、条件熵、互信息、交叉熵、相对熵理解

    熵是信息论中的重要概念,它是对不确定性的度量,熵越大,不确定性越大。由此衍生出了条件熵、相对熵、交叉熵、互信息等概念,理解这些概念对于理解机器学...

  • 【学术向】聊天机器人常用Prompt整理

    本文整理了日常学习和科研中常用的一些提示词,方便查找和使用。 中文 需求:科研论文初稿润色 我正在撰写一篇关于【插入主题】的论文,这是论文的【插...

  • 记一次docker打包经历:

    前情提要:需要将服务器上可以运行的整套前后端数据代码打包到docker中,交给乙方,乙方可以在自己机器上实现一键部署。 本项目用到的技术栈:前端...

  • Spacy使用简介

    前言 Spacy是一款非常流行的自然语言处理工具包,可以完成分词,词性标注,句法分析,情感分析等很多自然语言处理需求。本文将介绍Spacy的基本...

  • 对抗、缓解焦虑的方法

    抽离 学会站在站在第三者的视角来看待发生在自己身上的事务,以乐观的心态面对所谓的不幸。 办公室里有人说话声音很大,那么我可以想:“如果他声音再大...

  • Resize,w 360,h 240
    Bert如何使用预留的[unused*]

    背景 在使用Bert进行文本分析的过程中,我们需要用BERT自带的分词器(Tokenizer)来对文本序列进行分词(Tokenize),其基本原...

  • NLP小工具

    日常用NLP脚本备份 机器翻译 使用Huggingface提供的接口,和Helsinki-NLP提供的脚本,实现快速的机器翻译; 为了便于批量处...

  • 微信聊天记录导出

    本文将介绍如何将微信聊天记录导出为结构化数据 所需材料 一部已经root的安卓手机 带GPU的Linux电脑整体流程如下: 数据库文件提取 使用...