由于不知名原因,现在下载huggingface的模型和数据集非常慢,甚至无法下载。https://hf-mirror.com是一个非常好用的hu...
熵是信息论中的重要概念,它是对不确定性的度量,熵越大,不确定性越大。由此衍生出了条件熵、相对熵、交叉熵、互信息等概念,理解这些概念对于理解机器学...
本文整理了日常学习和科研中常用的一些提示词,方便查找和使用。 中文 需求:科研论文初稿润色 我正在撰写一篇关于【插入主题】的论文,这是论文的【插...
前情提要:需要将服务器上可以运行的整套前后端数据代码打包到docker中,交给乙方,乙方可以在自己机器上实现一键部署。 本项目用到的技术栈:前端...
前言 Spacy是一款非常流行的自然语言处理工具包,可以完成分词,词性标注,句法分析,情感分析等很多自然语言处理需求。本文将介绍Spacy的基本...
抽离 学会站在站在第三者的视角来看待发生在自己身上的事务,以乐观的心态面对所谓的不幸。 办公室里有人说话声音很大,那么我可以想:“如果他声音再大...
背景 在使用Bert进行文本分析的过程中,我们需要用BERT自带的分词器(Tokenizer)来对文本序列进行分词(Tokenize),其基本原...
日常用NLP脚本备份 机器翻译 使用Huggingface提供的接口,和Helsinki-NLP提供的脚本,实现快速的机器翻译; 为了便于批量处...
本文将介绍如何将微信聊天记录导出为结构化数据 所需材料 一部已经root的安卓手机 带GPU的Linux电脑整体流程如下: 数据库文件提取 使用...