1 水塘抽样 如果数组以文件形式存储(读者可假设构造函数传入的是个文件路径),且文件大小远超内存大小,我们是无法通过读文件的方式,将所有下标保存在内存中的,因此需要找到一种空...
1 水塘抽样 如果数组以文件形式存储(读者可假设构造函数传入的是个文件路径),且文件大小远超内存大小,我们是无法通过读文件的方式,将所有下标保存在内存中的,因此需要找到一种空...
1. 根据欧几里得-欧拉定理,每个偶完全数都可以写成 的形式,其中 p 为素数且 为素数。 由于目前奇完全数还未被发现,因此题目范围 [1,10^8] 内的完全数都可以写成上...
例题:给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。一个字符串的 子序列 是指这样一个新的字符...
迪杰斯特拉算法是由荷兰计算机科学家在1956年发现的算法,此算法使用类似广度优先搜索的方法解决了带权图的单源最短路径问题。它是一个贪心算法。核心思想:更新邻接节点的最短距离 ...
并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中...
拓扑排序是 BFS + 贪心算法应用于有向图的专有名词核心思想:BFS、贪心算法作用: 得到拓扑序(不唯一) 检测是否有环 算法过程: 1.找到初始入度为0的节点 2.将这些...
对于数组 a,定义其差分数组(difference array)为性质 1:从左到右累加 d 中的元素,可以得到数组 a。性质 2:如下两个操作是等价的。 把 a 的子数组 ...
1 累计计算函数 reduce函数将一个二元函数(接受两个参数的函数)应用于一个可迭代对象(如列表),从左到右对元素进行累积计算,最终得到一个单一的值。 function:一...
Chapter 3 1. 分词分词的方法: 基于空格的分词 Byte pair encoding(BPE)a. Input(输入):训练语料库(字符序列)。b. Step1....
内容均来自[https://github.com/datawhalechina/so-large-lm][https://github.com/datawhalechina/...
一、AND二、OR 三、XOR(^)
1 基础 1.1 提示方法 (1) 给出指令 (2)角色提示 (3)多范例提示多范例提示的一个关键场景是当我们需要以特定的结构输出结果,但是又很难向模型进行描述的时候。为了理...
概率是预测词或句子最核心的内容。 3.1 n-grams Models that assign probabilities to sequences of words are...
2.5 最小编辑距离 编辑距离(Edit distance)给我们提供了一种方法来量化这种字符串相似性。正式来说,两个字符串之间的最小编辑距离(minimum edit di...
2.3 corpus 语料库的变化维度:(1) 语种:开发出的算法,一般是适用于英语或者针对工业化大国的官方语言(汉语、西班牙语、日语、德语等)开发的,但我们不希望将工具仅仅...
概念:lemma词素:是一组具有相同词干(stem)、相同主词性和相同词义的词汇形式(lexical form)。如cat和cats的词素就是cat。wordform词形:是...
2.1.1 基础正则表达式 通配符经常和星号一起使用,表示“任何字符串”。.* 表示任何字符串。 锚点 锚点是将正则表达式锚定在字符串中特定位置的特殊字符,即表示位置1.插入...
两个盘都有系统,你改了盘符会黑屏? 我怀疑你们这些发表评论的理解能力和智力是不是有问题
将系统迁移到新的硬盘,并且改为C盘符本人机型为天选1,锐龙版2060,其他机型按此操作出问题概不负责,仅作参考,不欠你们的。改盘符之前要确定两个盘都有系统, 理解能力和智力有问题的就别看这篇文章了。一、安装SS...
@Innocence_bc4b 我有没有在文章开头说过,“本人机型为天选1,锐龙版2060,其他机型按此操作出问题概不负责,仅作参考”, 我好用不一定你好用
将系统迁移到新的硬盘,并且改为C盘符本人机型为天选1,锐龙版2060,其他机型按此操作出问题概不负责,仅作参考,不欠你们的。改盘符之前要确定两个盘都有系统, 理解能力和智力有问题的就别看这篇文章了。一、安装SS...
1 初识linux linux系统可以划分为四个工具:Linux内核、GNU工具、图形化桌面环境以及应用软件。 (1)Linux内核主要功能:系统内存管理、软件程序管理、硬件...