搜索学习基础--基本概念的简单阐述

关于查询

查询数据分为精确查找模糊查找

  • 精确查找:对于精确查找,我们都非常熟悉,就是这个值必须等于这个条件。比如我们常用的数据库查询中:
    select * from user_info where user_id = ?
  • 模糊查找:对于模糊查找,我们需要查找的范围就是结果中的某个值必须包含这个条件。平时我们在一个文档中查找某个
    单词,这就是模糊查找。

对于普通的查找,我们是从一个文档中,一个一个的去遍历匹配。比如我们要从10w个数据中,
查找包含字符串“abc”的,那就相当得慢。如果这些数据在数据库中,我们通常会建立索引,去优化查询速度。对于比较大的文本内容,
我们通常使用全文检索的方式。总结:对于优化查询,我们使用数据库建立索引和使用全文检索

关于数据库建立索引

为了优化查询速度,我们会对数据库中的数据建立索引。在mysql数据库中,有两种索引方法:BtreeHash
这两种方式为什么会加速查询。两种方式有什么区别,这是我们必须了解的。

  • Hash方法建立索引

Hash,就是我们所谓的散列表,它的存储是key-value结构的。当我们对数据建立索引后,我们的每个数据都会有一个对于的Hash值。当我们去查找数据的时候,只要取条件
的Hash值即可。数据存储的位置通过Hash值快速找到。我们也从Hash算法的原理中可以看到,这种索引方式比较适合精确查找。下面举个简单的Hash查找的例子:
HashCode = 2x+1
|hashcode|value|
|----|----|
|11|5|
|101|50|
|121|60|
...
假设库中有大量的数据,此时我们的搜索条件是60,我们取得HashCode = 2*60+1 = 121,然后拿着121去库中寻找其存放的位置。这样就非常的速度。当然这只是一个简单的Hash。
对于优化散列表,减少冲突这些我们这里就不做讨论。
如果想实现以下Hash算法整个过程,可以看下此博客哈希算法的Java实现

  • Btree方法建立索引

看到这个名字,我想大学里面学过数据结构这门课程的都会首先想到数据结构中的这个概念。用于搜索,我们肯定会想到二叉树。不管数据库索引它用的是哪种树,
它肯定是一种基于二叉搜索树优化的树,所以我们只要了解二叉搜索树这个结构算法,我们就可以知道为什么使用Btree方式建立索引会加速查找了。它把原来的时间复杂度从
O(n) 转变成了 O(log2(n))。因为二叉树的中序遍历的结果就是根据key值排序的列表,所以这种方式对于范围查找是非常合适的。
如果想实现以下二叉搜索树的建立和查找的整个过程,可以看下此博客二叉搜索树的Java实现

关于全文检索

对于大偏的文档,使用数据库建立索引就非常不合适了。此时我们会建立全文索引,而建立全文索引,有正排索引倒排索引
两者的区别从名字上就可以看出来。

  • 正排索引:通过文章查找关键词
  • 倒排索引:通过关键词查找文章

对于正排索引,也就是我们一般得搜索方式,对所有文章遍历,查找包含关键词得文章。而倒排索引呢,是给每个关键词对应匹配文档,建立好索引。当你查找得时候,这些关键词在
哪些文档出现过,出现得次数,出现得位置,一目了然。倒排索引的解读

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容