数据结构(20)-查找初探

概念

查找技术和我们日常的生活息息相关,比如上网搜索信息、在手机通讯录里查找某一个联系人。所有这些需要被查找的数据所在的集合,统称为查找表。

查找(Searching): 就是根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素。

关键字Key是数据元素中某个数据项的值,又称为键值。若此关键字可以唯一的标识一个记录,则称之为主关键字(Primary Key),对于可以识别多个数据元素(或者记录)的关键字,我们称之为次关键字(Secondary Key)

查找表

查找表(Search Table)是由同一类型的数据元素(或者记录)构成的集合。
按照查找表操作方式,查找表可以分为两类:静态查找表、动态查找表。

  1. 静态查找表(Static Search Table): 只作查找操作的查找表。主要操作如下:
  • 查询某个特定的数据元素是否在查找表中
  • 检索某个特定的数据元素和各种属性
  1. 动态查找表(Dynamic Search Table): 在查找过程中同时插入查找表中不存在的数据元素,或者从查找表中删除已经存在的某个数据元素。操作如下:
  • 查找时插⼊入数据元素
  • 查找时删除数据元素

对于静态查找表来说,我们可以使用线性表结构来组织数据,这样使用顺序查找法、折半查找等方式都比较高效;对于动态查找表,可以考虑二叉排序树查找。

顺序表查找

顺序查找(Sequential Search),⼜称为线性查找,是最基本的查找技术。它的查找过程如下:从表中的第一个(或最后⼀个)记录开始,逐个进行记录的关键字和给定值⽐较,若某个记录的关键字和给定值相等,则查找成功,找到所查记录;如果直到最后⼀个(或第⼀个)记录,其关键字和给定值比较都不等时,则表中没有所查的记录,查找不成功。

//a为数组,n为查找的数组个数,key为要查找的关键字;
int Sequential_Search(int *a, int n, int key) {
    for (int i = 1; i <= n ; i++) {
        if (a[i] == key) {
            return i;
        }
    }
        
    return 0;
}

也可以使用添加“哨兵”的方式进行优化,数组的第一个元素空置:

int Sequential_Search2(int *a, int n, int key) {
    int i;
    //设置a[0]为关键字值,称为'哨兵'
    a[0] = key;
    //循环从数组尾部开始
    i = n;
    while (a[i] != key) {
        i--;
    }
    //返回0,则说明查找失败
    return i;
}

由代码可以看出,顺序表查找的时间复杂度为O(n),一般适用于小型数据查找。

有序表查找

折半查找

有序表的查找可以使用折半查找,也就是二分查找,它的前提是线性表中的记录必须是关键码有序,线性表必须采用顺序存储。折半查找的基本思想是:在有序表中,取中间记录作为⽐较对象,若给定值与中间记录的关键字相等则查找成功;若给定值⼩于中间的记录关键字,则在中间记录的左半区继续查找;若给定的值⼤于中间记录的关键字,则在中间记录的右半区继续查找;不断重复以上的过程,直到查找成功,或所以查找区域无记录,查找失败为⽌。代码实现如下:

//假设数组a,已经是有序的(从小到大)
int Binary_Search(int *a, int n, int key) {
    int low, high, mid;
    low = 1;
    high = n;
    
    while (low <= high) {
        mid = (low + high) /2;
        if (key < a[mid]) {
            //若key比a[mid] 小,则将最高下标调整到中位下标小一位;
            high = mid - 1;
        } else if (key > a[mid]) {
             //若key比a[mid] 大,则将最低下标调整到中位下标大一位;
            low = mid + 1;
        } else {
            //若相等则说明mid即为查找到的位置;
            return mid;
        }
    }
    
    return 0;
}

由代码可以看出,二分算法的时间复杂度为O(logn)

插值查找

插值查找是根据要查找的关键字key与查找表中最大最小记录的关键字比较后的查找方法,是对折半查找进行优化。其核心公式如下:

mid = low + \frac{key - a[low]}{a[high] - a[low]} \left( high - low\right)

其时间复杂度也为O(logn)。但是对于关键字分布比较均匀的查找表来说,插值查找算法的平均性能要比折半查找好得多。

斐波那契查找

使用斐波那契查找,首先要生成一个斐波那契数列的数组。

F[0]=0;
F[1]=1;
for(i = 2; i < T_MAX_SIZE; i++) {
    F[i] = F[i-1] + F[i-2];
}

斐波那契查找的核心如下:

  • 当查找key == a[mid]时,查找就成功
  • key < a[mid]时,新范围是第low个到第mid-1个,此时范围个数为F[k-1] - 1
  • key > a[mid]时,新范围是第m+1个到第high个,此时范围个数为F[k-2] - 1

查找代码如下:

int F[T_MAX_SIZE];

int fibonacciSearch(int *a, int n, int key) {
    int k = 0;
    while (n > F[k] - 1) {
        k++;
    }
    
    for (int i = n; i < F[k] - 1; i++) {
        a[i] = a[n];
    }
    
    int low = 1;
    int high = n;
    int mid;
    while (low <= high) {
        mid = low + F[k-1] - 1;
        if (key < a[mid]) {
            high = mid - 1;
            k = k - 1;
        } else if (key > a[mid]) {
            low = mid + 1;
            k = k - 2;
        } else {
            return mid <= n ? mid: n;
        }
    }
    
    return 0;
}

由代码可知,斐波那契查找的时间复杂度为O(logn),但是平均性能来说,斐波那契查找要优于折半查找。

三种有序表查找的核心公式如下

  1. 折半查找

    mid = \frac{low + high}{2}

  2. 插值查找

    mid = low + \frac{key - a[low]}{a[high] - a[low]} \left( high - low\right)

  3. 斐波那契查找

    mid = low + F[k-1] - 1

线性索引查找

索引就是把一个关键字与它对应的记录相关联的过程。所谓线性索引就是将索引项集合组织为线性结构,也称为索引表。常见的线性索引分为:稠密索引、分块索引、倒排索引。

  • 稠密索引是指在线性索引中,将数据集中的每个记录对应一个索引项
  • 分块索引是把数据集的记录分成了若干块
  • 倒排索引即通过属性值来确定记录的位置

参考文献:

  • 大话数据结构
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容

  • 查找 查找表是由同一类型的数据元素(或记录)构成的集合。关键字是数据元素中某个数据项的值,也称为键值,用它可以标识...
    keeeeeenon阅读 1,963评论 0 3
  • 目录一.查找概论1.概念:2.查找表按照操作方式来分有两大种:静态查找表和动态查找表3.面向查找操作的数据结构称为...
    Movle阅读 383评论 0 1
  • 基本概念 仅存储数据而不获取数据是不可能的,这就是查找。查找的定义如下: 查找(Searching)就是根据给定的...
    大大纸飞机阅读 1,383评论 0 1
  • 在java中,我们常用的查找有四种: 顺序(线性)查找 二分查找/折半查找 插值查找 斐波那契查找 1、线性查找 ...
    Patarw阅读 179评论 0 0
  • 文章共分为三篇 第一篇:数据结构 -《大话数据结构》读书笔记(1) 一、数据结构绪论二、算法三、线性表 第二篇:数...
    Q以梦为马阅读 1,848评论 3 13