240 发简信
IP属地:北京
  • 120
    坑系列 --- 高可用架构的银弹

    呵呵,题图是一队困在坑中的鸭子:)作为一个搬砖的,我经常被困着。今天高考,想起15年前的今天(哦,那时候是七月高考),恩,考完了,还不错,然而15年后还是搬砖:) 0. 承上...

  • 120
    坑系列 --- 重构过程中的过度设计

    这个系列是坑系列,会说一些在系统设计,系统架构上的坑,这些都是我想到哪说到哪,有像这篇一样比较宏观的坑,后面的文章也会有到具体技术细节的(比如某个函数,某个系统调用)坑,总之...

  • 面壁人VS智子 --- 搜索排序的作弊与反作弊

    搜索引擎已经是目前网络流量最大入口,在大搜上,基本上大家打开网页做的第一件事情就是打开一个搜索引擎,然后键入你感兴趣的内容,然后开始浏览。如果是个电商的网站,你打开以后,基本...

  • 120
    搜索引擎 --- 论长尾词

    今天的标题是论长尾词,长尾词是什么?在百度百科上,长尾词解释是:非目标关键词但也可以带来搜索流量的关键词。这是一个明显的SEM的长尾词解释,简单来说,长尾词就是那些个每天搜索...

  • 120
    搜索引擎(0xFE) --- 用机器学习再说搜索排序

    前面说排序的时候已经简单了说了一下排序的方法,包括三部分:相关性排序,商品本身的属性排序,个性化排序,无论怎么排,大体上都逃不掉这三项。 最近看到一篇文章[有赞搜索引擎实践(...

  • 用Golang写一个搜索引擎(0xFF)--- 搜索排序

    今天这一篇的序号是0xFF,算是外篇吧,和Golang没什么关系,和代码也没什么关系,今天说说搜索引擎的排序吧。 一个标准的搜索引擎有三个最重要的部分,爬虫,检索,排序。 爬...

  • 用Golang写一个搜索引擎(0x05)--- 文本相关性排序

    上面我们已经说过了一些倒排索引的东西,并且也知道了如何来实现一个倒排索引完成检索功能,那么检索完了以后如何排序呢,这一篇简单的说一下倒排索引的文本相关性排序,因为排序实在是太...

  • 120
    用Golang写一个搜索引擎(0x06)--- 索引构建

    不知不觉写到第六篇了,按这个节奏,估计得写到15到20篇左右才能写完,希望自己能坚持下去,之前写代码的时候很多东西并没有想得那么细致,现在每写一篇文章还要查一些资料,确保文章...

  • 用Golang写一个搜索引擎(0x02)--- 倒排索引技术

    这一篇,我们来说说搜索引擎最核心的技术,倒排索引技术,倒排索引可能需要分成几篇文章才说得完,我们先会说说倒排索引的技术原理,然后会讲讲怎么用一些数据结构和算法来实现一个倒排索...

  • 120
    用Golang写一个搜索引擎 (0x04) --- B+树

    前面两章介绍了一下倒排索引以及倒排索引字典的两种存储结构,分别是跳跃表和哈希表,本篇我们介绍另一种数据结构,他也被大量使用在信息检索领域,我在github上实现的搜索引擎的词...

  • 120
    用Golang写一个搜索引擎(0x03)--- 跳跃表,哈希表

    前面已经说了倒排索引的基本原理了,原理非常简单,也很好理解,关键是如何设计第二个倒排表,倒排表的第二列也很好设计,第一列就是关键了,为了满足快速查找的性能,设计第一列的结构,...

  • 120
    用Golang写一个搜索引擎 (0x01)--- 基本概念

    第零部分我们已经列了一个提纲了,这一篇文章开始要详细说说了。 搜索引擎基本概念 在说搜索引擎架构分层之前,我们先确定几个搜索引擎的概念。 文档,搜索引擎的基本数据单元,比如一...

  • 用Golang写一个搜索引擎 (0x00)

    很早就想写一系列的这样的文章了,之前在一个电商公司做搜索,对搜索引擎有一些认识,来到一个新的创业公司以后非常高兴还有机会继续做这方面的事情,虽然领域已经变了,而且不是做搜索了...