可以从两个方面来评价搜索的质量:
召回率(recall):在查找所搜索的每一个事物方面表现如何
精度(precision):是否擅长根据结果与查询的相关程度来组织结果
可以简单理解为查找的范围和准确度。
使用受控词汇表,手动添加关键词等,可以改善召回率。
搜索的相关度与其出现的位置有关。下面是相关度由高到低的排列:
(1)顶级标题
(2)URL或某个<h1>标签中
(3)文档标题
(4)文档正文(按顺序或者不按顺序)
搜索相关性设计是搜索的3个主要目标(快速、容易和神奇)之间的一种精妙平衡。
搜索不是一次性的,要想维护好的相关性,这高度依赖于你不断地投入来优化引擎和算法。刚开始可以让主题专家评判你的结果的相关性。开始搜索之后,可以考虑结合使用情况作为反馈来调整相关性。
搜索除了内部的召回率和精度之外,表现层也有相应的需求,就是快速、容易、神奇。
搜索必须快速
快速是指什么:
(1)人们只花一秒时间搜索
(2)人们希望只花一秒时间搜索
具体要求:
(1)必须能很快检索到结果
(2)必须快速加载结果
特别是在有图片或在其他内容的情况下,快而丑胜过慢而美
(3)必须可以浏览结果
搜索速度,就是用户感觉搜索有多快,其中一个方面是你能以多快的速度理解结果,如果你不得不非常费劲才能得出哪些是有用信息而哪些是没用的信息,这就说明搜索速度很慢。
搜索必须易于人们使用
尽管输入框外观和简单,但对于大多数人来说,完成搜索却相当困难。因为,很难知道如何寻找你想找的东西。
要让搜索“容易”有3个简单步骤:
(1)利用查询建议工具等清晰度工具来帮助用户克服“查询阻塞”
(2)使用解岐工具,如垂直搜索和best bet
(3)最后,要给出答案,让用户体会到神奇之处,而不只是链接到可能包含答案的页面。
查询建议工具有提前键入、google建议、自动填充等
有没有遇到这样的情况,你开始在查询中键入搜索词,但是输入一个词之后停了下来,因为你不知道还要增加什么词,搜索引擎会注意到这一点,并把这作为你需要帮助的信号,不可思议地将建议显示在搜索框下面。
垂直搜索也就是分类筛选
best bets:长尾理论,根据最常用的搜索,将该结果的优先级提高
搜索必须神奇
比如你问今天穿什么衣服,可以会在结果中直接显示今天的天气情况,或者附近有什么演出和活动等。
个性化搜索
如果无法依赖于用户提供的更进一步的信息,搜索引擎智能参考几个方面来明确你的搜索意图:
(1)查看你的搜索历史,并通过你已经做的事情对你有更多的了解
(2)查看你目前所从事的查询的上下文,希望从中能得出一些线索,了解你爱查找什么(垂直搜索或先前的查询)
(3)如果你对你和社会、地理和人口统计环境有所了解,搜索引擎可能希望这个环境中的考虑存在一些相同点,至少存在某些共同的兴趣和意愿。
推荐
推荐首先确定哪些用户最有共同点,然后向你推荐那些类似用户已有而你没有的东西。