搜索意图识别:
Query分析:
- 分词:切词,pinyin分词
- 查询类目预测:
Query改写:
Query改写本质上是要找到和原始Query相似的候选Query,候选Query来自用户搜索query日志清洗过滤得到。如何找相似Query呢?
- 基于Query内容:
- 1.基于文本相似度,基于编辑距离(字或词),基于拼音
- 2.基于同义词
- Co-Click基于用户点击行为:
- query-doc协同过滤
- 基于随机游走的方法,simrank,simrank++
- Co-Session基于用户同一个时间段的连续操作:
- 基于session embedding
参考:
http://xudongyang.coding.me/query-rewrite/
https://zhuanlan.zhihu.com/p/27850493
https://blog.csdn.net/madman188/article/details/51853947
https://www.cnblogs.com/a-du/p/9709171.html
https://tech.youzan.com/you_zan_searchengine2/