模糊工具搭建推荐系统综述

综述

摘要

推荐系统当前是成功的解决方案,可帮助在线用户访问在过载的搜索空间中符合其偏好和需求的信息。 在最近几年中,已经开发了几种方法来改善其性能。 本文的重点是针对在推荐系统中使用模糊工具的问题进行综述,以检测更常见的研究主题以及研究差距,从而为促进基于模糊的推荐系统当前的发展提出未来的研究方向。 具体而言,本文针对这些目标的论文进行了分析,并根据其关键特征,评估策略,采用的数据集和应用领域在汤森路透Web of Science数据库中进行了索引。

简介

推荐系统是用于实现个性化过程以向用户提供最适合他们的喜好和信息需求的信息资源的最常用范例之一。 即使最初设想它们涵盖电子商务领域[106,113],但如今它们已成功地扩展到各种场景,例如电子学习[147],旅游业[95],图书馆[146],电子政务[ 77],金融投资[89]和其他应用领域[76]。

根据用于生成推荐的可用信息,推荐系统可以分为不同的推荐范式。 最初,人口统计方法是最重要的方法,因为可以获得这样的信息,但是最近两个主要的推荐范例是基于协作过滤的推荐[94]和基于内容的推荐[34]。

  • 协作过滤系统只能使用用户的等级来生成建议,而无需其他信息。 在其最基本的方法[37,106]中,协作过滤的重点是向目标用户建议那些具有相似偏好模式的其他用户已经偏爱的项目。
  • 基于内容的推荐侧重于使用用户评价之外的其他信息(例如项目的属性)来表征项目,因此建议与用户过去喜欢的项目具有类似特征的项目 。

除了先前的范式,几位作者还参考了其他范式,例如社交,基于知识或混合过滤[21],具体取决于生成推荐的技术和信息。

简要分析此类范例的工作原理可以证明,用户的偏好在推荐过程中起着主要作用。 因此,自90年代以来,已经进行了大量的研究来管理用户的偏好以及其他用户和商品的信息,以获得准确的建议[21,41]。 此类研究得到了来自相关研究领域(例如用户建模,信息检索,计算智能或机器学习)的基础的成功支持。 在某些情况下,它们对推荐系统的贡献是从头开始的。

我们的兴趣集中在推荐系统中使用的软计算技术,主要是基于模糊的技术[152]。 最近对推荐系统和个性化的评论[21,41]显示了管理推荐系统中不确定性的相关方法(见图1),例如贝叶斯方法[33],马尔可夫模型[111],模糊方法[152] ],遗传算法[47]或神经网络[137]。

Fig 1:推荐系统开发中的软计算方法

为了评估此类技术在推荐系统中的相关性,2016年10月在汤森路透的Web of Science(核心收藏)中进行了搜索。搜索旨在结合使用此类技术来管理不确定性,并进行相关研究。 推荐系统中的传统范例,例如基于协作过滤,基于内容或基于人口统计的内容。 所获得的结果如图5所示,这表明有必要进行深入研究,重点是评估当前使用模糊逻辑工具改善推荐系统性能的最新技术水平。 tems。 因此,本文致力于实现这一目标。

因此,有必要提及的是,即使已经开发了一些针对推荐系统的调查论文,都涉及广泛的观点(Adomavicius和Tuzhilin [3],Konstan和Riedl [65],Bobadilla等。 [21]),并且还专注于特定领域(Campos等人[23],Klasˇnja-Milic´evic´等人[63],Abbas等人[1],Martinenez等人[83])。 ),根据我们的最佳知识(2016年10月),本论文是致力于将所有研究工作集中在模糊工具支持的推荐系统上的第一项工作。

本文的结构如下。第2节简要介绍了推荐系统和模糊工具,并详细介绍了基于内容的协作过滤建议。第三节介绍了用于获得要考虑的研究作品的调查方法。贡献的主要部分在第4节中进行了分析,根据构建推荐器系统的典型技术,通过分析推荐器系统中模糊工具的发展,并根据它们所基于的核心方法进行了分组。第5节指出了为当前发展提供连续性的未来研究方向。第六部分总结了论文。

审查推荐系统中的模糊工具

4.1 使用模糊工具的基于内容的推荐方法

4.1.1 提案

此外,他们使用半三角模糊数来表示用户与某项商品相关的正面体验的程度。 该函数在Ii,Min和Max上分别为最小和最大额定值的定值r∈[Min,Max],并且表示关注度的模糊集定义为:

因此,将用户喜欢的一组项目E定义为E = Ii:μA(Ii)> 0.5。

最后,他们提出了几种汇总偏好以计算推荐置信度得分的方法,例如加权总和,最大值和最小值。 等式 (8)给出了加权和策略,其中E是优先项的集合,μE(Ik)是项k到E的成员关系.S(Ij,Ik)是Ij和Ik之间的相似性:

通过这种方式,几位作者已经开展了类似的研究,例如从模糊集[50]支持的CBRS评级值中灵活选择用户偏好学习模型,以及一些受生物启发算法(例如粒子群优化[136])支持的方法。 了解各种功能的用户权重。 这里值得一提的是,基于标记的用户配置文件方法的发展,用于改进建议[9],其中用户配置文件是通过基于民俗分类法的方法建立的,该方法根据隶属度评估项目的各种属性值,然后使用 计算模糊的用户配置文件。 此外,在最近几年中,关于使用模糊工具对CBRS中的特定项目的特征进行建模的进一步工作已经开发[2、5、14、69、96、99、104、126]。

4.2 使用模糊工具的基于内存的协同过滤方法

4.2.1 提案

在该推荐范例中,用于比较用户/项目的相似性功能(参见图2)以及汇总邻居偏好的方法一起发挥了重要作用,以获得最终推荐。 这样,图11给出了关于如何使用模糊方法开发这些组件的综合概述。 具体来说,本节着重介绍三组贡献:

1)仅使用评分值的协作过滤;

2)人口统计信息和项目属性,以改进基于内存的协作过滤推荐;

3)将信任值放入典型推荐方案中。

仅使用首选项进行协同过滤。 表2列出了仅使用评级值执行协作过滤的方法的详尽分析。 下面突出显示了此类作品的最重要贡献。

Aguzzoli等。 [4]提出了一种基于模糊逻辑的协作过滤方法,该方法显示了多值逻辑足够灵活地执行协作过滤,基于内容的混合推荐系统。

除了这项第一项工作外,与基于内存的协作过滤有关的大多数研究都集中于提出用户或项目之间的新相似性度量(请参见图2),这些度量或度量通过使用扩展了典型度量(例如Pearson和余弦[3])。 模糊的概念。 具体来说,我们的调查方法检测到Al-Shamri和Al-Ashwal [6],Castellano等。 [24],Cheng and Wang [30],Cornelis等。 [32],Reformat and Yager [105],Wang等。 [134],Zhang等。 [155]和Zhang等。 [154]集中于此目的,仅使用偏好值而没有任何附加信息。

评价

New method to measure triangular fuzzy number, applied in collaborative filtering

一种测量三角模糊数的新方法,应用于协同过滤

其他论文评价

Fuzzy recommender system based on the integration of subjective preferences and objective information. The preferences are presented through a fuzzy linguistic model

基于主观偏好和客观信息整合的模糊推荐系统。 通过模糊语言模型表示偏好

未来发展方向

前几节讨论了研究工作发展中的几个弱点,这些弱点集中在推荐系统中使用模糊方法。 这些弱点显示出一些研究空白,可以看作是未来的发展趋势,也是基于模糊推荐的挑战。 具体来说,我们确定了在未来的将来应该扩展的四个挑战性领域,以便更好地挖掘模糊工具以提高推荐系统的性能:

  • 用于在推荐系统中进行进一步搜索的模糊通用框架。 以前,我们已经引用了[117,134,152]之类的几本著作,为这一目标做出了重要贡献,但是由于它们缺乏与典型推荐场景相关的概括性,因此只能部分解决该问题, 在其他情况下,使用模糊工具的灵活性不足以代表用户偏好。 另外,由于没有明确的参考依据,缺乏通用框架意味着新兴研究只是重现以前的结果。
  • 评估方案侧重于模糊推荐系统。 尽管许多修订过的论文使用公开的知名数据集评估了他们的建议,但仍有一些作品需要收集自己的数据,并且还没有进行任何实验评估。 在许多情况下,要么由于缺乏可以直接应用模糊方法的合适数据集,要么由于不了解它们的好处而发生了这一事实。
  • 新的模糊方法侧重于推荐系统的新趋势。 为了改善对与此类问题相关的不确定性的管理,有必要将模糊处理用于解决新兴问题,例如小组推荐,情境感知推荐或自然噪声管理。
  • 新的模糊方法侧重于使用紧急信息源。 这样,尽管这项调查表明,已经开发了一些在新兴资源(例如社交网络信息,标签系统或复杂项目(例如树状项目))中考虑模糊支持的不确定信息管理的工作。 ,则需要朝这个方向做进一步的工作。 总体而言,有必要的建议可能会成为后续研究的起点。

总结

这项调查分析了一百多篇论文,这些论文专注于使用模糊技术来支持推荐系统。首先,根据三种不同的推荐范例(基于内容,基于内存的协同过滤和基于模型的协同过滤)将这些论文分为三大类,另外还包括几个与相应工作中使用的核心计算方法有关的子类。之后,通过考虑其主要特征,评估策略和应用领域,对每种贡献进行了详尽的分析。特别是,它包括对在其相应子组内被确定为相关作品的更深入分析。

最终指出了模糊推荐系统的未来研究途径,主要集中在通用框架的开发,基于模糊信息管理的推荐系统为中心的评估方案的开发以及新兴信息源新方法的开发(例如社交网络)以及解决推荐系统研究中的新问题(例如小组推荐,自然噪声管理)。

我们希望这种适度的调查对推荐系统研究界有用,作为对与模糊工具支持的推荐系统开发相关的新兴研究领域做出进一步贡献的起点。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容