当前技术:★★★★✰
未来潜力:★★✰✰✰
应用落地:★★★★✰
说到人工智能AI,可能很多人会想起来的就是推荐算法,毕竟电商是互联网时代的一个重要标志。推荐算法从AI算法层面来说技术含量不高,更花力气的也是后台数据库的建立。
推荐算法主要应用在两种地方,一种是购物,“猜你要买”,各类电商都是。一种是内容,“猜你喜欢”,今日头条,视频网站(优酷,抖音等),豆瓣等都有。
推荐算法最初产生的原因非常直白,对电商来说就是希望用户够买更多的东西,对内容产生商来说希望你能在他们的网站逗留更长时间,可以完成他们自己定为KPI的东西,PV,留存率等。再某种意义上推荐合适的物品和内容帮助用户节约了时间,但是同时推荐算法也造成了信息过载。
常见推荐规则和算法
推荐算法最常见的是物品相似和用户共同喜好相似。
拿最初亚马逊卖书举例,物品相似就是如果你购买或者搜索了某一本书,它会根据之前提取的该书的特征,比如作者,图书分类,推荐同一作者或同一门类的其他图书给你。其实一个简单的基于规则推荐系统效果已经很惊艳了,而且这种推荐一般不会出来你完全不感兴趣的东西。
通过比较用户相似做的推荐就稍有趣一点,基本原理是A用户和B用户的购买记录和行为类似,归为同类客户,那么A用户记录里买过ab两本书,B目前只买了a一本书,那系统就可能把b那本书也推荐B用户。这种规则能发现一些潜在的兴趣点,但由于分类的问题,也可能推荐出你完全不感兴趣的东西。
用户共同喜好原理的一个延申是用户画像。购物网站会记录用户的一系列行为形成数据链记录:登录,搜索、浏览、选择商品、页面停留时间、评论阅读、是否关注促销,以及加入购物车、下订单、付款、配送方式,最终是否有售后和返修。通过行为提炼或者通过三方数据库,年龄、性别、地域、购物习惯,是否已婚,是否有孩子,对促销是否敏感等都被记录在用户画像上。
早期的这两种方法实现都基于规则设置,做一些数据挖掘,根据挖掘结果设置一些规则。这些规则都是易于理解的,就像在书店,书会按照门类或者作者陈列。
推荐算法里还有一种思路接近搜索算法,根据用户搜索记录的关键字,推荐和这些关键字相关的其他搜索结果中的物品。
亚马逊率先推出协同过滤思想,之后电商都是采用几种算法共同作用的结果,除了以上三种,常见的还基于一些用户行为的假设,比如:
曾经浏览过但没有下单的物品
按照周期性推荐,比如洗衣粉,纸巾等。
推荐一些卖得好的流行品
所以推荐算法和其他机器学习相关的算法不太一样,早期通过规则,用户行为研究等已经取得了不错的效果,机器学习时代带来了一些算法工具,比如使用Apriori和FP-Growth算法进行关联分析,但本质上的改变并不大,但因为机器学习算法能处理的数据量大大增加,对计算能力要求变高,所以在推荐算法领域也又很多关于大数据存储,离线计算,计算实时性等的技术领域。
内容推荐算法的本质和电商推荐差不多,但内容推荐要考虑内容场景自身的特点,比如内容投票与等于电商的购买行为,但是也又可能用户不投票,那就要通过用户阅读/观看时长,是否转发等加权计算。另外内容生产商可能还知道用户的好友,可能通过用户的好友产生一些参考数据来推测你的喜好。
推荐算法的反思
推荐算法最有趣的地方是它的评价标准,商家致力于发现你的“潜在需求”,让你买更多东西,或者在内容网站上逗留更长时间。
而人最珍贵的生命,组成单位就是时间,从过好自己的人生的角度,就不应该放任自己的欲望,买太多东西,或者沉迷手机,这种被动接受连绵不断的流式信息的方式使人容易丧失主动思考的能力,因为太多东西是“端”到面前的的而不是人主动寻找的。
技术本性没有邪恶,了解推荐算法,主动把它当作自己的工具来用而不是被推荐算法牵着生活是人比较好的选择吧。
个人职业选择
推荐算法相关的职业还是相当多的,门槛也不高,可以作为其他行业进入AI行业的一个跳板,电商相关的容易进一些。如果真想在人工智能有所突破,最好还是选其他项目。