精简版机器学习与数据挖掘原理-来自一google的实习生

芒果购物

假设你有一天去芒果购物。供应商已经布置了充满芒果的车子。您可以选择芒果,供应商会称重它们,您按照每公斤固定的卢比(印度的典型故事)支付费用。显然,你想为自己挑选最甜蜜,最成熟的芒果(因为你是通过体重而不是质量的)。你如何选择芒果?

你还记得你的祖母说明亮的黄色芒果比淡黄色芒果甜。所以你做一个简单的规则:只从明亮的黄色芒果中挑选。你检查芒果的颜色,选择明亮的黄色,付钱,回家。美好的结局?

不完全的。

生活很复杂

假设你回家并品尝芒果。其中一些不喜欢你喜欢的。你很担心 显然,你的祖母的智慧是不够的。芒果不仅仅是颜色。

经过很多的思考(品尝不同类型的芒果)后,你得出结论,明亮的黄色芒果保证是甜蜜的,而较小的明亮的黄色芒果只有一半的时间是甜蜜的(即如果你买了100个明亮的黄色芒果,其中50个是大的,50个是小的,那么50个大芒果一切都会很甜蜜,而在50个小人物中,平均只有25只芒果会变甜。

你对你的发现感到满意,下次你去芒果购物时,请记住。但下一次在市场上,你看到你最喜欢的供应商已经离开了城市。您决定从不同的供应商那里购买,谁供应来自该国不同地区种植的芒果。现在,你意识到,你学到的规则(那个大而明亮的黄色芒果是最甜蜜的)不再适用。你必须从头开始学习。你从这个供应商那里品尝到各种芒果,并意识到,小而淡黄色的,其实是最甜蜜的。

现在,一个遥远的表亲来到另一个城市。你决定用芒果治疗她。但是她提到她不关心芒果的甜蜜,她只想要最多汁的。再一次,你经营你的实验,品尝各种芒果,并意识到更柔软的芒果更多汁。

现在,你转移到世界不同的地方。在这里,芒果的味道与您的祖国不同。你意识到,绿色芒果其实比黄色芒果好。

你嫁给一个讨厌芒果的人。她喜欢苹果。你去苹果购物。现在,你所有积累的关于芒果的知识是毫无价值的。您必须通过相同的实验方法,了解苹果的身体特征和味道之间的相关性。你这样做,因为你爱她。

进入计算机程序

现在,假设所有这一切,你正在编写一个计算机程序来帮助你选择你的芒果(或苹果)。你会写下面的规则:

如果(颜色鲜艳黄色,大小很大,最喜爱的卖家出售):芒果很甜。

如果(软):芒果多汁。

你会使用这些规则来选择芒果。你甚至可以给你的弟弟提供这个规则列表来购买芒果,你会放心,他只会选择你选择的芒果。

但是,每次您从实验中做出新的观察,您必须手动修改规则列表。你必须了解影响芒果质量的所有因素的错综复杂的细节。如果问题变得足够复杂,手工制定准确的规则可能会变得非常困难,涵盖所有可能的芒果类型。您的研究可以为您获得芒果科学博士学位(如果有)。

但并不是每个人都有这样的时间。

进入机器学习算法

ML算法是一种比普通算法进化的过程。它们使您的程序“更智能”,允许他们自动学习您提供的数据。

你随机选择市场上的芒果样本(训练数据),制作每个芒果的所有物理特征的表格,如颜色,大小,形状,种植在哪个国家的哪个供应商等等( 功能),以及芒果的甜蜜,多汁,成熟(产出变量)。您将这些数据提供给机器学习算法(分类/回归),并且学习一个平均芒果的身体特征与其质量之间的相关性模型。

下次您进入市场时,您可以测量销售芒果的特征(测试数据),并将其提供给ML算法。它将使用前面计算的模型来预测哪些芒果是甜美,成熟和/或多汁的。该算法可以内部使用类似于您先前手动编写的规则(例如, 决策树)的规则,或者可能会使用更多涉及的内容,但是您不必在很大程度上担心这些规则。

Voila,您现在可以非常信心地购买芒果,而不必担心如何选择最好的芒果的细节。此外,您可以使您的算法随着时间的推移而得到改进(强化学习),以便在读取更多的训练数据时提高准确性,并在错误的预测时进行修改。但最重要的是,您可以使用相同的算法来训练不同的模型,一种用于预测苹果,橘子,香蕉,葡萄,樱桃和西瓜的质量,并保持所有亲人的快乐:)

而且,是机器学习为你。是不是很酷

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,580评论 18 139
  • 花谢花开花开花谢花开 相识相遇相知 但不能相爱 窗里窗外窗外窗里窗外 醉后嘴后最...
    定义自己阅读 205评论 0 0
  • 今天班上遇到一个中老年男性病人,腰疼,他说疼到晚上睡不着觉。旁边一位陪家属看病的男性和他聊了起来,告诫他腰疼就要注...
    常潇常阅读 259评论 4 0
  • 一向不爱看工具类书籍,不是过于自信,而是觉得这类书籍有点功利,就像在教导人们如何通过学习模仿就能走向人生巅峰一样,...
    夜未央mm阅读 653评论 0 6
  • 我父母勤俭,家境小康,珍惜所有,坐火车去探亲,他们买一双新鞋给我,我好喜欢,左擦右拭, 我父母早亡,流落街头,三餐...
    舒己怀_Frank阅读 679评论 4 4