了解机器学习(深度学习)的几个特点

机器学习(深度学习)跟编程范式以及处理的数据等方面根传统的编程有较大不同,需要学习或准备转型做这个领域的需要引起足够的关注。

1、编程范式

在经典的程序设计(即符号主义人工智能的范式)中,人们输入的是规则(即程序)和需要根据这些规则进行处理的数据,系统输出的是答案 (见下图)。


图1-1

利用机器学习,人们输入的是数据和从这些数据中预期得到的答案,系统输出的是规则或者叫模型。这些规则随后可应用于新的数据,并使计算机自主生成答案。
机器学习系统是训练出来的,而不是明确地用程序编写出来的。将与某个任务相关的许多示例输入机器学习系统,它会在这些示例中找到统计结构,从而最终找到规则将任务自动化。这一点与人类思考类似,看下图人类解决问题的思路:


图1-2

可以看出,机器学习处理的是数据,通过学习输入的数据,从而建立模型,以便预测新的数据都输出。

2、数据

在处理的数据方面,传统的编程处理的数据往往都是简单的数据或存在数据库里的关系型数据,经常的操作是对数据的增删改查(CRUD)操作,而机器学习(深度学习)处理的数据一般都是很大的数据,经常把它叫做数据集,为了高效处理这些数据,我们需要用到向量、矩阵或多维数组来存储和表达。这也是准备学习或转型到向量的同仁需要注意的,所以,你需要了解、熟悉并习惯使用多维数组来进行数据存储、变换。这里列举一下,你可能会遇到的几类数据集:

  1. 向量数据:2D张量,形状为 (samples, features)。这是最常见的数据,对于这种数据集,每个数据点都被编码为一个向量,因此一个数据批量就被编码为2维张量(即向量组成的数组,即矩阵),其中第一个轴是样本轴,第二个轴是特征轴。例如在手写数字识别的例子中,一副28乘28像素的图片,展成一个向量就是一个784个像素的向量,如果有10000副这样的图片,就可以使用一个形状为(10000,784)的二维张量来表达。

  2. 时间序列数据或序列数据:3D张量,形状为(samples, timesteps, features)。当时间(或序列顺序)对于数据很重要时,应该将数据存储在带有时间轴的3D张量中。每个样本可以被编码为一个向量序列(即2D张量),因此一个数据批量就被编码为一个3D张量。例如,股票价格数据集,每一分钟,我们将股票的当前价格、前一分钟的最高价格和前一分钟的最低价格保存下来,因此每分钟被编码为一个3D向量,整个交易日被编码为一个形状为(390, 3) 的2D张量(一个交易日有390 分钟),而250天的数据则可以保存在一个形状为(250, 390,3) 的3D张量中。这里每个样本是一天的股票数据。


    图2-1
  3. 图像:4D张量,形状为(samples, height, width, channels)或(samples, channels,height, width)。图像通常具有三个维度:高度、宽度和颜色深度。虽然灰度图像(比如MNIST 数字图像)只有一个颜色通道,因此可以保存在2D 张量中,但按照惯例,图像张量始终都是3D 张量,灰度图像的彩色通道只有一维。因此,如果图像大小为256×256,那么128 张灰度图像组成的批量可以保存在一个形状为(128, 256, 256, 1) 的张量中,而128 张彩色图像组成的批量则可以保存在一个形状为(128, 256, 256, 3) 的张量中。


    图2-2
  4. 视频:5D张量,形状为(samples, frames, height, width, channels)或(samples,frames, channels, height, width)。视频数据是现实生活中需要用到5D张量的少数数据类型之一。视频可以看作一系列帧,
    每一帧都是一张彩色图像。由于每一帧都可以保存在一个形状为(height, width, color_depth) 的3D张量中,因此一系列帧可以保存在一个形状为(frames, height, width,color_depth) 的4D张量中,而不同视频组成的批量则可以保存在一个5D 张量中,其形状为(samples, frames, height, width, color_depth)。

读到这里可能有的同学会觉得有点晕了,就像一个习惯了舞枪弄棒的人,现在教你改用机枪和大炮,从使用冷兵器到使用热兵器,不习惯是必然的,但是学习曲线就是这样的陡!而你必须习惯,否则学习机器学习(深度学习)会比较吃力。

总之,一句话,机器学习(深度学习)大多数情况下处理的是多维数据,不管具体是几维。

3、工程性强

深度学习在理论上无法证明它为何有效,但是在实际问题上它的确有效,没有形成系统的理论。比如,各个深度学习模型为什么好用?原理本质是什么?各个模型都适用于什么场合?针对特定数据,特定问题,如何组合搭建模型,各个参数怎么选?如何根据特定模型,特定数据来训练模型?所以,机器学习(深度学习)领域工程性强,或者说实践性强。由于这一领域是靠实验结果而不是理论指导的,所以只有当合适的数据和硬件可用于尝试新想法时(或者将旧想法的规模扩大,事实往往也是如此),才可能出现算法上的改进。机器学习不是数学或物理学,靠一支笔和一张纸就能实现重大进展,这或许是人工智能一路曲折发展的一个因素。它是一门工程科学。

4、再谈维度

维度这个词语我们经常听到,在物理学上,认为我们生活的空间是个3维空间,加上时间,大家认为就是4维;但是在数学领域,可以由3维上升到N维空间,数学上的理解有所不同,有兴趣的可以查看2008年欧洲数学界的一个关于维度的专业讲解;在意识领域,也可以有多维的概念,在梁冬采访北大教授刘丰的视频中,刘丰讲到了生命的意义在于提升意识的维度,并说上升到4维就是宗教,而且说人类的智慧往往来自直觉,而直觉往往来自高维度的信息,有兴趣的可以参考这里。人工智能处理的数据,从数学上讲就是高纬度的数据,是否人类在人工智能的努力方向正在解开高纬度的秘密?高维度是否打开了通往智慧、通往上帝之门?这里只是做点延展。

以上就是学习机器学习(深度学习)需要注意的几点,供大家参考和讨论。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342