李智慧:从0开始学大数据(1~2)

为什么软件工程师都应该懂大数据技术?

软件编程技术出现已经半个多世纪了,核心价值就是把现实世界的业务操作搬到计算机上,通过计算机软件和网络进行业务和数据处理。

人类拥有了更为高效的存储,更快速的信息传递网络和计算设备。

举例说明一下
让你一个月在家里呆着不出门,然后可以衣食无忧。
吃喝:美团,饿了吗,京东到家,跑腿
玩乐:游戏,抖音,奈非,直播

人们与现实世界的连接会越来越少。

大数据技术和机器学习技术,也就是后来我们都耳熟能详的人工智能 AI 技术。

Google的AlphaGo,大数据 + 机器学习

他们并不管工程师叫工程师,而是叫“僧侣”;也不管核电站叫核电站,而是叫“圣殿”;维修也不是叫维修,而是叫“祈祷”。

用阿西莫夫的《基地》中的情节来得出“你看,科学和宗教并不是互斥的,科学也可以成为宗教,当人们面对自己不懂的东西的时候,会倾向于用宗教的原理去解释。”有点不合适,《基地》中的情节是想象出来的,不是事实。

必须能够发掘出用户自己都没有发现的需求,必须洞悉用户自己都不了解的自己。

数据会越来越成为公司的核心资产和主要竞争力,公司的业务展开和产品进化也越来越朝着如何利用好数据价值的方向发展。

同理,数据会成为每个人的核心竞争力。处理数据,并得出有价值的结论会让你的过去的积累更为值钱。

如果未来是面向AI编程的,希望软件工程师不要把AI 当做什么万能的东西。

大数据技术发展史:大数据的前世今生

今天我们常说的大数据技术,其实起源于 Google 在 2004 年前后发表的三篇论文,也就是我们经常听到的“三驾马车”,分别是分布式文件系统 GFS、大数据分布式计算框架 MapReduce 和 NoSQL 数据库系统 BigTable。

GFS
https://static.googleusercontent.com/media/research.google.com/zh-CN//archive/gfs-sosp2003.pdf

MapReduce
MapReduce: Simplified Data Processing on Large Clusters – Google AI

BigTable
Bigtable: A Distributed Storage System for Structured Data – Google AI

我们所开发的软件价值点在哪里?

阿里巴巴的TFS
https://github.com/alibaba/tfs

大数据处理的主要应用场景包括数据分析、数据挖掘与机器学习。数据分析主要使用 Hive、Spark SQL 等 SQL 引擎完成;数据挖掘与机器学习则有专门的机器学习框架 TensorFlow、Mahout 以及 MLlib 等,内置了主要的机器学习和数据挖掘算法。

思考题
你从大数据生态的发展史中,能得出什么样的结论?又有怎样的思考?

欢迎你写下自己的思考或疑问,与我和其他同学一起讨论。

大数据生态的发展史?

这让我想到陶器和瓷器的发展
瓷器没有出来之前,人们都是试用陶器作为盛器,陶器制作过程比较简单,将黏土,陶器是黏土在温度下烧制而成,在没有发现高岭土和炉温达到1200度之前,一直是使用的是陶器。

在未来处理数据的速度就像炉温,每当处理速度上升了一个新的量级,就会产生完全不同的东西出来。

互联网运营数据指标与可视化监控

数据驱动运营

大数据包括的内容

技术和工具

  • 熟悉Hadoop、Hbase、 Kudu、Hive、 Spark、
    MapReduce、Kafka、 Storm、 Flink或Jstorm、
    ETL等相关技术或者工具至少3个以上

  • 精通Java、Python, 了 解数据挖掘、机器学
    习、并行计算相关理论

  • 模型构建

  • 熟悉数据库原理,对数据处理和数据质量有较深
    认识,有NoSQL数据库数据处理和数据处理性能
    优化经验;

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容

  • 今天谈一个严肃的话题,认真脸.jpg。 青年危机,也叫四分之一人生危机,Quarter-life Crisis,伴...
    至善叔叔阅读 375评论 0 0
  • 诗意的栖居在这深山老林, 阳光明媚人们热情而友好。 早起刷牙洗脸去吃了早点, 随铃声一响慢慢的去读书, 读碎了中文...
    鸣愿阅读 216评论 0 8
  • 相遇是那么的不经意,心动来的那么轻易;我们的开始没有轰轰烈烈,只是无意间的眼神交错,就已逃不开了你的囚禁;惊奇惊奇...
    A区孩阅读 175评论 12 3
  • 很高兴点评战友(卢雅雯)的文章,写的真是太棒了! 肖申克的救赎,这部电影我也看了,但却没有你这么深的领悟。 读你的...
    超级赋能王张胜萍阅读 477评论 2 5
  • 人际关系 TV版动画延续了OVA的概念设定,讲述人与人相处和产生的摩擦间隙。故事花了很大篇幅讲述人物面对来自亲友的...
    空白_7阅读 853评论 0 0