嫌弃Hadoop?可能是你的打开方式有问题

关于 Hadoop 所谓的消亡，以及它跌落神坛的报道数不胜数。有很多人放马后炮说，Hadoop 从一开始就没有意义。还有人说“Hadoop 对于小型，临时的工作来说很慢”、“ Hadoop 很难”、“ Hadoop 已经死了，Spark 才是胜者”等等。那么事实真的如此吗?

如今围绕着 Hadoop 缺陷的争论和当初对其的大肆追捧一样激烈。

在这些喋喋不休的争论中，你可能已经得出结论，Hadoop 已经死了。个人认为这个想法虽然可以理解，但却是错误的。

TCP/IP

你听过 TCP/IP 吗？如果没有，相信我这是很强大的技术。实际上，你很喜欢TCP/IP ，你只是没有意识到。TCP/IP 不仅能驱动互联网，还能驱动电子邮件，甚至能驱动网络。当你使用各种应用程序，使用各种流媒体，以及打车、上网等等，这都受益于 TCP/IP，没有它你可能无法生活。

虽然你喜欢 TCP/IP，但是你对配置它不感兴趣。你不用输入 ifconfig 这样的命令，从而查看你的 WiFi 适配器是如何联网的。甚至你不用关心它附加的网关，以及它使用何种 DNS 服务器。

在 20 世纪 90 年代，TC/IP 曾被当做产品销售，结果不温不火。最终，TCP/IP 已被建立在操作系统中，如今到处都有它，TCP/IP 成为了普遍的标准。

Hadoop是基础设施

其实，Hadoop 就是大数据世界中的 TCP/IP。它是基础设施，同时也带来巨大的好处。但是，当基础设施暴露出来时，带来的好处就大大削弱了。Hadoop 像Web 浏览器一样被推广，但是它更像 TCP/IP。了解这一点时就会发现，推广 Hadoop 本身就不是个好主意。

如果你直接使用 Hadoop，那么你错了。如果你在命令行中输入“hadoop”和一些参数，那么你就在倒退。你是想自行配置和运行所有内容，还是只想使用数据，让分析软件在后端处理 Hadoop？

大多数人会选择后者，但大数据行业往往把客户导向前者。之前，行业是这么看待Hadoop…如今也将这么看待 Spark 和众多的机器学习工具。这是技术专家讨好商业用户的例子，这永远不会结束。

开发工具不等同于商业工具

业界并不是完全忽视这个问题，一些厂商已经在尝试改进 Hadoop 的不足之处。目前已出现 Hue、 Jupyter、Zeppelin 和 Ambari 等的开源项目，旨在让 Hadoop 从业人员摆脱命令行。

但问题就在此。我们需要为商业用户，而不是为Hadoop 从业者提供工具。Hue 非常适合运行和跟进 Hadoop 任务，以及使用 SQL 或其他语言编写系统查询。相比Spark，Jupyter 和 Zeppelin 非常适合编写、运行代码，以及使用数据科学的 R 和Python 等语言，甚至生成代码的数据可视化。问题是使用这些工具不等同于脱离命令行；它们只是让人们更有效地做这些事情。让人们完全脱离命令行是一回事，但让人们更简便的做同样的事情，并没有什么本质的改变。

BI 工具供应商也尝试改善这一现状。但他们通过简化 Hadoop，并将其当作 SQL 数据库来处理。给 Hadoop 加抽象层是好的，但是在它们之间加 SQL 层并不是。想做大数据分析吗？选择一个使用 Hadoop 的工具，并充分利用它。虽然你不用直接使用 Hadoop，但你的分析工具应该与它密切相关，而不是敬而远之。

如果你还没有找到答案，这里有一个平衡的方法。从事大数据分析，你不用直接用到引擎——本文指 Hadoop，但你仍然需要它的全部效能。为了实现这一目标，你需要一个技术的分析工具来驾驭该技术，而不会否定或忽略它。在技术工具和 BI 用户之间有重要的中间地带。找到它，你将走上正轨。

Hadoop的前景

Hadoop 没有死，这毋庸置疑。Hadoop 是非常强大的关键技术。但它也是基础设施，它不会成为大数据的典型代表。Hadoop (或 Spark)应该嵌入在其他技术和产品中。这样一来，这些技术就可以利用 Hadoop (或 Spark)的强大功能，而不暴露其复杂性。

Hadoop 正如 TCP/IP 一样，问题是人们如何使用它。如果你想要从事大数据分析，那么请使用利用 Hadoop 功能的大数据分析软件。如果你这样做，Hadoop 将会复活，这不是靠魔法，而是靠常识。

原文链接：
https://www.datameer.com/company/datameer-blog/hate-hadoop-youre-doing-it-wrong/

最后编辑于：2017.12.10 01:45:32

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,362评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,330评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,247评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,560评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,580评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,569评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,929评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,587评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,840评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,596评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,678评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,366评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,945评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,929评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,165评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,271评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,403评论 2赞 342

嫌弃Hadoop?可能是你的打开方式有问题

推荐阅读更多精彩内容