高性能计算、大数据与机器学习的融合

2019年9月,美国国家科学技术理事会(NSTC)发布《高性能计算、大数据与机器学习的融合》报告,对美国网络与信息技术研发计划(NITRD)大数据与高端计算研发机构间工作组于去年10月举行的同名会议进行了总结。关键结论(1)随着数据量的急速增加,在科学需求的推动下,高性能计算(HPC)、大数据(BD)和机器学习(ML)不断融合。数据的产生不再是瓶颈,取而代之的是数据的管理、分析和推理。(2)随着半导体缩放对性能提升的贡献逐渐减少,未来系统的异构性将不断增加。系统将需要全面提高灵活性并具备低延迟,以更有效地支持新的应用。此外,因为当前可信数据很少,需要新的工具与基准来处理HPC模拟、大数据和机器学习应用中遇到的通用问题。(3)未来的计算生态系统将不同于当前的计算生态系统,更可能是将边缘计算、云计算和高性能计算结合起来。为实现这种无缝的生态系统,将需要新的编程算法、语言编译器、操作系统和运行时系统来提供新的抽象与服务。预计“边缘智能计算”的重要性将日益提升,其涉及网络边缘(近数据源)的智能数据采集或数据分类。(4)HPC、BD和ML社区间需要开展更多的合作,以实现更高校快速的生态系统开发,更有效地服务于这三类社区。数据分析与HPC模拟的融合已经取得了一些进展,而由于技术和组织上的差异,支持HPC和BD社区的软件生态系统却呈现出完全不同的情况。

已经为大家精心准备了大数据的系统学习资料,从Linux-Hadoop-spark-......,需要的小伙伴可以点击进入

案例HPC-BD-ML融合的一个案例是美国能源部与国立卫生研究院合作在国家癌症研究所开展的“癌症分布式学习环境”(CANDLE)项目,其致力于汇集分子、药物反应、治疗策略三个重大挑战领域的数据,来改进癌症患者的疗效。每一领域都有不同的专家团队在不同规模、模型和模拟中使用不同形式的数据,以求创建一个“单一可扩展的深度神经网络代码,用于解决所有三大挑战”:理解关键蛋白质交互的分子生物学原理;开发可用于药物反应的预测模型;从数以百万计的癌症患者记录中自动分析与提取信息,并确定最佳的癌症治疗策略。

另一个案例是能源部和产业界、学术界共同开展的“面向气候分析的百亿亿次深度学习”项目,来自多家机构的研究人员借助能源部的“顶点”(Summit)超算系统,利用经训练的深度学习模型识别极端天气模式。研究团队开发了一种创新的卷积分割架构,可自动提取热带气旋、大气河流等极端天气模式的像素级掩模,有助于气候科学界表征未来同类事件的频率和强度。该项目获得了2018年的戈登贝尔奖。

机遇与挑战(1)硬件模拟和数据分析均依赖于计算系统的能力,当硬件异构性随着不断变化的用户需求日益提升时,系统性能也会随之提升。融合面临的主要硬件挑战包括:所有层的互连效率,创新性工具与通用端到端基准套件,功耗,集成内存,可扩展文件系统,可靠网络,平衡的硬件开发等。(2)运作模式大型试验过去主要依赖于本地计算资源进行数据分析,现在越来越转向于通过HPC获得实时结果。同样的,部分机器学习和深度学习应用也需要借助HPC资源进行训练。模拟的规模和复杂性也需要一个应用能处理复杂工作流并通过ML实现工作负载的自动化。就分布式基础设施中HPC、模拟、数据分析与机器学习在工作流中的融合而言,边缘智能计算提供了一个很好的例子。主要的运作模式挑战包括:面向ML与大规模数据分析的可扩展工具与能力,新用户培训与支持,新的数据工具与服务,管理良好的端到端解决方案等。(3)软件最近的HPC系统能很好地将模拟的预测功能与机器学习的分析和优化功能相结合。随着深度神经网络在机器学习中的应用,数据分析目前也具有了传统HPC工作负载的计算特性。HPC和数据分析系统都采用了GPU等加速器来改善单个计算节点的性能,而且为突破计算性能扩展的限制,这种趋势还将继续。主要的软件挑战包括:系统设计,边缘计算或边缘智能计算,系统管理,通用软件库等。

码字不容易,帮忙点个赞,点赞关注是我写作的动力,谢谢!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容