近几天一直为工作岗位调换的事宜殚精竭虑,举棋不定,终于下了狠心打算挑战一把。然后对所涉及的业务进行了恶补。以前也有过岗位调换,但未曾认真研究过业务内容。这一次,某足了劲儿,认真学了3天。
当下新技术如火如荼的进行着,每天被云计算、大数据、超级计算、未来网络各种信息包围着,虽然身在其中,却从未认真的关注过。
云计算、云平台在每次工作会议上、项目组织会上各种提起,也是我们的主要产品,到底是什么?
云计算是基于网格、集群这些概念的一次升级,可以将其看作资源池,并加入了运营服务的概念。集群、网络、存储、数据这些都可归为资源,按用户需要为用户提供服务,这就是IaaS;用户获取资源,需要跑自己的应用。在这种情况下,有两种解决方案,一用户自己配置应用环境,二由平台提供统一的应用环境。采用第二种方式,就是用Namespace和cgroup进行命名和隔离分组,把应用环境打包成集装箱似的container,这就是封闭技术。然后用采用镜像技术,把程序运行时的环境固定好,待需要的时候掉出运行。这是云计算的PaaS。第三种就是在云平台上直接提供软件。比如我们提供了会议服务平台、邮件系统等软件及服务,即SaaS。
云计算是分布式存储、分布式缓存,采用虚拟技术、数据集成、I/O密集型为主,是网格计算、分布式计算、并行计算的概念的商业实现。我们倾力打造的科技云平台对于科研工作者、企业、集团开展业务提供了灵活、便捷的服务。
若要进行精密的科学计算、工程模拟等领域的密集型计算,比如石油勘测、天气预报、蛋白质分解、生物医药、材料基因等学科计算,还需要高性能超级计算机。与云计算不同,高性能超级计算机采用并行结构,由众多处理器、存储单元共同完成计算。目前,世界最快的高级计算机是美国的“summit”,浮点运算能力约是20Pflops,其次是国家超级计算机中心无锡中心的“神威.太湖之光” 12.5Pfloat。“神威.太湖之光”是第一台全套使用我国自主研发技术生产的超级计算机,曾连续四年蝉联“世界第一”。我们中心的超级计算机“元”,浮点运算能力2.36Pflops,于2014年在怀柔分中心正式提供运行服务,旨在为北京市的社会经济发展提供服务。
我中心采用三级管理模式,“元”作为总中心,还包括9家分中心、19家所级中心,以及6家GPU单位。每年我中心都会发布中科院超级计算机发展指数,对沈阳、大连、青岛、兰州、合肥、昆明、武汉、广州、深圳9家分中心对环境建设、环境使用收入与支出指标进行采集分析。目前,我中心在计算化学、CPF(运动流体力学)等已有较好工作基础的学科领域强化计算科学应用软件,在精准医疗、脑科学等新兴领域开展计算应用。同时,面对工业领域需求搭建创新平台推进高性能计算的发展。下一个目标将是开发EP级超级计算机。
现在轮到大数据了!信息时代,也是数据大爆炸的时代,云计算、超级计算最后的体现也是数据,因此大数据研究成为当下新技术研究重要方向之一。我中心一直以来承担了中科院数据库的建设、运维与发展,开展科学领域数据的基础研发,也参与过国家发改委、科技部等重大项目的研发。在科学数据传播与共享领域有着丰富经验,在数据标准制定和完善方面发挥着推动作用。我中心的目标是支持PB级在线处理能力。
采集到的数据,经过清洗会成为信息,信息经过关联组织成知识,将知识应用到实际的学科领域,最后形成智慧。对应计算机的操作就是数据收集、传输、存储、处理、分析、检测、挖据、应用。数据各个处理阶段都有很多成熟的软件,比如数据获取Nutch,数据分析PageRank,还有非常火爆的Hadoop、Spark,为大数据研究提供了有力支持。
还剩一个重要的基础设施,那就是网络。作为中国互联网的发源地,1994年4月当第一根64k的网线从我中心连入世界inernet开始,我中心就承载了网络互联互通的重要使命。“中国科技网”应运而生,为中科院乃至全国的科研高速网络提供了有力的服务于保障。我中心与中国联通、中国电信、中国铁通、国家交互中心、CerNet实现了互联互通,带宽1~2.5G,国际出口总量达52G。其中,中美环球科研网络10G,中欧Orignt-Plus10G, 香港节点32G。2014年,京港间信道由2.5G提升至5至,通过香港节点与韩国、日本连接。下一步目标骨干网节点带宽升级至100G。
网络、计算、存储、数据构成了我院科学院就的基础设施,可为天文、生物、高能物理等众多学科研究提供服务与保障。基于这些先进的基础设施,我中心在人工智能、材料工程、网络安全技术、先进可视化交互技术、未来互联网关键技术以及科研信息化技术等方面分别成立的业务室,在垂直领域深入研究,为我院信息化和各学科的研究保驾护航。
人工智能是新兴产业,是第四次工业革命的引领行业。我中心承担着人工智能计算和数据应用服务平台的建设与运维、人工智能关键技术研发,推进人工智能在科研领域的应用。
如果了解人工智能的发展会觉得很有意思。起初的人工智能仅限于模拟人说话,可是发现书面语并不能与人进行很好的交流,只用规则行不通。索性让机器自己想去吧,给他配上神经元,形成了神经网络。神经网络就像大脑一样,可以自行进行学习。于是,出现了机器学习、深度学习。给机器一个模型,通过大量的数据,让他自己学习并补充模型。昨儿看到亚马逊的AI系统已经能够检查工时效率,并对“偷懒”工人开出离职指令。机器统治人类的时代已经到来了?
再简单汇报下其他几个应用业务。先进可视化交互技术是采用视觉模拟和数据挖掘技术进行可视化和可视化分析技术、虚拟沉浸技术、移动应用技术的研究,并且研究其共性关键技术。下一代互联网技术主要针对我中心科技云需求,研究信息中心网络(ICN)、软件定义网络(SDN)、5G网络的关键技术,开展先进网络试验床的系统设计。科研信息化技术重在发现高效的信息技术软件,建立科研应用系统集成。材料基因工程是交叉学科的典范,重在建立、运行和维护高通量材料计算平台。
最后说下网络安全技术。互联网迅猛发展,基础设施快速升级,网络数据大爆炸,网络安全尤为重要,已成为院、国家的关注的重要领域。做好互联网的数据检测和隔离、数据传输,做好云计算环境下的检查性攻击检测和分析是必要任务。同时,移动互联网、云计算方兴未艾,基于此的网络完全技术研究也是必不可少。
以上是科研基础设施和应用整理。我中心还有一项重要功能:智慧科学院,做科研传播和继续教育的推动者。中科院资源规划项目(ARP)已为全院提供了管理信息化服务和保障,为院信息化提供咨询与服务!新版ARP将从云化、移动化、界面和态势感知四个方面得到提升!态势感知是基于数据治理和共享机制,呈现科研院所和教育发展的态势,支持其运行大数据资源中心,建立科研院所活动流程与深度融合智能化应用环境。我中心还是院信息发布平台、网络科普平台和继续教育平台的建设和运行单位,由一群热爱新媒体事业的精英正在研发优质的科普内容,让科学与生活更接近。