简介 该项目主要分析深圳通刷卡数据,通过大数据技术来研究深圳地铁客运能力及探索优化服务的方向 主要讲解Flink流处理实时分析部分,离线部分较简单,暂时略过 项目流程 采用p...
[TOC]SparkStreaming基于kafka获取数据的方式,主要有俩种,即Receiver和Direct,基于Receiver的方式,是SparkStreaming给...
我们正进入大数据时代,组织不断收集大量数据。 但是,这种数据洪峰的价值取决于及时提取可采取行动的见解的能力。 因此,越来越需要能够从海量数据摄取管道中获取实时可操作见解的连续...
JUST团队-任慧敏JUST时空数据 轨迹识别问题旨在验证传入的轨迹是否是由所要求的人员产生, 即给定一组单独的人员历史轨迹(例如行人,出租车司机)以及由特定人员生成...
GeoSpark是基于Spark分布式的地理信息计算引擎,相比于传统的ArcGIS,GeoSpark可以提供更好性能的空间分析、查询服务。 准备工作 Ubuntu18.04 ...
The English version of this blog at here : http://www.jianshu.com/p/cba96dad5f24 CV (C...
本章节将详细介绍Pod资源的各种配置(yaml)和原理。 5.1 Pod介绍 5.1.1 Pod结构 每个Pod中都可以包含一个或者多个容器,这些容器可以分为两类: -用户程...