window下是 dir 命令, linux是 ls 提到定时任务调度的时候,相信很多人会想到芹菜celery,要么就写个脚本塞到crontab中。不过,一个小的定时脚本,要...
初识Scrapy Scrapy是Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据...
NoSQL 的全称是 Not Only SQL,也可以理解非关系型的数据库,是一种新型的革命式的数据库设计方式,不过它不是为了取代传统的关系型数据库而被设计的,它们分别代表了...
基本概念 mongo db是非关系型数据库的一种,性能高,容易部署,单表可达千万级别,业界流行一句话,百万级别用Mysql,千万级别用mongo;mongo介于关系型数据库和...
笔记目录 HDFS概述及设计目标 HDFS架构 HDFS副本机制 HDFS环境搭建 HDFS shell Java API 操作HDFS HDFS 文件读写流程 HDFS优缺...
数据仓库(Data Warehouse ) 1.1 基本概念 数据仓库的目的是构建面向分析的集成化的数据环境, 为企业提供决策支持 (Decision Support ).数...