240 发简信
IP属地:北京
  • Alluxio集成Hadoop

    准备工作 为了运行Alluxio集群在多个机器上,必须部署Alluxio服务到这些机器上。可以下载伴随特定Hadoop版本的二进制AlLxio包,也可以从Alluxio源码中...

  • 安装Spark

    Spark是什么 Spark是一个集群计算系统,可以在集群上部署和运行并行的应用,Spark初始是运行Scala应用,但是也支持Java,Python,R。Spark不但可以...

  • Hive SQL的排序

    Order By 在HSQL中的Order By类似于在SQL中的Order By。在严格模式下(hive.mapred.mode=strict),order by 必须和l...

  • Hive的transform使用

    创建Hive表 添加测试数据 添加transform的python脚本 4.在Hive中添加python文件 运行Hive查询

  • Linux技巧

    当在ubuntu安装完vim命令时,使用vim代替vi

  • Mysql DDL操作

    创建utf8编码的数据库

  • Python技巧

    当一个字符串包含多个相同的变量时,使用如下方法:代码: 输出:

  • Python获取时间

    获取当前时间代码: 输出:

  • Mysql配置问题

    查找Mysql使用了哪一个my.cnf文件 数据名和表名大小写敏感的问题在windows系统上数据库名和表名是大小写不敏感的,而在大部分Unix系统上他们是大小写敏感的,在M...

  • Mysql常用方法

    if when ifnull(仅仅判断null,不会判断空字符串) coalesce(返回第一个不为null的值)

  • 解决CDH问题

    当在scm-cloudera-agent.log中看到如下错误: 解决方法: 搜索openjdk包rpm -qa |grep openjdk 然后删除相应的openjdk包y...

  • Impala简单教程

    进入impala shellimpala-shell -i localhost --quiet 查看impala版本[localhost:21000] > select ve...

  • 使用importtsv导入CSV数据到HBase

    CSV数据如下: 创建HBase表 登录到服务器 ssh root@xxx.xxx.xxx.xxx 切换到hbase用户 root> su - hbase 进入到Hbase ...