240 发简信
IP属地:广东
  • Impala与Hive混合使用的一个深坑

    Hive版本 1.1.0-cdh5.9.0 Impala版本2.7.0-cdh5.9.0 Impala的高性能很好的弥补了Hive的查询...

  • Resize,w 360,h 240
    Hue 的SQL查询页面搜索框生效问题处理

    集群启用Sentry之后,Hive和Impala的SQL查询页面多了一个搜索框,通过搜索框搜索时,侧边栏一直处于加载状态,如下图所示。 首先通过...

  • Resize,w 360,h 240
    Yarn容器超过内存限制问题处理

    最近发现Oozie上有个任务经常会跑失败,oozie的日志(标准输出、标准错误输出、系统日志)都看上去很正常,没有异常输出. 继续查看nodem...

  • Resize,w 360,h 240
    Hue的Impala模块没有释放连接的问题解决

    最近在研究Impala的准入控制这块,其中一个参数是限制一个池中的最大并行执行的查询数,假设这个值是20,那么当提交一个查询到impala,而集...

  • Resize,w 360,h 240
    一个由TimeZone引发的BUG

    数据平台的数据流水线如下图所示,最近的平台的数据出现异常,数据导入过程中随机出现Impala中的数据比Loghub中的数据少了很多。从数据流水线...

  • HBase 一致性检查与修复

    HBase 不一致表现为: region不一致:当一个region被分配到多个regionserver或者没有regionserver持有该re...

  • DataNode退役

    准备工作: 1.确保依赖该主机的其他应用上的相关配置已经调整至其他机器。 2.确保该主机上除DataNode进程外其他CDH相关进程均已正常停止...

  • Impala读取HBase外部表的一个坑

    最近业务部门反应数据上报上来数据中有字段缺失。有个字段daily_amount在MQ里面是有值的,但是导入到impala后查到的确为NULL。先...

  • JDBCTemplate的一个坑

    最近给数据平台的模型查询部分加了一个查询缓存。通过Spring AOP实现,思路是将查询结果通过gson序列化后存储在HBase中。 List ...