Hive版本 1.1.0-cdh5.9.0 Impala版本2.7.0-cdh5.9.0 Impala的高性能很好的弥补了Hive的查询...
集群启用Sentry之后,Hive和Impala的SQL查询页面多了一个搜索框,通过搜索框搜索时,侧边栏一直处于加载状态,如下图所示。 首先通过...
最近发现Oozie上有个任务经常会跑失败,oozie的日志(标准输出、标准错误输出、系统日志)都看上去很正常,没有异常输出. 继续查看nodem...
最近在研究Impala的准入控制这块,其中一个参数是限制一个池中的最大并行执行的查询数,假设这个值是20,那么当提交一个查询到impala,而集...
数据平台的数据流水线如下图所示,最近的平台的数据出现异常,数据导入过程中随机出现Impala中的数据比Loghub中的数据少了很多。从数据流水线...
HBase 不一致表现为: region不一致:当一个region被分配到多个regionserver或者没有regionserver持有该re...
准备工作: 1.确保依赖该主机的其他应用上的相关配置已经调整至其他机器。 2.确保该主机上除DataNode进程外其他CDH相关进程均已正常停止...
最近业务部门反应数据上报上来数据中有字段缺失。有个字段daily_amount在MQ里面是有值的,但是导入到impala后查到的确为NULL。先...
最近给数据平台的模型查询部分加了一个查询缓存。通过Spring AOP实现,思路是将查询结果通过gson序列化后存储在HBase中。 List ...