240 发简信
IP属地:北京
  • mysql导入emoji数据乱码

    想要mysql表支持emoji,需要设置表编码为utf8mb4 mysql的字符集的作用域有三个层级一个数据库级,一个是表级,一个是列级(字段级...

  • Resize,w 360,h 240
    yarn任务监控页面查看SQL内容

    集群中有很多hive任务在执行,某一个任务存在问题时需要分析执行的hive job提交了什么语句,是有办法从hadoop job监控页面查看的 ...

  • Resize,w 360,h 240
    房屋出租

    房子在高新区舜华南路,华皓汉峪小区2期,两室一厅。距离汉峪金谷,齐鲁软件园近,小区里有幼儿园,旁边是小学,附近有超市公交站,生活设施全。

  • hive分组取随机数

    hive取随机的数据,可以使用rand()函数,用rand()对数据排序,取topN如果要用到分组取随机数,比如每个班级随机取10人,针对这种每...

  • 动态参数设定

    elasticsearch.yml中尽量只写必备的参数,其他可以通过api动态设置的参数都通过api来设定 动态设定的参数有transient和...

  • 常用文件处理方法

    GBK格式内容转码 获取文件路径或文件名 hadoop mr 中使用如下方式 spark 中 获取文件名中的ip信息,并将文件转码

  • Hive不可见字符的处理

    指定查询结果的分隔符 将查询结果放到hdfs目录上,默认的分隔符为不可见字符\001,可以追加参数指定分隔符 Linux下对不可见字符的处理 使...

  • hive开启kerberos配置

    启动hive ThirftServer和hive metastore的需要跟管理员申请keytab

  • es 基于磁盘的shard分配参数

    低警戒水位线——默认为磁盘容量的85%。 Elasticsearch不会将分片分配给使用磁盘超过85%的节点。它也可以设置为绝对字节值(如500...