240 发简信
IP属地:广东
  • 分布式复制表实践

    创建复制表 创建分布式表 添加默认的zk路径 vim /etc/clickhouse-server/conf/config.xml<defaul...

  • Resize,w 360,h 240
    Yarn Capacity Scheduler

    在Yarn中使用scheduler为不同的application分配资源,hadoop yarn的调用策略以可插拔的方式实现,hadoop 自带...

  • hadoop 中的DRF算法

    DRF算法主要目的是按按照主资源进行公平分配 考虑一个有9个cpu和18GB的系统,有两个用户:用户A的每个任务都请求(1CPU,4GB)资源;...

  • YARN Node Labels

    Overview Node label 可以用于对Node分组 目前支持的node partition语义如下: 一个节点属于一个节点分区,因此...

  • Resize,w 360,h 240
    distributedshell yarn编程指南

    hadoop yarn是一个独立的调度框架,我们自己也可以通用yarn提供的api编写程序将我们自己的写的程序用yarn来调度运行 hadoop...

  • Resize,w 360,h 240
    Spark ML Pipelines

    ML Pipelines 提供了一组统一的构建在DataFrame上的高级API用于帮助用户创建和调优机器学习管道 ML Pipelines中的...

  • Resize,w 360,h 240
    Neural networks

    Layer input layer output layer hidden layer is "activation" of unit i in...

  • Regularization

    overfitting 如果特征过多,但是训练集不够时,很有可能会出现overfitting 解决overfitting的几种方法 减少特征数 ...

  • Linear regression with one variable

    Housing Prices Hypothesis: Parameters: Cost function: Squared error Goal...