240 发简信
IP属地:上海
  • go1.16新特性 内置内嵌资源文件的支持

    go1.16已经入冻结阶段,这一次较重大的更新是对内嵌资源文件的支持。 内嵌资源文件 典型场景:当你需要在云应用程序中实现一个自动发送邮件的功能时,需要一个html文件作为邮...

  • 更适合爬虫的nosql MongoDB

    为什么nosql 在一个更加普遍通用的爬虫程序中,原始数据往往是杂乱且没有规律的,将这些数据存储在关系型数据库中的成本很高,定义schema就是一个非常繁琐复杂的工作,而且爬...

  • golang反射自定义tag

    维基百科中反射的定义:在计算机科学中,反射是指计算机程序在运行时(Run time)可以访问、检测和修改它本身状态或行为的一种能力。用比喻来说,反射就是程序在运行的时候能够“...

  • 爬虫2 headless chrome

    Headless Chrome 是 Chrome 浏览器的无界面形态,使用命令行的形式替代GUI,可以使用GUI模式下Chrome的功能。一般情况下用于自动调试,也可以用作爬...

  • 120
    爬虫1 colly

    colly colly[https://github.com/gocolly/colly]是一个个go语言实现的轻量快速的爬虫框架,提供了简单直观的编程接口。 架构无标题.p...

  • hive外部表分区

    外部表和内部表 内部表:数据由hive自身管理 存储在hive指定的hdfs目录中 删除会删除数据本身外部表(external):数据存储在用户使用location关键字指定...

  • 120
    HDFS读流程

    HDFS一个分布式文件系统,是Hadoop核心的一部分。HDFS采用主从结构模型,一个HDFS集群是由一个NameNode和若干个DataNode组成的。其中NameNode...

  • golang实现简单的流式处理

    实现一个最简单的类似spark的流式处理流程包含map和filter数据 map函数 fliter函数 所有数据+1 > 过滤出偶数 > 过滤出大于5的数

  • golang Error Wrapping

    go1.13中引入err wraping机制1.13前函数返回一个error errors.New()创建一个errorStringerrorString 只包含了一个字符串...

  • golang泛型前瞻

    9月更新了golang设计草稿中的泛型语法这里可以在线编译如下 这是一个泛型的Print函数 循环打印泛型切片中的元素 any any是一种特殊的interface 在我的理...

  • go规则引擎 grule

    规则引擎由是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。...

  • etcd笔记1

    etcd 是一个分布式键值对存储,设计用来可靠而快速的保存关键数据并提供访问。通过分布式锁,leader选举和写屏障(write barriers)来实现可靠的分布式协作。 ...

  • database/sql包

    gorm构建在标准库database/sql上,所以需要先对database/sql有所了解。以下内容大部分取自go语言标准库https://studygolang.com/...

  • Spark SQL rdd转换dataframe 执行sql

    Spark SQL中所有功能的入口点是 SparkSession 类可以利用创建rdd的SparkContext.SparkConf创建pyspark中的api是: 将rdd...

  • redis keyspace notification 键空间通知

    概念 键空间通知指redis的每一个键被新建、修改或过期的通知通过pub/sub实现 配置 redis.conf中notify-keyspace-events参数控制开启通知...

  • postgresql的update inner join

    在mysql中遇到依赖表a的数据来大量更新表b的数据时可以使用update join的语法在postgresql也可以做到 语法和mysql有一些差别 这是postgresq...

  • Yarn Capacity Scheduler

    Yarn有FIFO Capacity FairS三种调度器 Capacity是Yarn的默认调度器 Capacity Scheduler的结构 Capacity Schedu...

  • docker-Cgroups

    什么是Cgroups? Cgroups提供了对一组进程及将来子进程的资源限制、控制和统 计的能力,这些资源包括 CPU、内存、存储、网络等 。 通过 Cgroups,可以方便...