IP属地:广东
之前在做文本分类时,发现在不同业务上的文本分类流程是一致的,即输入输出一致,故把此抽离出来形成一个基础工具,方便对数据有基础的感知和对算法有基本...
1、前言 简单API设计与制作是数据工程师必备的技能之一,同时相信数学科班出身的数据挖掘工程师在职业初期都会思考如何提高个人的工程性,所以数据挖...
目录 1. 前言2. 数据字典3. 优雅使用pandas3.1 读取数据3.2 索引与选取3.3 布尔索引3.4 去重3.5 分组3.6 数据框...
目录1.“看不见”的数据2. 让数据现身2.1 数据API分析2.1.1 数据文件在哪里?2.1.2 guid(数据全局唯一标识符)在哪里?2....
目录 1. 前记2. 文件分割(split)2.1 命令语法2.2 使用实例(1)查看文件总行数(2)分割文件(3)分割结果3. 文件合并...
目录 1. 迭代(iteration)与迭代器(iterator)1.1 构建简单迭代器1.2 调用next()1.3 迭代器状态图2. 生...
目录 1. 何为代理IP池?2. 代理IP池构建2.1 浏览器伪装2.2 代理IP爬取2.3 代理IP验证2.4 代理IP多进程验证2.5 函数...
目录 1. Python多线程与多进程知识1.1 并发与并行1.2 线程(thread)与进程(process)1.3 IO密集型与CPU密集...