Jieba使用实验 本文尝试了jieba的三种分词模式、自定义字典、计算频数并将频数较高的分词结果存入csv文件。 1. 配置 安装jiebapip install jieb...
IP属地:四川
Jieba使用实验 本文尝试了jieba的三种分词模式、自定义字典、计算频数并将频数较高的分词结果存入csv文件。 1. 配置 安装jiebapip install jieb...
API&SDK简介 API(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组...
google历年愚人节 google历年愚人节盘点(http://m.chinabyte.com/net/57/11890557_mi.shtml) Pigeonrank分析...
crontab命令常见于Unix和类Unix的操作系统之中,用于设置周期性被执行的指令。下面是简单使用crontab进行定时循环执行scrapy爬虫的操作: 安装cronta...
Apache Tika是基于java的内容检测和分析的工具包,可检测并提取来自上千种不同文件类型(如PPT,XLS和PDF)中的元数据和结构化文本。 它提供了命令行界面、GU...
亲亲
【读书笔记】《新数字秩序的革命》写在前面 读《新数字秩序的革命》时我的内心感受可以由以下一串词语来概括:知无不言、言无不尽、尽而不乱、乱而不杂、杂中有序、序中有理。我打开此书的第一件事便是翻阅目录,当时我在...