240 发简信
IP属地:上海
  • Python:使用selenium模拟浏览器抓取数据

    有些js动态网站和反抓取的网站,对requests的检查比较严格, 使用requests包很难抓取数据。这时可以考虑使用 selenium 模拟...

  • R语言:rvest抓取网页信息

    好久没有用R了,今天复习了下,用rvest写了个抓取 http://pubmed.cn 网站关键字搜索结果的脚本,分享一下。 需求 按关键字搜索...

  • Resize,w 360,h 240
    树莓派3B+安装CentOS7

    新入手了一块树莓派,没搞过原生的操作系统,所以打算安装CentOS,过程中的踩坑记录如下。 下载CentOS镜像 树莓派使用闪存卡做为自身的磁盘...

  • CentOS+Nginx+uWSGI+Django 部署笔记

    Nginx 是一个高性能的HTTP和反向代理服务器,也可以做IMAP/POP3/SMTP服务器。什么是反向代理?就是可以监听指定的外部端口,并将...

  • Resize,w 360,h 240
    数据可视化:使用D3JS创建动画地图,发射动画

    示例图 演示页面 制作思路 需要绘制一张中国地图,做为背景。 需要主要城市的经纬坐标,以绘制路线起点和终点。 从起点绘制一条逐渐延伸的线,到终点...

  • Resize,w 360,h 240
    requests+beautiful 用Python抓取豆瓣电影资料

    在公司加班等双11,练手写了个抓取豆瓣电影评分的脚本,分享一下 环境 Python3.6 requests, 前几个月才知道这个包的,上手比ur...

  • CentOS7+Python2.7.14环境安装odoo11

    最近了解了一下开源的OpenERP系统,尝试搭建了环境,中间踩了不少坑,记下来分享下。 odoo介绍 odoo, 原名openERP,是开源的E...

  • Resize,w 360,h 240
    R语言学习:抓取天猫评价,以及制作词云图

    在上期学习笔记中,记录了使用rvest包抓取宝贝搜索结果页的过程,其中记录了宝贝ID和sellerID。这次学习使用宝贝ID和sellerID抓...

    0.6 7543 4 17
  • R语言学习:使用rvest包抓取网页数据

    rvest是R语言一个用来做网页数据抓取的包,包的介绍就是“更容易地收割(抓取)网页”。其中html_nodes()函数查找标签的功能非常好用。...