240 发简信
IP属地:河南
  • 120
    今天终于做了一张图2019-04-10

    对我而方,今天是一个应当圈一个的日子。努力了十几天,终于完成了第一张社会网络分析图。 心得:图只是一种显示工具。读图虽然方便,但是,图依赖的仍然是数据。作为专业人士,在没有图...

  • Python下的selenium和Chromedriver安装2019-03-09

    在尝试了用scrapy爬条法司网站上的双边条约后,我发现,这个网站的烂结构让我吃够了苦。在网站上有个表格,表中列出了中国与其他国家签订的104个双边条约,可是我试了几次,只下...

  • 这几天空闲时反复地练习得雨帝的文章,出现了一系的错误,列出,供参与。在学习时,建议那些和我一样没有受过系统编程训练的同道们,一定要做些手工作业。针对一个网站,不借助参与资料,亲手码出程序,在调试中找出自己的错误,这样虽然笨些,但适合我这样的笨人。

    SCRAPY解----草译一篇得雨帝(Gotrained)的讲义,供参考2019-03-04

    文章原文地址:https://python.gotrained.com/scrapy-tutorial-web-scraping-craigslist/ 爬的目标网站;Cra...

  • Scrapy之“rule”用法2019-03-06

    在用crawl创建的crawlerspider中,rule是个很重要的内容。这个模板提供了一个包含变量rules的parse()方法,以方便我们完成链接列表的提取。其基本结构...

  • Scrapy之LinkExtractor2019-03-06

    如何取得列表页中的内容链接呢?方法有很多,但LE应当是最简单的一个了。使用这个工具之前,先引入。 注意,linkextractors是个复数。然后在程序中就可以使用了。先用L...

  • linkextractors

    爬虫课堂(二十二)|使用LinkExtractor提取链接

    在爬取一个网站时,要爬取的数据通常不全是在一个页面上,每个页面包含一部分数据以及到其他页面的链接。比如前面讲到的获取简书文章信息,在列表页只能获取到文章标题、文章URL及文章...

  • SCRAPY解----草译一篇得雨帝(Gotrained)的讲义,供参考2019-03-04

    文章原文地址:https://python.gotrained.com/scrapy-tutorial-web-scraping-craigslist/ 爬的目标网站;Cra...

  • F7

    两个志趣相投的人,二十八年前走在了一起,连最最简单的仪式都没有,只是一句承诺,永远连接了两个原本遥远的星系。受7的影响,F投身法律。如今,这个由法学博士、资深律师组成的二人组...

  • 开篇

    一个学法学的,不务正业,在美国读材料的儿子年前回国,提到他选修的一门课,老师教他如何用Python做数据分析。当时我对Py的认识,还停留在2003年,我校网络中心一个学生用P...

  • readline()后的字符拼接2019-02-28

    readline()读取了一个TXT文本的行,当我们想在行的首尾加上其他字符串时会发现,尾部的字符串另起了一行。怎么解决这个问题呢?原因是什么?readline命令在每行后加...

  • Window下Scrapy的安装2019-02-28

    一直是在李牛下学习如何虫子饲养技术,后来为了方便,把苹果空气本上也装了。但是,这几天不知为何,李牛无线网卡网速不稳定,又不想扯网线,所以想在瘟斗上也装一个。在安装过程中,遇到...

  • SCRAPY的四大金钢2019-02-26

    就目前学到的这点知识,先做个总结,饲养虫子得有四大金钢:settings.py,items.py,pipelines.py以及spider文件夹里的那些你自己可起起名字的虫子...

  • 一个让人无语的错误

    今天下午继续饲养虫子玩,尝试把商务部网站上的双边投资协定抓下来,作为资料备用。 startproject bits web 进入bits目录,genspider bit1,出...

  • MAC下的Python3环境设置

    瘟斗下和李牛环境下,Py的设置很简单。手中有人Mac Air,也想做个派孙环境,方便学习。 安装派孙,很容易的,到Py的官网,下个Mac安装包,下一步,下一步... Idle...