240 发简信
IP属地:四川
  • Resize,w 360,h 240
    Solr建立索引练习

    目录 实验内容实验环境实验过程总结 实验内容: 使用Solr全文搜索引擎,定位金庸小说神雕侠侣中独孤求败出现的情节,认识Solr,并学习Solr...

  • Resize,w 360,h 240
    使用开放API获取网站数据——以豆瓣为例

    目录 实验内容实验环境实验过程 实验内容: 尝试使用网站开放的API,获取网站数据,了解除网络爬虫外获取高质量网站数据的新途径。 实验环境: 操...

  • Resize,w 360,h 240
    Apache Tika文件解析练习

    目录 1.实验内容2.实验环境3.实验过程1)启用Apache Tika2)使用Tika解析docx文件3)使用Tika解析网页4)使用Tika...

  • Resize,w 360,h 240
    jieba分词练习

    实验内容: 使用Python分词模块:Jieba,对四川大学公共管理学院2015-2018年308条新闻内容进行分词分析。 实验环境: 操作系统...

  • Resize,w 360,h 240
    认识robots协议

    robots协议的作用: Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Pro...

  • Resize,w 360,h 240
    scrapy学习

    一、云服务器配置:为Python安装scrapy 1)检查当前服务器是否安装Python scrapy模块 Python版本已升级为:2.7.1...