ArthurN - 简书

发简信

ArthurN

3
关注
7
粉丝
15
文章
11096

字数
7

收获喜欢
1

总资产

IP属地：广西壮族自治区

ArthurN

Word2Vec语言模型：低维稠密向量
Word2Vec 一共有两种模式，以及两种近似训练的方法，个人认为CBOW搭配negative-sampling，以及SkipGram搭配H-softmax，所以以下小节按这...

2335 0 0
ArthurN

语言模型：使用NLTK训练
语言模型：使用NLTK训练并计算困惑度和文本熵 Author: Sixing Yan 这一部分主要记录我在阅读NLTK的两种语言模型源码时，一些遇到的问题和理解。 1. NL...

4305 0 0

ArthurN

d2890c1dd688
写了 0 字，被 99 人关注，获得了 36 个喜欢
ArthurN

BosCollege-SimpleDB-写入一条数据
Author: Sixing Yan 1.前言当数据库系统执行一条SQL语句的时候，它会为这条语句生成对应的执行计划（Plan），针对查询和更新两种操作行为，计划又分为查询...

371 0 0
ArthurN

BosCollege-SimpleDB-线性哈希索引
Author: Sixing Yan 在SimpleDB-3.00中，相对于原有的静态哈希索引技术，我们将实现一种动态哈希索引技术，线性哈希索引技术。相关算法的可以参考这篇文...

1087 0 0
ArthurN

BosCollege-SimpleDB-FLOAT数据类型支持
Author: Sixing Yan 在SimpleDB-2.10中，数据库系统仅支持Int型和String型数据，即创建的schema仅支持 int 和 varchar 类...

533 0 0
ArthurN

JC_Huang
写了 90763 字，被 1147 人关注，获得了 1575 个喜欢

君子，厚积薄发也<br><br>个人主页 | BLueSun <br>[<a href="https://links.jianshu.com/go?to=http%3A%2F%2Fhuang-jerryc.com" target="_blank">http://huang-jerryc.com</a>]

ArthurN

BosCollege-SimpleDB-在查询中使用索引
关键词：索引，SimpleDB，查询计划Keyword: Index, SimpleDB, Query Plan Author: Sixing Yan 在哪儿使用索引？在S...

288 0 0
ArthurN

BosCollege-SimpleDB-查询执行
Author: Sixing Yan 相关信息What is BosCollege-SimpleDB? see this.What is BosCollege-SimpleD...

410 0 0
ArthurN

@W_PiG_猪还没写完🤣因为感觉每一小节都有想记下来的，所以正在想办法精简和重新改进

读书笔记-《不止代码》
《不止代码》阿里巴巴 i hear and i forget, i see and i remenber, i do and i understand.——印第安人谚语章节...

ArthurN
133 2 0
ArthurN

初级爬虫使用指北(7)--完整代码
目录完整代码附加题 1. 完整代码 prepare_fellow_list.py crawl_multiple.py 2. 附加题我相信有了这个教程，大多数基础的数据收集任...

297 0 0
ArthurN

初级爬虫使用指北(6)--很多目标
目录目的分析需求分析网页重复之道与爬虫结合附加题写在前面：从现在开始，教程可能会变成这样：好，让我们开始吧 1. 目的我已经知道如何收集 & 解析网页数据了，那么问题...

294 0 1

ArthurN

初级爬虫使用指北(5)--存储数据
目录目的将数据存储在本地 (二进制文件)将数据存储在表格/文本文件中完整代码附加题 1. 目的之前的教程对于获取到的数据，查看方式都是“直接打印到屏幕”——在屏幕上显示...

616 0 4
ArthurN

初级爬虫使用指北(4)--解析网页
目录目的网页构成获取标签里的信息解析网页的一般流程完整代码附加题 1. 目的当获取到指定网页文件（html源代码）后，下一步工作即是要提取出其中所需要的信息。程序的优势在于...

473 0 1
ArthurN

初级爬虫使用指北(3)--一个简单的爬虫
目录目的伪装自己模仿“浏览网页”收集数据完整示例附加题 0. 目的通过一个示例了解所谓“爬虫程序浏览网页”的真实情况和流程，所有的Web数据收集爬虫都于这个流程相关。 1....

372 0 0
ArthurN

初级爬虫使用指北 (2)--准备安装一些“软件”
目录基础安装附加题参考书使用指北目录本系列使用的程序编译平台为 Anaconda 集成的 Spyder，当然我一般不用它。我使用iPython运行独立程序，Jupyter运...

560 0 0
ArthurN

初级爬虫使用指北 (1)--想清楚开始的理由
目录分析需求需求分类你的选择 1. 分析需求分析自己的需求，问自己：需要解决的问题，是否可以在3小时内纯手工的收集？如果不可以，那么再考虑【爬虫】。下面是常见的需要收集数据...

375 0 1

ArthurN

初级爬虫使用指北 (0) --当我们在谈论【爬虫】
目录写在前面如何使用该指北写作目的 1. 写在前面如果只是需要完成一个常规的任务，请首先考虑使用成熟的【爬虫】软件，而不是自己写代码。例如：八抓鱼采集器。其他请参考知乎...

382 0 0