周末作业是帮助古巴人民把互联网”夹带“进古巴,需要在美国把互联网访问后按 网址url=>内容方式 保存到文件,然后文件被“搬运”到古巴后,能被方便的被反”解“出来访问。
你可能早就看过报道,古巴的互联网基础设施非常落后,全国只有 5% 的人能访问互联网,而且是速度奇慢的拨号网络。Google 董事长(现 Alphabet 董事长)施密特曾在今年 3 月访问古巴,他惊呼,“拨号网络简直让我回到上世纪 90 年代。”
古巴也有速度更快的公共 Wi-Fi,不过,目前全国只有 175 个公共 Wi-Fi 热点,大部分位于公园和高级酒店里,而且上网费很贵,每小时要 2 古巴比索(约13元人民币),要知道,古巴的人均月收入只有 20 美元。
古巴公园内上网的人 来自: John Graham-Cumming
在这种情况下,古巴人民使用了古老的智慧:用移动硬盘传递数字内容。硬盘里的内容每周更新,被称为 El Paquete Semanal(西班牙语,意为“每周包裹”,简称 El Paquete)。一个和常人无异的大妈,很可能每天早上离家,步行很远找到一位“信息贩子”,把一个个 TB 级的移动硬盘拷满电影、电视剧、杂志。然后,她把硬盘带回家,通过口耳相传,卖给朋友、邻居……
El Paquete 的价格也合理得多,如果等着看上周五更新的最新内容,你要付 17 美元,当然,你也可以让别人有偿从你这里拷。而只要多忍两天,你就可以用 2.5 美元买到上周三、四更新的全部内容。
本周末的作业对我来说还是有点难度,最后还是一筹莫展,只好看大大的答案
我的图
Python大大思路:
在本周的实验上上会用到这些知识,实现对网站的访问,而后会利用序列化把网站内容存储起来。存到哪里呢?用文件操作把序列化的变量存到文件里。
可能你会问,为什么要用序列化呢?反过来想想,文件运输到古巴后,最终还是要让人读取内容吧。
假设古巴人民也像我们一样,需要一个网页,一个网页的读取,甚至,可以提供一个浏览器给他们,那个浏览器能按链接(比如http://xxxxx )接来读取内容。我们提供给他们的文件就作为浏览器的数据源,我们的数据结构可能就是按,链接=›网页,这种结构了。整个大文件就是一个python的字典类型进行序列化后,存储的大文件了。
主要利用本周的内容:
1.序列化啊存储例子,python的pickle模块实现了基本的数据序列和反序列化。
2.然后再是做翻墙的程序,在那个程序里,专门去访问了一种rss类型的网页。这种网页就是专门列出网页列表给专门的rss阅读软件看的。就好像互联网里那种“大嘴巴”,就怕人不知道一样。比如你关注了某网站的更新,这种更新以前就用rss来表示。提醒软件就不停的去刷rss,一旦有更新就提醒你呢。为什么我唠叨那么多呢,其实意思就是,例子里我选取这种特殊例子,就可以得到很多网页列表来做例子了。
大大思路主要是,先读取那个rss文件,逐条抽取url,访问url内容。然后按(url =› 内容)方式存放到字典里。序列化字典到文件。然后再反序列化那文件,就可以按某个url来提取,或是全部按列表提出了。序列化就是那个梗。
由于urllib的效率没有urllib2好,在遍历链接列表的时候,我使用了urllib2.
感悟:对于本周内容还没有完全消化,还要花时间好好理解