又到了做周挑战的周六。今天是帮助古巴人民把互联网”夹带“进古巴,需要在美国把互联网访问后按 网址url=>内容方式 保存到文件,然后文件被“搬运”到古巴后,能被方便的被反”解“出来访问。
你可能早就看过报道,古巴的互联网基础设施非常落后,全国只有 5% 的人能访问互联网,而且是速度奇慢的拨号网络。Google 董事长(现 Alphabet 董事长)施密特曾在今年 3 月访问古巴,他惊呼,“拨号网络简直让我回到上世纪 90 年代。”
古巴也有速度更快的公共 Wi-Fi,不过,目前全国只有 175 个公共 Wi-Fi 热点,大部分位于公园和高级酒店里,而且上网费很贵,每小时要 2 古巴比索(约13元人民币),要知道,古巴的人均月收入只有 20 美元。
古巴公园内上网的人 来自: John Graham-Cumming
在这种情况下,古巴人民使用了古老的智慧:用移动硬盘传递数字内容。硬盘里的内容每周更新,被称为 El Paquete Semanal(西班牙语,意为“每周包裹”,简称 El Paquete)。一个和常人无异的大妈,很可能每天早上离家,步行很远找到一位“信息贩子”,把一个个 TB 级的移动硬盘拷满电影、电视剧、杂志。然后,她把硬盘带回家,通过口耳相传,卖给朋友、邻居……
El Paquete 的价格也合理得多,如果等着看上周五更新的最新内容,你要付 17 美元,当然,你也可以让别人有偿从你这里拷。而只要多忍两天,你就可以用 2.5 美元买到上周三、四更新的全部内容。
提示下,利用本周文件和网络访问,然后有个小梗,我就不继续提示了,大家去回顾下本周内容,就知道了。
我是这么想的,一个网页上有很多内容,而每个内容自己对应一个网页。我们要做的就是把这个我们无法访问的网页上的内容所对应的网址解析出来,变成我们能访问的网址。也就是说,我们解析的是一个网页,最后得到的是一堆网址。
如果直接按照昨天的代码改的话,假设古巴人想看YouTube上的视频,我把YouTube的网页上的内容网址保存到文件里,再解析出来
这里虽然可以看到许多网址,但是却不是YouTube上面的视频,而且格式并不是只剩下网址。所以我觉得这里正则表达式还得改。我想用re.findall()函数直接抓取所有网页。但是很奇怪什么都没有显示。就算换昨天的网址也是什么都不显示。
我试了一下只输出一行,我发现这里面的网页非常少。第一行里我是没看见。
今天换了很多正则表达式去试都没有输出纯网址。正则表达式这块的写法可能还是没整对。还有一种可能是在打印之前缺了什么内容。没把这个题整出来我现在一点都不困。。不过还是应该先去碎觉明天再研究。加油(ง •̀_•́)ง