断断续续学习了python一段时间,编程几乎0基础的情况下(大学学的VB那点基础真的是不够用),从头啃了几本网上推荐的教材进步还是很迟缓。
Less Talking,More Typing #这里要查找下愿意,大概就是少看多写
准备做的第一个项目就是试着在jandan上抓取图片,相对来说jandan的html原文件还是比较好定位的,也没有花时间去学习正则(当然这个之后是一定要巩固加强的),就成功把图片的域名分离出来了。在下载图片上,有使用urllib的,也有使用request的。尝试urllib的经过几次调试成功后,总是会出现部分图片下载损坏的问题,没有排查出来愿意,并不会返回报错信息。只好改用request来操作,虽然下载速度不快,但是不会出现urllib的问题。这个项目里面分解出来不少能够学习加深的点,后续可以分解下来一步步有方向性的学习:
·如何使用正则表达
·beautifulsoup的各种函数作用
·如何定义下载文件的储存位置
·如何提升调试效率