看到有人通过手工的方式汇总2014年的码农周刊, 非常欣喜. 由此考虑到是否可以通过程序自动实现? 以下是在午睡之前的冥想中想的几个点子:
+ 建立自己的分类字典, 也就是要搜索分类的关键字, 如: javascript, web, web前端, 前端, ruby, rails, nodejs, nginx, lua, openrsty, coffeescript等.
+ 使用爬虫(参考[pyspider](#))来爬取整年的码农周刊, 先简单根据每篇文章的title应用分类字典来进行分类, 将文章投递到各个分类中. 更进一步是搜索全文然后抽取出关键字.
+ 不仅要将每一篇文章分到各个分类中, 而且要记录下每篇文章所属的分类, 然后检查每一篇文章, 确定分类是完全正确的.
这样以来, 所有的文章的分类信息都非常清楚, 你可以做到:
1. 可以随时生成每周/每月/每年的各类技术的汇总信息
+ 可以生成各类记录的图表信息, 趋势图等
由此, 我联想到最近困扰我, 让我很焦虑的问题:
1. 想学的东西有很多, 它们对我都很重要. 有些技术已经学习到了深水区, 但没有归纳总结, 也不确定进阶方法; 有些技术还处于入门阶段, 但有不确定如何开始入门学习. 有些实践性很强的技术, 又不知找什么项目开始实战.
+ javascript, nodejs, coffeescript, nginx/lua, openresty, ruby, rails, elixir等技术都是我想学的, 但它们的学习优先级是怎么样的? 现阶段, 我最应该开始学习什么?
+ 每天看到大量的好文章, 教程, 我也将它们收集在chrome的书签中或者Foxmail的记事本中, 但收集后我却从来没有去翻看过! 很多时候, 资料收集太多了, 但没有归纳总结, 总是成为不了自己的东西. 我甚至想不起来在那里看过.
这个时候, 我多么想有一个工具, 她可以做到:
1. 当我想看任何东西的时候, 都可以快速找到与之相关的所有资料,
+ 并且可以记录我的阅读次数, 评论和笔记. 以及文章的优先级.
+ 当我想记录一个资料时, 很多时候就是一个url, 我可以将这个url掉到工具里, 这个工具可以立刻爬取网页, 建立索引, 分类储存.
+ 我要找某类资料, 只要输入关键字, 将可以看到与之相关的所有信息. 这些信息包括: 阅读次数最多的文章, 文章笔记, 评论, 当前学习进度, 接下来要学习什么.
这样的工具在现实中是不存在的, 但我可以开发她, 她只属于我.