书接上回
上回书说到,弹幕获取只要爬一下网页就行了,结果我花一分钟用python小试了一下,结果就发现了自己的愚蠢。我爬下来一看,我得到了一个没有实际内容的静态网页。如果要想获得弹幕,还得去模拟浏览器的行为,执行那些js脚本才行。
Web相关技术都是我的弱项,此次露怯也是因为对前端的知识匮乏所致。
鉴于以上,获取弹幕的方法要重新调研。
调研方向
移植弹幕姬
我打算走这个方向。
一方面,这个应用是成熟稳定的,另一方面,我玩这个机器人本来就需要掌握go语言,go语言本身的特性也很容易模仿弹幕姬的实现。
模拟浏览器
模拟浏览器行为的东西还是有一些的,但是我不打算走这个方向。
这方向麻烦事很多,比如,模拟浏览器的学习成本,再比如,模拟浏览器把直播视频拉下来的话会浪费带宽,还有系统的模块复杂度增高。总之从性能和复杂度上看,都不是优选。
如果不出意外,此篇就是最后一篇调研,下一篇开始技术点的基本测试了,即把所有用到的技术点做一个基本的bringup,以支持调研中预计的可行性,如果有不顺利之处,就可能要重新调研某些技术点了。