20190515 搞科研的只会用百度——你已被同行判了死刑 031
搞科研只会用百度,还能说你是认真做研究的?
在一个正式的学术交流场合,如果你搜索的信息都是来自百度的话,我相信你自己的可信度也会大打折扣,很多人根本不会相信你后面所说的。只要听到百度,内心就把你封杀了,这绝对不是我在危言耸听,也绝对不是我对百度的歧视,我只是在陈述一个客观的事实。谷戈虽略好,但终归也是搜索引擎,不是文献数据库。
当我在和一些科研人员交流的时候,他们经常会说到,我在百度里面搜到什么什么东西,或者我通过百度搜索,找到什么什么文献。每当这个时候,我的内心都会咯噔一下,为什么作为一个科研工作者还只会用百度?【就像那个博士问,知网是什么一样】
如果你做科研,主要是依靠百度的话,我现在就可以宣判:你算不上是一名合格的研究者。
你可能会想,我为啥就不能用百度了呢?这是我对百度的歧视吗?不是的。且听我慢慢解释。
下面我想说说为什么做科研的,你单单用百度是不够的,而且在正式的学术交流场合,如果说你只是通过百度搜索信息的话,其他科研工作者应该不太会相信你的。甚至说得更直白一点,如果我碰到只会用百度去做研究的一名学生或者一名研究者,他在我心目中的地位会立即大打折扣,甚至直接在心里给他判死刑,不愿意与这种人继续合作或交流。
为什么?原因有以下几点:
1、数据不可信
2、效率不高
3、不够严谨
以下是具体说明部分。
一、搜索引擎收集信息几乎不经过筛选,信息质量难以把握
搜索引擎的工作原理是这样的,通过一个网络爬虫的软件,在互联网上把它所有浏览过的网页收集并发回到搜索引擎公司的服务器上,由搜索引擎公司来建立这些网页的一个庞大数据库。当用户需要查找某个主题的信息时,搜索引擎会根据用户的搜索请求提取相关的网页,然后按照一定的顺序进行排序,呈现给用户。
搜索引擎返回的信息数量往往非常大,但是对读者来说,通常只会阅读很少的一部分,多数人只会看第1页第2页。
由于搜索引擎追求收录网络上所有信息,不管是个人博客还是某一个论坛,搜索引擎几乎都会收录。有很多来路不明的信息,这些信息的可信度是难以保证的。也就是说,你在百度上搜索到的信息,很难判断这些信息是正确的还是错误的。
如果你在做科研的时候,都是依赖这些无法判断是否正确的信息作为依据的话,那么你的结论也是不可靠的。这也是为什么说,如果一个人只用百度去做科研,我会觉得这人的研究不靠谱的原因。
二、搜索引擎返回的信息无法高效处理,你的效率一定很低下
我们平时在使用搜索引擎的时候,我们搜索一个关键词,通常会返回几十万、数百万甚至千万级别的信息,但是这些信息当中我们通常会看多少呢?我们通常可能就看一两页,很少会去看更多的。搜搜引擎中尽管会反馈很多信息,但是我们很难去进行高效处理。所谓的高效处理,就是阅读起来比较慢,需要一条记录一条记录打开链接,无法快速浏览,也不便于管理等,也无法批量下载文献等。
在文献数据库当中,我们可以对搜索结果进行排序,可以进行二次检索,可以进行统计分析,但所有这些在搜索引擎当中是无法实现的。在搜索引擎当中只能进行很少的一些精炼。所以,在搜索引擎中,我们收集的信息,也不便于进行批量的下载和管理,所以你的效率一定不会高。
三、数据库收录的是经过人工审核过的信息,确保了信息的可信度
从信息收录的广度来说,要远远少于搜索引擎,但是为什么这些信息很有价值呢?因为这些信息通常都是经过同行评审的,至少在同行看来是有一定价值和可信度的。这样数据库,在我们自己还不具备信息质量鉴赏力之前,就帮我们把了一下关。不会看到很多虚假错误的广告信息,以及不可信的信息等。(客观地说,文献中的信息也不可全信)
文献数据库减少了信息的冗余
互联网上的信息其实有很多是多余的,同一个信息会在网上出现无数多次。譬如一条重要新闻,可能网上会出现上万次,不同网站,都会去转载。我们用搜索引擎去搜索的时候,所有这些都会被检索到。也就是说,为了看一个东西你可能会碰到上万条重复的资讯,这样就会降低我们获取信息的效率。
作为科研文献来说,我们知道科研文献是不允许同样内容重复发表的,这样做就是学术不端。所以我们在网上搜索文献的时候,尽管文献的信息数量要比搜索引擎中得到的少很多,但是每一篇文献应该都是有一定价值的,而且和其他的文献很少会有重复的。所以从这方面来说,虽然文献的数量比网页少很多,但是它的信息含量,比搜索引擎返回的信息要大得多。也就是说,这边信息质量会更高一些。我们去读高质量的信息,自然就可以提升我们的效率。
四、不用百度用G-o-o-gle行不行啊?
客观的说用谷戈搜出来的结果,信息质量要比百度高。这是我愿意使用谷戈,而不愿意用百度的原因,百度的信息排名是混乱的。谷戈虽然有广告,但相对来说,它的排序方式更加客观合理一些。
用谷戈来做科研行不行的?我相信很多做科研的人一定会用谷戈,我也会用。
但作为一个搜索引擎,它和数据库还会有根本的差异。搜索引擎追求的是搜索的广度,互联网上几乎所有的信息,我们都可以通过搜索引擎来搜索到,但是这些信息的质量同样难以保证。尽管搜索引擎公司会采取一些算法来推断这个信息的可信度,但是算法肯定不及经过人工审核过的信息来得可信。
还有用谷戈处理信息的方式,依然不如文献数据库那么高效,也不便于后续的管理和分析。
所以,我平时也会用谷戈去搜索一些信息,但是如果做全面文献调研的时候,一定是以文献数据库为主。
小结一下:
我推荐用文献数据库有几个原因:
一个是更便于检索,更便于高效的后续处理,文献数据库中的信息更加可信,质量更高,信息密度也更高。用来学习和调研,效率更高。
作为一个严谨的科研工作者,一定不能仅仅只要百度。这样会让你的可信度大大折扣,仅仅依靠百度,我相信你一定做不出高质量的科研来。