20190515 搞科研的只会用百度——你已被同行判了死刑 031

20190515 搞科研的只会用百度——你已被同行判了死刑 031

搞科研只会用百度,还能说你是认真做研究的?

在一个正式的学术交流场合,如果你搜索的信息都是来自百度的话,我相信你自己的可信度也会大打折扣,很多人根本不会相信你后面所说的。只要听到百度,内心就把你封杀了,这绝对不是我在危言耸听,也绝对不是我对百度的歧视,我只是在陈述一个客观的事实。谷戈虽略好,但终归也是搜索引擎,不是文献数据库。

当我在和一些科研人员交流的时候,他们经常会说到,我在百度里面搜到什么什么东西,或者我通过百度搜索,找到什么什么文献。每当这个时候,我的内心都会咯噔一下,为什么作为一个科研工作者还只会用百度?【就像那个博士问,知网是什么一样】

如果你做科研,主要是依靠百度的话,我现在就可以宣判:你算不上是一名合格的研究者。

你可能会想,我为啥就不能用百度了呢?这是我对百度的歧视吗?不是的。且听我慢慢解释。

下面我想说说为什么做科研的,你单单用百度是不够的,而且在正式的学术交流场合,如果说你只是通过百度搜索信息的话,其他科研工作者应该不太会相信你的。甚至说得更直白一点,如果我碰到只会用百度去做研究的一名学生或者一名研究者,他在我心目中的地位会立即大打折扣,甚至直接在心里给他判死刑,不愿意与这种人继续合作或交流。

为什么?原因有以下几点:

1、数据不可信

2、效率不高

3、不够严谨

以下是具体说明部分。

一、搜索引擎收集信息几乎不经过筛选,信息质量难以把握

搜索引擎的工作原理是这样的,通过一个网络爬虫的软件,在互联网上把它所有浏览过的网页收集并发回到搜索引擎公司的服务器上,由搜索引擎公司来建立这些网页的一个庞大数据库。当用户需要查找某个主题的信息时,搜索引擎会根据用户的搜索请求提取相关的网页,然后按照一定的顺序进行排序,呈现给用户。

搜索引擎返回的信息数量往往非常大,但是对读者来说,通常只会阅读很少的一部分,多数人只会看第1页第2页。

由于搜索引擎追求收录网络上所有信息,不管是个人博客还是某一个论坛,搜索引擎几乎都会收录。有很多来路不明的信息,这些信息的可信度是难以保证的。也就是说,你在百度上搜索到的信息,很难判断这些信息是正确的还是错误的。

如果你在做科研的时候,都是依赖这些无法判断是否正确的信息作为依据的话,那么你的结论也是不可靠的。这也是为什么说,如果一个人只用百度去做科研,我会觉得这人的研究不靠谱的原因。

二、搜索引擎返回的信息无法高效处理,你的效率一定很低下

我们平时在使用搜索引擎的时候,我们搜索一个关键词,通常会返回几十万、数百万甚至千万级别的信息,但是这些信息当中我们通常会看多少呢?我们通常可能就看一两页,很少会去看更多的。搜搜引擎中尽管会反馈很多信息,但是我们很难去进行高效处理。所谓的高效处理,就是阅读起来比较慢,需要一条记录一条记录打开链接,无法快速浏览,也不便于管理等,也无法批量下载文献等。

在文献数据库当中,我们可以对搜索结果进行排序,可以进行二次检索,可以进行统计分析,但所有这些在搜索引擎当中是无法实现的。在搜索引擎当中只能进行很少的一些精炼。所以,在搜索引擎中,我们收集的信息,也不便于进行批量的下载和管理,所以你的效率一定不会高。

三、数据库收录的是经过人工审核过的信息,确保了信息的可信度

从信息收录的广度来说,要远远少于搜索引擎,但是为什么这些信息很有价值呢?因为这些信息通常都是经过同行评审的,至少在同行看来是有一定价值和可信度的。这样数据库,在我们自己还不具备信息质量鉴赏力之前,就帮我们把了一下关。不会看到很多虚假错误的广告信息,以及不可信的信息等。(客观地说,文献中的信息也不可全信)

文献数据库减少了信息的冗余

互联网上的信息其实有很多是多余的,同一个信息会在网上出现无数多次。譬如一条重要新闻,可能网上会出现上万次,不同网站,都会去转载。我们用搜索引擎去搜索的时候,所有这些都会被检索到。也就是说,为了看一个东西你可能会碰到上万条重复的资讯,这样就会降低我们获取信息的效率。

作为科研文献来说,我们知道科研文献是不允许同样内容重复发表的,这样做就是学术不端。所以我们在网上搜索文献的时候,尽管文献的信息数量要比搜索引擎中得到的少很多,但是每一篇文献应该都是有一定价值的,而且和其他的文献很少会有重复的。所以从这方面来说,虽然文献的数量比网页少很多,但是它的信息含量,比搜索引擎返回的信息要大得多。也就是说,这边信息质量会更高一些。我们去读高质量的信息,自然就可以提升我们的效率。

四、不用百度用G-o-o-gle行不行啊?

客观的说用谷戈搜出来的结果,信息质量要比百度高。这是我愿意使用谷戈,而不愿意用百度的原因,百度的信息排名是混乱的。谷戈虽然有广告,但相对来说,它的排序方式更加客观合理一些。

用谷戈来做科研行不行的?我相信很多做科研的人一定会用谷戈,我也会用。

但作为一个搜索引擎,它和数据库还会有根本的差异。搜索引擎追求的是搜索的广度,互联网上几乎所有的信息,我们都可以通过搜索引擎来搜索到,但是这些信息的质量同样难以保证。尽管搜索引擎公司会采取一些算法来推断这个信息的可信度,但是算法肯定不及经过人工审核过的信息来得可信。

还有用谷戈处理信息的方式,依然不如文献数据库那么高效,也不便于后续的管理和分析。

所以,我平时也会用谷戈去搜索一些信息,但是如果做全面文献调研的时候,一定是以文献数据库为主。

小结一下:

我推荐用文献数据库有几个原因:

一个是更便于检索,更便于高效的后续处理,文献数据库中的信息更加可信,质量更高,信息密度也更高。用来学习和调研,效率更高。

作为一个严谨的科研工作者,一定不能仅仅只要百度。这样会让你的可信度大大折扣,仅仅依靠百度,我相信你一定做不出高质量的科研来。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342

推荐阅读更多精彩内容