ch2进阶作业1-2019-03-12

0. 目录

    1. 摘要
    1. 背景
    1. 分析思路
    • 3.1 查看相关学科
    • 3.2 时间维度,查看心理学的发展历史
    • 3.3 找到领域内的大牛
    1. 通过知网心理学博士论文看国内心理学研究
    • 4.1 从时间维度分析
    • 4.2 空间维度分析
    • 4.3 变量关系
    • 4.3.1 按相关学科统计
    • 4.3.2 分析词频
  • 5.通过中国社会科学引文索引分析
    • 5.1 下载论文
    • 5.2 使用citespace分析知识图谱
  • 6.结论

1. 摘要

本文记录了使用批量下载论文,时间空间维度分析,变量关系分析,知识图谱分析等方法,了解“心理学”学科的发展,以及国内心理学研究的主要院校等宏观信息。本分析耗时14小时左右,主要使用知网论文索引,google学术论文索引,cssci学术论文索引作为原始数据进行分析。了解到心理学在国内是个年青的学科,心理学研究具有 注重人类行为的真实呈现,注重实验等特点。

2. 背景

本文的目标是对心理学产生全局认识。ch2的知识点非常多,其中批量下载论文和zotero的使用已经比较熟练了,希望通过使用citespace等工具探索更多未知领域。由于时间限制,未使用抽样阅读法等方法阅读论文,而是使用citespace和词频分析工具等对论文数据进行汇总分析。

3. 分析思路

3.1 查看相关学科

image
  • 如上图:心理学是第42号大学科,没有上级学科,心理学的下级学科有,心理学相关学科,社会学相关学科,医学相关学科,教育相关学科,管理相关学科。
  • 在分类中心理学没有上级分类,说明心理学已经成为一个独立的大学科。
  • 这里的启发:通过简单的材料也能得出有用的结论。

3.2 时间维度,查看心理学的发展历史

  • google 搜索 “Timeline of psychology”。
  • 查看维基百科心理学时间表,心理学是在1880年后开始蓬勃发展的。标志性事件是 :1882年 心理研究学会在英国成立。心理作为学科的历史大概140年左右。

3.3 找到领域内的大牛

  • google学术中直接搜索 psychology得到的东西比较杂乱,只下载了前100篇。
  • 搜索psychology领域的大牛们
image

4. 通过知网心理学博士论文看国内心理学研究

  • 知网有博士论文 1,243 篇,刚好达到1000篇的要求。
  • 下载1,243篇论文,导入zotero
  • 单从这1000 篇论文分析得出的结论会很片面,所以需要很多交叉验证。

4.1 从时间维度分析

image.png

如上图,心理学的高级研究是从2000年以后开始的,心理学在中国是个非常年青的学科。

4.2 空间维度分析

  • 写了个脚本统计所有论文所属的大学,用于计算心理学的空间分布(代码在文章最后)


    image.png
  • 如上图,心理学博士论文产出最多的院校是化东师范大学,西南大学。其他产出比较多的学校有浙江大学,天津师范大学,吉林大学,南京师范大学等。
  • 其中大部分是师范类院校,而少有医学类院校,从这点可以看出,心理学与教育领域关系最为密切。
  • 为了更形象地展示空间分布特性,找一个可以绘制地图上省份热度的工具[1]
    image.png
  • 国内心理学高级的研究主要在中部地区的重庆,湖北;东部地区的上海,江苏,浙江,等地区。

4.3 变量关系

4.3.1 按相关学科统计
image.png
  • 如上图,心理学与教育,哲学,医学,企业管理,政治,等领域关系密切。
  • 心理学与教育领域关系最为密切。
4.3.2 分析词频
  • 由于信息量太大,先用简单粗暴的方式,把1200篇论文的标题,进行中文词频分析[2]
    image.png
  • 如上图,出现频率最高的100个词,去掉完全没用的。


    image.png
  • 如上图,出现最多的词是:认知,情绪,记忆,神经,自我,实验,健康,青少年,大学生,等。可以看出,心理学的研究:
    • 注重人类行为的真实呈现,注重实验。(实验,实证,行为)
    • 研究对象多为儿童,青少年,大学生。(儿童,青少年,大学生)
    • 注重人的主观感受和情绪。(情绪,视角)
    • 关注类的认知,记忆,阅读等个人能力。(认知,记忆,阅读,视觉)
    • 研究主题多与神经,自我 ,人格 相关。(神经,自我 ,人格)
    • 受社会和文化等客观环境因素影响。(社会,文化)
    • 多在在教育,管理,健康等领域进行实践。(学习,决策,健康)

5.通过 中国社会科学引文索引[3]分析

5.1 下载论文

  • 在某宝买了个山寨帐号,下载论文
  • cssci 选择内容的时候不能一次清空全部,可以退出重新登录来解决,筛选条件还在。


    image.png
  • 如上图,筛选条件为:心理学,论文,《心理科学》期刊,1998-2019年,共有5243个结果。
  • 分析重点是使用citespace分析知识图谱,为了保证取样完整,把5200篇论文全下载了。

5.2 使用citespace分析知识图谱

  • citespace是个看上去很难很高大上的东西,导入论文进行测试。


    image.png

    image.png
  • 查看关键词
    Modularity Q=0.94
    Mean Silhouette=0.41


    image.png

    网络成瘾,效度,外显学习,内隐联想测试,相似性,孤独感,心理弹性,压力性生活事件。


    image.png
  • 图片看起来有点奇怪。比较难得出有用的结论。
  • citespace 水很深,弄了几个小时几能弄成这样了,还要继续学习。
  • 这里的启发是:没结果也是一个结果。没结果说明问题内部复杂性很高,需要花更多时间理清脉络来研究。

结论

  • 心理学在全世界是个很大的学科,心理学的的发展从1880年左右开始,到现在有140年左右。
  • 心理学的资料相对开放,在各权威学术网站上均能找到大量的资料。完成本文的过程中共下载了13000多篇论文索引。
  • 在中国心理学是从2000年左右开心蓬勃发展的,是个非常年轻的学科。国内心理学专业很好的院校有东师范大学,西南大学,浙江大学,天津师范大学,吉林大学,南京师范大学等。在西北部发展相对落后。
  • 心理学注重人类行为的真实呈现,注重实验。研究对象多为儿童,青少年,大学生。注重人的主观感受和情绪。关注类的认知,记忆,阅读等个人能力。研究主题多与神经,自我 ,人格 相关。受社会和文化等客观环境因素影响。 多在在教育,管理,健康等领域进行实践。
  • 心理学学科的研究主题非常丰富,学科分支很多,且与其他学科有大量交集,应用领域非常广泛。
  • 启发1:通过简单的材料也能得出有用的结论。
  • 启发2:没结果也是一个结果。没结果说明问题内部复杂性很高,需要花更多时间理清脉络来研究。

引用

[1]绘制地图上省份热度的工具
[2]中文词频分析
[3]中国社会科学引文索引

源码

  • 这是一个php程序脚本,用来分析知网博士论文,按学校和作者统计总数量。
<?php
$count = $count2 = [];
for( $i=1;$i<=25;$i++){
    $data = `curl -s 'http://kns.cnki.net/kns/brief/brief.aspx?curpage={$i}&RecordsPerPage=50&QueryID=6&ID=&turnpage=1&tpagemode=L&dbPrefix=CDFD&Fields=&DisplayMode=listmode&SortType=(%e8%a2%ab%e5%bc%95%e9%a2%91%e6%ac%a1%2c%27INTEGER%27)+desc&PageName=ASP.brief_result_aspx&isinEn=0' -H 'Connection: keep-alive' -H 'Upgrade-Insecure-Requests: 1' -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36' -H 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8' -H 'Referer: http://kns.cnki.net/kns/brief/brief.aspx?curpage=7&RecordsPerPage=50&QueryID=6&ID=&turnpage=1&tpagemode=L&dbPrefix=CDFD&Fields=&DisplayMode=listmode&SortType=(%e8%a2%ab%e5%bc%95%e9%a2%91%e6%ac%a1%2c%27INTEGER%27)+desc&PageName=ASP.brief_result_aspx&isinEn=0' -H 'Accept-Encoding: gzip, deflate' -H 'Accept-Language: zh-CN,zh;q=0.9' -H 'Cookie: UM_distinctid=16870f3bd12b8-0ac3ae851afe03-8383268-144000-16870f3bd1313e; cnkiUserKey=e71f427b-3fe0-0e07-ed5e-80875e71f320; Ecp_ClientId=5190128232401324274; RsPerPage=50; Ecp_IpLoginFail=19031058.49.22.250; ASP.NET_SessionId=rkvztoo0xlajzdvawzlu4tg0; SID_kns=123122; SID_klogin=125141; SID_kinfo=125103; SID_krsnew=125134; _pk_ref=%5B%22%22%2C%22%22%2C1552371434%2C%22http%3A%2F%2Fwww.cnki.net%2F%22%5D; _pk_ses=*; DisplaySave=15; KNS_SortType=CDFD%21%28%25e8%25a2%25ab%25e5%25bc%2595%25e9%25a2%2591%25e6%25ac%25a1%252c%2527INTEGER%2527%29+desc' --compressed`;
    $regex = "/cdmdNavi\">([^<]+)</";
    // echo $data;
    preg_match_all($regex,$data,$re);
    foreach($re[1] as $v){
        @$count[$v]++;
    }
    if(count($re[0])>0){
        echo "page {$i}:",count($re[1]),"\n";
    }
    else{
        echo $data;die;
    }
    
    
    $regex2 = "/knet\">([^<]+)</";
    // echo $data;
    preg_match_all($regex2,$data,$re2);
    foreach($re2[1] as $v){
        @$count2[$v]++;
    }
    if(count($re2[0])>0){
        echo "page {$i}:",count($re2[1]),"\n";
    }
    else{
        echo $data;die;
    }
}


foreach($count as $k=>$v){
    echo $k,',',$v,"\n";
}

foreach($count2 as $k=>$v){
    echo $k,',',$v,"\n";
}

changelog

2019-03-10 创建,写了一小半,中间出去写了段代码,太喜欢这个作业了
2019-03-12 搜不动了,搜的东西太多了,头要炸了。论文存得太多,zotero也要炸了。
2019-03-12 主要使用citespace分析论文。先试了知网的,不能出图,再试cssci。感觉citespace水非常深,需要深入学习后才能用得得心应手,浅尝了一下还不得要领。无论怎样还是先完成作业,根据分析数据得出一些比较有用的结论。接下来几天去做进阶作业2。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容