朋友圈似乎被赵雷刷了屏,“成都”这个词仿佛当年的“安河桥”。很少听民谣,印象最深的民谣歌手是李健,因为家庭聚会时小姨总是一脸花痴地看着电视夸他多么帅。
有点好奇这群流浪的现代游吟诗人到底在吟什么,所以尝试从数据分析的角度来看看。
参考了网易云音乐和虾米网的「热门民谣歌曲」和「热门民谣歌手」,咨询了朋友圈的几位民谣青年,选出10位分析对象:李健、赵雷、李志、好妹妹乐队、宋冬野、陈粒、左小祖咒、尧十三、郝云、周云蓬。
写了个爬虫,抓取了QQ音乐上这个歌手的所有歌曲。这里其实犯了个小错误,本来想抓前十首热门歌曲,可是错设成了全部歌曲,但其实工作量没差多少,就将错就错了。
就这样,采集了568首歌曲,共计30多万字歌词。扫一眼已经能感觉到淡淡的忧郁,为了能保持理智地敲键盘,我点开了周杰伦。
好,开扒>>>
正能量满满时,听好妹妹、郝云;忧郁愤懑时,听陈粒、左小祖咒。
情绪通常通过形容词来渲染,通过自然语言分析比对词库,综合“正面/负面”标签和词频权重,给每位歌手的情绪风格打分,正数∝正面情绪,负数∝负面情绪,条形长度为情绪强烈程度。
好妹妹乐队和郝云简直打了鸡血,抑扬激昂的唱腔唱着正能量满满的内容,颠覆了我以为民谣就是惨兮兮的偏见。
最近很火的赵雷算是平平淡淡不疾不徐的一挂,不鼓动你也不替你说出心中郁结,而是悄然无声地感染你。
听陈粒、好妹妹乐队的歌,就像看电影。
有些文字特别有画面感、既视感,眼睛在读文字,脑中已浮现出电影般的画面,仿佛已置身其中,进一步加深情绪氛围、产生共鸣。
马伯庸在知乎的课上,道出了增加小说画面感的写作秘密:多写动词。
由于每首歌的字数不一,所以按动词在个人高频词里的占比来排序。对比前一张图来看,陈粒和好妹妹乐队都是利用画面感来煽动情绪的高手。
民谣青年对北京最扎心,你认识的民谣范儿朋友30%漂在长三角。
北京在民谣的世界里占有绝对的地位,随其后的是上海和南京。北漂嘛,比较容易理解。长三角作为抽血重点区域,交织着无数人的青春与理想,人前上进拼搏,人后忧郁寂寞。
老实说,把“成都”换成别的北方城市,唱起来其实差别不大。但要是换成广州,把“走到玉林路的尽头,坐在小酒馆的门口”变成“走到上下九的尽头,坐在茶楼的门口”,顿生一股安逸退休生活的feel,一点都忧郁不起来了。
换句话说,民谣放在哪个城市都可以,但只要简单的A/B测试,即可得知放在北京、上海这些城市,最有代入感、最受欢迎。
“我会背上吉他离开北方——宋冬野《斑马,斑马》”,我女神宝刀shishi也说过“南方是我的经验”。
对于民谣青年来说,南方或是出身的地方,或是想逃往的地方,在那里,有亏欠过的人,有不说是结、说了是疤的回忆。
身在寒冬,心向春夏。奋斗虽苦,但含着泪水,也满怀希望。
民谣青年对春夏这个意象的向往,可以延伸解读为他们寄望于明天。骤眼看来,他们似乎是无病呻吟故作姿态。
但自舔伤口之余,他们忧伤但不消沉,或是有强烈的信仰支撑、或是转身已无后退之路,原因不一。无论是哪个原因,未来并不灰暗,反而充满可能。
用户画像
假如把一首民谣比作一部电影,那电影主角会是什么形象呢?综合透视30万字歌词,洗出140个关键词,选前20个高频词,大胆猜测出——
男,活跃在北京或长三角,对青春和理想有情怀,外表乐观阳光,内心孤独忧伤,重朋友,单身狗,有几个纠缠不清的前女友,处于职场奋斗上升期。
「望着夜空概叹时光飞逝,我回忆起曾经的青春和奋斗的理想,心中堆满忧郁和孤独,此刻你能否给我一个拥抱?」
ps
自然语言分析情绪做得比较粗糙,举个栗子,“失去”>>负面(负值),“希望”>>正面(正值),“失去希望”>>负面,但分词自动求和的结果视各词的权重可正可负,导致误差。
各音乐网站上,每首歌曲的作词作曲、乐队成员姓名基本都有详细列明,体现了对版权和音乐人的尊重,值得一赞。
顺便对比了几大音乐网站的搜索算法和用户体验,有机会再写吧。网易云音乐确实是做得最好的,是我技术问题没抓取好。
不要纠结工具,能玩溜excel已经能做很多东西了。