为了能够明确今后的学习方向,爬取贵阳的数据岗位进行分析,看看公司都需要应聘者掌握哪些技能。
我只取了大于或等于3个字符长度的词语进行排序。因为1-2个字符的词语大多没有意义。以下为出现次数排名前100位的词语。
[('数据库', 125),
('以上学历', 105),
('岗位职责', 97),
('数据分析', 96),
('SQL', 50),
('数据挖掘', 47),
('责任心', 44),
('计算机', 37),
('熟练掌握', 36),
('MySQL', 33),
('逻辑思维', 29),
('互联网', 29),
('Hadoop', 28),
('数据处理', 28),
('解决方案', 28),
('数据仓库', 26),
('中国移动', 24),
('Python', 23),
('Java', 21),
('Linux', 21),
('分布式', 21),
('Oracle', 20),
('吃苦耐劳', 20),
('表达能力', 19),
('管理工作', 18),
('客户关系', 18),
('ETL', 17),
('架构设计', 17),
('工程师', 16),
('Spark', 16),
('市场营销', 16),
('应变能力', 16),
('普通话', 16),
('oracle', 16),
('Hive', 15),
('计算机相关', 14),
('操作系统', 14),
('PPT', 14),
('统计学', 14),
('项目管理', 14),
('营销策划', 14),
('提供数据', 13),
('统计分析', 13),
('数据业务', 13),
('EXCEL', 12),
('HBase', 12),
('编程语言', 12),
('数据模型', 12),
('积极主动', 12),
('开发技术', 12),
('贵阳市', 12),
('SAS', 11),
('SPSS', 11),
('竞争对手', 11),
('执行力', 11),
('mysql', 11),
('可视化', 10),
('解决问题', 10),
('主动性', 10),
('认真负责', 10),
('市场策略', 10),
('董事长', 10),
('加油站', 10),
('office', 9),
('准确性', 9),
('excel', 9),
('业务部门', 9),
('理解能力', 9),
('hadoop', 9),
('节假日', 9),
('ERP', 9),
('活泼开朗', 9),
('加油卡', 9),
('Excel', 8),
('UNIX', 8),
('MapReduce', 8),
('数据报表', 8),
('实战经验', 8),
('专业本科', 8),
('上进心', 8),
('亲和力', 8),
('资源整合', 8),
('主城区', 8),
('一次性', 8),
('大礼包', 8),
('记录仪', 8),
('净化器', 8),
('点半晚', 8),
('2500', 8),
('判断能力', 7),
('内外部', 7),
('shell', 7),
('团队精神', 7),
('Web', 7),
('Hbase', 7),
('福利待遇', 7),
('Storm', 7),
('Kafka', 7),
('语言表达', 7),
('运营商', 7)]
我们可以看到‘数据库’和‘SQL’出现次数特别高。我们看看哪种数据库使用的比较多,‘MYSQL’名列前茅。‘MYSQL’加‘mysql'出现了44次,’Oracle'加’oracle'出现了36次,mysql与oracle不相上下。所以我下一阶段得加深数据库的学习,就从mysql入手吧。
其他技能排序依次为hadoop,python,java,linux,ETL,spark,hive。
还可以看到一个有趣的现象,‘中国移动’出现次数很高,可见在贵阳很多搞数据的是在给移动公司做。