数据产品经理要做数据分析,首先要学如何获取数据。有些人说,我请开发小伙伴导数据不行吗?一方面工作中,获取数据是一个比较频繁的事情,你经常麻烦同事帮忙取数据不现实;另一方面生产环境的数据也是非常敏感的,不可能随便导出使用。
基础概念
我们一般使用什么工具查询数据呢?就是用SQL语言从数据库查询数据。
什么是SQL?
操作数据库里数据的一种结构化开发语言。
什么是数据库,什么是表?
你可以把数据库想象成一个储存文件的“书柜”;书柜里面的一本本书就是数据库里的“表”;书里面印刷的字就是“表”里面的“数据”。
数据库有很多种类型,一般来说用的比较多的是关系数据库。顾名思义:关系数据库=多张表+各表之间的关系。
表的一般结构是什么样的?
数据库里面的“表”和Excel里面的表是一样的。一般包括三个部分:表的名称,表的列,和记录数据的行。如下图:
蓝色背景的是表的名称(这个不在表的内容里面,为了展示方便,我写在了表里面)。
绿色部分是表列名。
白色部分是记录数据的行。
表与表之间如何建立起关系?
通常一个关系数据库里面会有很多张表,不同的表之间通过什么建立关系呢?下面列了一个数据库的两张表:左边是出版商表,右边是财经书籍表:
出版商表的灰色部分是中信出版商的基本信息,财经书籍表的灰色部分是中信出版商出版的书籍信息,我们就可以认为这两张表的灰色部分都会通过“出版商编号”关联起来了。(为什么不是出版商名称?因为名字可能会重复,但是编号一般是去重的)。出版商编号也叫做出版商表里的"主键"。
因此,表和表之间一般都是通过主键关联起来。
表和表之间有关系也就是表之间的数据能够通过主键匹配起来。
如何安装数据库?
数据库软件是用来存放数据的工具,市面上有很多种,如MySQL、Oracle、Microsoft SQL Service。我们这里主要介绍MySQL。
使用MySQL数据库,一般要安装两个软件:
MySQL:这是一个关系型数据库管理软件。下载地址:https://dev.mysql.com/downloads/(先安装这个)
访问数据库的图形化工具:这个有很多软件,Introduction、Dbeaver、Navicat等等。我一般用Navicat(要付费购买,可免费试用。)下载地址:https://www.navicat.com.cn/products
安装步骤:
我的电脑是mac,我介绍下mac的安装方法,windows大同小异:
1 .MYSQL的安装,一路默认安装,中间有一步需要设置密码,这个密码一定要记住,后面连接数据库的时候要使用:
2 .安装完成后,打开系统偏好设置,验证是否安装成功。(有下图的小海豚就成功了)
3 .安装Navicat,下载后按照默认路径安装直至完成就可以。
4 .Navicat连接数据库:打开左上角的【连接】,选择【mysql】,弹出如下窗口:
连接名:自己随便起一个名字。
添加到、主机、端口、用户名:都不用修改,默认的值就可以。
密码:输入刚才第一步设置的密码。
以上内容都输入完后,点左下角的【连接测试】。连接成功,则表明连接成功。
5 .验证连接成功,连接成功后,软件左边就出现连接的数据库。接下来就可以在数据库里面新建、删除表,插入,更新数据等操作。
数据获取的基本工具已经准备妥当,接下来会讲一下SQL基本语法,简单查询,复杂查询,多表查询,汇总分析等。
欢迎持续关注