小白初学mysql

谢谢程老师把我带进mysql中，刚开始学习python的时候，他就推荐需要学习数据库。和他交流很多，比我小很多，但是俨然一个小老师。从新建一张表到插入数据，边做边深掘一个一个知识点。也看了很多他分享的文章，很有自己的思想，而且非常详细的在例子里备注很多知识点。

我写简书的目的还是督促自己要记录，可以经常回顾，养成一个爱学习的好习惯。

主要知识点

一、mysql的基本操作（只是目前学到的知识打个卡哈，后边还有许多操作需要自学）
二、Scrapy中引入自建的Mysql类（直接拿老师的过来用）

第一部分

mysql 的基本操作：

工具
推荐数据库管理工具：Navicat for mysql.
1）建立数据库链接，
输入连接名
主机名（本地机是localhost,或者ip地址是：127.0.0.1）
端口：3306
用户名／密码：很重要！！！（scrapy中连接mysql的接口需要）

Paste_Image.png

请原谅我不知道怎么调整图片大小
最后点下“连接测试”，测试成功，就可以看到一下界面

可以看到上边的小海豚是你的连接名。
2）连接成功后，建立自己的mysql数据库。

Paste_Image.png

注意默认字符集是utf8#

Paste_Image.png

图中的是local_db(这个也很重要）
我test的时候又新建了一个新的数据库名字是“suzy”
3）现在可以开始建表了
打mysql命令的地方在这里，点击查询，然后在空白处右键选择“新建查询”。

Paste_Image.png

命令如下：

use suzy;  # 先指定数据库名‘suzy’
create table score(   # 新建表名是score
student_name varchar(100),  
#表中的字段名“student_name“，类型是varchar(100)
course varchar(100),
score int(11),
key name(student_name)
# key是索引，把字段名student_name作为索引
)engine=innodb default charset=utf8
#默认的结尾

这样一张表就建好了。但是目前没有数据
4）插入数据到表名为suzy的表中。这样表就是一张完整表了

insert into score values('liming','chinese',90);
#这里的values（）的内容的数据类型必须和建表的时候设置的数据类型一致

也可以写成

insert into score (student_name,course,score)  #在score表的哪几个字段插入数据
values   
('liming','chinese',90); #插入数据的值

然后执行一下，数据就插进去了
可以通过以下查询语句看到表的结构和数据
4）查询表

select * from score   
# ‘*’表示score表的所有字段的数据都显示
#如果要选择某几个字段，可以写成 select course from score

Paste_Image.png

如果要指定查询表的某几条记录，可以加入条件where

SELECT field1, field2,...fieldN FROM table_name
WHERE condition

5)左连接运算---LEFT UNION（不好意思现在只学了左连接）
主体意思就是：有2张表，一张左表，一张右表吧，它两有共同都字段集，也有不同都字段集。由于左表是老大，右表想要和他连结，然后通过共同字段连结后，把右表有但是左表没有的字段集贡献给左表，左表就可以扩张自己字段集（本身字段+右表贡献都字段），这样可以理解哇
废话不说，举栗子：
创建新都一个表，假设以及插入数据如下：

score表.png

name_id表.png

第一个图就是左表，left join的左表都是数据比较全都那种，第二个图是右表，第一个张表的学生没有id，现在把第二张表student_name对应都
name_id给第一张表。需要写如下sql命令：

select a.*,b.name_id
from score as a
left join name_id as b on b.student_name=a.student_name
order by b.name_id

注意查询表都不是物理存在的表，所以我们可以对查询表中引用的物理
表做一个另命名 ，score as a 表示把表score另命名为a表，所以查询
表的字段为a.* 表示score表的所有字段。left join 的右边就是你要被左
表连结的表。on为辅助条件，就是2表都有的共同字段，这里表示如果
有b表的学生名和a表的学生名一致，则把b表学生的id给到查询表。

结果如下：

Paste_Image.png

该查询表的主体还是左表score的所有记录，只是添加了一个新的字段name_id，这个id的值是根据右表name_id的学生名对应的id。

好，先介绍这么多，现在有了这几个基础，就可以把之前scrapy版的爬虫进行改造了。

第二部分

Scrapy中引入自定义的Mysql类

我之前做的scrapy都是存储为csv，这次可以用程老师自己做的Mysql类来存储数据到mysql数据库中了。

class Mysql():
    #绑定3个参数 表名 字段列表 字段数量
    def __init__(self,table_name,field_list=[],field_num=0):
        self.table_name=table_name
        self.field_list=field_list
        self.field_num=field_num

    #建表函数
    def create_table(self):
        Field_list=[]
        for field in self.field_list:
            field+=' varchar(500)'
            Field_list.append(field)
        field_str=','.join(Field_list)

        engine='engine=innodb default charset=utf8'
        create_sql_str='create table IF NOT EXISTS %s(%s)%s' % (self.table_name,field_str,engine)
        print create_sql_str
        conn = MySQLdb.connect(host='localhost', user='root', passwd='123456', db='local_db', port=3306,charset='utf8')
        with conn:
            cursor =conn.cursor()
            cursor.execute(create_sql_str)
    #插入数据函数 接收一个字典参数
    def insert(self,item={}):
        conn = MySQLdb.connect(host='localhost', user='root', passwd='123456', db='local_db', port=3306,charset='utf8')
        #列表转字符串  用于构造insert_sql
        data=','.join(["'"+ item[i]+"'" for i in range(1,self.field_num+1)])
        with conn:
            cursor = conn.cursor()
            insert_sql='insert into %s values (%s) '% (self.table_name,data)
            print insert_sql
            cursor.execute(insert_sql)
            conn.commit()

先把这个类py文件放在scrapy的和pipelines.py同级的目录下。
如下：

Paste_Image.png

好现在开始介绍一下这个自建类。类名：Mysql
def init(self,table_name,field_list=[],field_num=0):在初始话的时候，类就需要有3个形参“table_name”，“field_list”这个是列表，如果类实列化的时候，这个传入的实参是空的，则这个默认是空列表。field_num也一样，默认是0.
这个自建类的方法有2个，一个是creat_table(self),一个是insert()方法。
先说create_table方法。他主要是把field_list列表的字段插入 varchar(500)后然后强制字符串化。这个就是在组建mysql的create table命令
create_sql_str就是一句创建表的mysql语句。
另外：conn = MySQLdb.connect(host='localhost', user='root', passwd='123456', db='local_db', port=3306,charset='utf8')这个就是打开数据库连接的关键语句。其中host='localhost'这是我们的连接名。user，passwd，db，port都是我们上边创建数据库的关键信息。如果写错误了，那么scrapy就不能和mysql数据库对接。
with conn：表示打开连接，数据传输完毕后关闭。
cursor 是数据库游标，执行之前的mysql命令，就想刚刚我们新建查询中输入mysql命令一样。cursor.execute(create_sql_str)

另外一个insert()方法也是一样的。
现在类已经存在在scrapy中了，我们现在需要做的就是调用这个类，奖数据存到mysql数据库中。
scarpy框架中的数据存储设置是放在pipeline.py中。

pipelines.py

from class_mysql import Mysql
field_list=['companyFullName','companySize','positionName','education','financeStage','salary','city','positionAdvantage']
field_num=len(field_list)
project=Mysql('lagoutest',field_list,field_num)
project.create_table()

class LagouPipeline(object):
    def process_item(self, item, spider):

        project.insert(item)

from class_mysql import Mysql就是我们从class_mysql.py引入Mysql这个类
field_list,field_num都是实参。
project=Mysql('lagoutest',field_list,field_num) project就是实列化这个Mysql类，把3个参数传入其中。‘lagoutest'是类中数据库的存储数据的表名。field_list就是表的字段名。
然后在把pipelines.py的自带类的方法process_item()中执行mysql的insert插入数据语句。process_item()就是表示保存数据到文件中的作用。
project.insert(item)这里到item就是我们写主爬虫的时候到yield item中的item。注意item是一个字典。我们在构造Mysql类的时候方法insert(参数）参数是一个字典。它的key=for i in range(1,field_num+1),所以在写主爬虫的时候，yield item的item需要为item[1],item[2],item[3]......,如下

Paste_Image.png

我们看一下这个执行的结果：

Paste_Image.png

可以看到local_db数据库中多了一个新建的表lagoutest。

在看一下scrapy跑的时候，可以看到insert into table的mysql语句在执行。

Paste_Image.png

总结：

第一次用sql 开心！奖励自己一个甜品！想减肥撸代码！

最后编辑于：2020.01.08 09:08:34

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,214评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,307评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,543评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,221评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,224评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,007评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,313评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,956评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,441评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,925评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,018评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,685评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,234评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,240评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,464评论 1赞 261
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,467评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,762评论 2赞 345

小白初学mysql

主要知识点

第一部分

mysql 的基本操作：

注意默认字符集是utf8#

第二部分

Scrapy中引入自定义的Mysql类

pipelines.py

总结：

第一次用sql 开心！奖励自己一个甜品！想减肥撸代码！

推荐阅读更多精彩内容