MySQL 标识符语法 & 命名规则
在引用数据库的元素时,标识符必须遵守以下规则:
1、标识符里的合法字符;
2、MySQL 服务器的 SQL 模式;
3、标识符的长度;
4、标识符限定符。
MySQL 语句中的字母大小写问题
- SQL 关键字和函数名:不区分
- 数据库、数据表和视图的名字:Windows 和 Mac OS X 平台不区分、Unix 平台区分。
- 存储程序的名字:不区分。但是触发器的名字要区分字母大小写。
- 列名和索引名:不区分。
- 别名的名字:默认情况下,不区分。
- 字符串值:取决于是否为二进制,而非二进制字符串还要取决于字符集的排序方式(校验规则)。
不管系统是否区分大小写,都使用一致的大小写组合来使用。
字符集支持
MySQL 的字符集支持机制提供了以下一些功能:
- MySQL 服务器允许同时使用多种字符集。
- 一种给定的字符集可以有一种或多种排序方式(校验规则)。
- 支持 Unicode 的字符集有:utf8 和 ucs2 字符集、utf116、utf32 和 utf8mb4 字符集,以及 utf16le。
- 你可以在服务器、数据库、数据表、数据列和字符串常数等级别设定字符集;
- 既有用来转换数据值的字符集的函数和操作符,也有用来判断数据值的字符集的函数和操作符。
- SHOW 语句和 INFORMATION_SCHEMA 数据表提供了关于可用字符集合排序方式(校验规则)的信息。
- 当你改变某个带索引的字符类型的数据列时,MySQL 服务器将自动地对索引进行重新排序。
字符集的设定
-- 在创建**数据库**时,设置一个默认的字符集和排序方式(校对规则)
CREATE DATABASE db_name CHARACTER SET charset COLLATE collation;
-- 如果想为某个**数据表**设定默认的字符集和排序方式(校对规则),如果没有设定,则使用数据库级别的默认设置。
CREATE TABLE tbl_name(...) CHARACTER SET charset COLLATE collation;
-- 对于数据表里的某个**数据列**,可以使用 CHARACTER 和 COLLATION 属性为它指定一个字符集和排序方式(校对规则),如果没有设定,则使用数据表级别的默认设置
c CHAR(10) CHARACTER SET charset COLLATE collation
-- 属性适用于 CHAR、VARCHAR、TEXT、ENUM 和 SET 数据类型。
也可以利用 COLLATE 操作符按照特定排序方式对字符串值排序。
SELECT name FROM student ORDER BY name COLLATE utf8_spanish_ci;
查看可供选用的字符集和当前设置
-- 查看 mysql 服务器支持的字符集
SHOW CHARACTER SET;
SHOW CHARACTER SET LIKE 'latin%';
SELECT * FROM information_schema.character_sets;
-- 查看字符集的校对规则
SHOW COLLATION;
SHOW COLLATION like 'utf8%';
select * from information_schema.collations where collation_name like 'utf8%';
-- 查看当前数据库的字符集
show variables like 'character%';
-- character_set_client:客户端请求数据的字符集
-- character_set_connection:客户机/服务器连接的字符集
-- character_set_database:默认数据库的字符集,无论默认数据库如何改变,都是这个字符集;如果没有默认数据库,那就使用 character_set_server 指定的字符集,这个变量建议由系统自己管理,不要人为定义。
-- character_set_filesystem:把 os 上文件名转化成此字符集,即把 character_set_client 转换 character_set_filesystem, 默认 binary 是不做任何转换的
-- character_set_results:结果集,返回给客户端的字符集
-- character_set_server:数据库服务器的默认字符集
-- character_set_system:系统字符集,这个值总是 utf8,不需要设置。这个字符集用于数据库对象(如表和列)的名字,也用于存储在目录表中的函数的名字。
-- 查看当前数据库的校对规则
show variables like 'collation%';
-- collation_connection 当前连接的字符集。
-- collation_database 当前日期的默认校对。每次用 USE 语句来“跳转”到另一个数据库的时候,这个变量的值就会改变。如果没有当前数据库,这个变量的值就是 collation_server 变量的值。
-- collation_server 服务器的默认校对
-- 排序方式的命名规则为:字符集名字_语言_后缀,其中各个典型后缀的含义如下:
-- _ci:不区分大小写的排序方式
-- _cs:区分大小写的排序方式
-- _bin:二进制排序方式,大小比较将根据字符编码,不涉及人类语言,因此 _bin 的排序方式不包含人类语言