分区 | DBA Blog

基础章节-01-MySQL数据库服务中级课程 1.00 课程知识章节说明目前在互联网的实际应用中，各个企业都会比较关注自身网站的数据信息，既要保证数据信息的安全性，同时也要保证数据存储读取效率并且在特殊的场景下，还要对存储的数据信息进行检索和分析；因此数据库服务业务已经在各行各业应用非常的广泛对于互联网领域的技术人员，对于数据库服务知识的掌握，也将是在求职时必备的技能，有些时候还会绝对入职的定级和薪资水平。 1.19 数据库服务分区应用 1.19.1 数据库服务分区概述 MySQL从5.1版本开始支持分区的功能；分区是指根据一定的规则，数据库把一个大表分解成多个更小的、更容易管理的部分；通俗说明：表分区就是将一个大表，根据条件分割成若干个小表；日常项目开发中经常会遇到大表的情况，所谓大表是指存储了百万级乃至千万级条记录的表。这样的表过于庞大，导致数据库在查询和插入的时候耗时太长，性能低下；如果涉及联合查询情况，性能会更加糟糕；对表进行分区，目的就是减少数据库的负担，提高数据库的效率，通常来讲就是提高表的增删改查效率分区是将数据分段划分在多个位置存放，可以是同一块磁盘也可以在不同的机器；分区后，表面上还是一张表，但数据散列到多个位置了；应用程序读写的时候操作的还是大表名字，数据库系统自动去组织分区的数据就访问数据库的应用而言，逻辑上只有一个表或一个索引，但是实际上这个表可能由数10个物理分区对象组成；每个分区都是一个独立的对象，可以独自处理，可以作为表的一部分进行处理分区对应用来说是完全透明的，不影响应用的业务逻辑例如：某个用户表的记录超过了600万条会员信息，那么就可以根据入会日期将表分区，也可以根据所在地将表分区；当然也可以根据其他的条件分区；为了改善大型表以及具有各种访问模式的表的可伸缩性，可管理性和提高数据库效率，因此具有了对表分区的需求； MySQL分区的优点主要包括以下4个方面：和单个磁盘或者文件系统分区相比，可以存储更多数据；（ext2分区单个文件2T ext3 ext4分区单个文件16T）优化查询，在where子句中包含分区条件时，可以只扫描必要的一个或多个分区来提高查询效率；使一些查询操作可以得到极大的优化；对于已经过期或者不需要保存的数据，可以通过删除与这些数据有关的分区来快速删除数据；通过删除与增加那些数据有关的分区，很容易地删除或增加那些数据；通过跨多个磁盘甚至服务器来分散数据查询，以获得更大的查询吞吐量；在MySQL5.5之后支持所有函数的分区优化，限定只查询有效数据的分区同时在涉及SUM()和COUNT()这类聚合函数的查询时，可以容易地在每个分区上并行处理，最终只需要汇总所有分区得到的结果 1.19.2 数据库服务分区技术分区有利于管理非常大的表，它采用了"分而治之"的逻辑，分区引入了分区键（partition-key）的概念；分区键用于根据某个区间值（或者范围值）、特定值列表或者HASH函数值执行数据的聚集，让数据根据规则分布在不同的分区中；最终让一个大对象变成一些小对象。 1.19.3 数据库服务分区类型(mycat 分布式存储策略–分表策略) *** 对于MySQL基本常用的分区类型有：基本分区类型 RANGE分区：基于属于一个给定连续区间的列值，把多行分配给分区； 1 select count(*) from employees where gender='F'; LIST分区：类似于按RANGE分区，区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择； HASH分区：基于用户定义的表达式的返回值来进行选择的分区，该表达式使用将要插入到表中的这些行的列值进行计算；这个函数可以包含MySQL中有效的，产生非负整数值的任何表达式 KEY分区：类似于按HASH分区，区别在于KEY分区只支持计算一列或多列，且MySQL服务器提供其自身的哈希函数。必须有一列或多列包含整数值实战演示分区操作：RANGE分区基于属于一个给定连续区间的列值，把多行分配给分区；这些区间要连续且不能相互重叠，使用values less than操作符来进行定义创建分区操作：在创建表的过程中也可以直接创建分区例如：将用户表按照年龄每个10岁进行分区；注意：分区的名字基本上遵循其他MySQL标识符应当遵循的原则，但是分区的名字是不区分大小写的；在数据表进行分区操作后，会发现表的空间文件发生了拆分变化； ...

基础章节-01-MySQL数据库服务中级课程 1.00 课程知识章节说明目前在互联网的实际应用中，各个企业都会比较关注自身网站的数据信息，既要保证数据信息的安全性，同时也要保证数据存储读取效率并且在特殊的场景下，还要对存储的数据信息进行检索和分析；因此数据库服务业务已经在各行各业应用非常的广泛对于互联网领域的技术人员，对于数据库服务知识的掌握，也将是在求职时必备的技能，有些时候还会绝对入职的定级和薪资水平。 1.19 数据库服务分区应用 1.19.1 数据库服务分区概述 MySQL从5.1版本开始支持分区的功能；分区是指根据一定的规则，数据库把一个大表分解成多个更小的、更容易管理的部分；通俗说明：表分区就是将一个大表，根据条件分割成若干个小表；日常项目开发中经常会遇到大表的情况，所谓大表是指存储了百万级乃至千万级条记录的表。这样的表过于庞大，导致数据库在查询和插入的时候耗时太长，性能低下；如果涉及联合查询情况，性能会更加糟糕；对表进行分区，目的就是减少数据库的负担，提高数据库的效率，通常来讲就是提高表的增删改查效率分区是将数据分段划分在多个位置存放，可以是同一块磁盘也可以在不同的机器；分区后，表面上还是一张表，但数据散列到多个位置了；应用程序读写的时候操作的还是大表名字，数据库系统自动去组织分区的数据就访问数据库的应用而言，逻辑上只有一个表或一个索引，但是实际上这个表可能由数10个物理分区对象组成；每个分区都是一个独立的对象，可以独自处理，可以作为表的一部分进行处理分区对应用来说是完全透明的，不影响应用的业务逻辑例如：某个用户表的记录超过了600万条会员信息，那么就可以根据入会日期将表分区，也可以根据所在地将表分区；当然也可以根据其他的条件分区；为了改善大型表以及具有各种访问模式的表的可伸缩性，可管理性和提高数据库效率，因此具有了对表分区的需求； MySQL分区的优点主要包括以下4个方面：和单个磁盘或者文件系统分区相比，可以存储更多数据；（ext2分区单个文件2T ext3 ext4分区单个文件16T）优化查询，在where子句中包含分区条件时，可以只扫描必要的一个或多个分区来提高查询效率；使一些查询操作可以得到极大的优化；对于已经过期或者不需要保存的数据，可以通过删除与这些数据有关的分区来快速删除数据；通过删除与增加那些数据有关的分区，很容易地删除或增加那些数据；通过跨多个磁盘甚至服务器来分散数据查询，以获得更大的查询吞吐量；在MySQL5.5之后支持所有函数的分区优化，限定只查询有效数据的分区同时在涉及SUM()和COUNT()这类聚合函数的查询时，可以容易地在每个分区上并行处理，最终只需要汇总所有分区得到的结果 1 select count(*) from employees where gender='F'; 1.19.2 数据库服务分区技术分区有利于管理非常大的表，它采用了"分而治之"的逻辑，分区引入了分区键（partition-key）的概念；分区键用于根据某个区间值（或者范围值）、特定值列表或者HASH函数值执行数据的聚集，让数据根据规则分布在不同的分区中；最终让一个大对象变成一些小对象。 1.19.3 数据库服务分区类型(mycat 分布式存储策略–分表策略) *** 对于MySQL基本常用的分区类型有：基本分区类型 RANGE分区：基于属于一个给定连续区间的列值，把多行分配给分区； LIST分区：类似于按RANGE分区，区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择； HASH分区：基于用户定义的表达式的返回值来进行选择的分区，该表达式使用将要插入到表中的这些行的列值进行计算；这个函数可以包含MySQL中有效的，产生非负整数值的任何表达式 KEY分区：类似于按HASH分区，区别在于KEY分区只支持计算一列或多列，且MySQL服务器提供其自身的哈希函数。必须有一列或多列包含整数值实战演示分区操作：RANGE分区基于属于一个给定连续区间的列值，把多行分配给分区；这些区间要连续且不能相互重叠，使用values less than操作符来进行定义创建分区操作：在创建表的过程中也可以直接创建分区例如：将用户表按照年龄每个10岁进行分区； ...

分区

DAY13 - MySQL分区优化与运维工具

DAY13 - MySQL分区优化与运维工具