mysql数据到千万级别分区分表

2022-11-01 18:43:17

当数据量太大时，提高查询效率，因为只用扫描指定分区，删除分区效率高。

查询的时候加上select * from user partition(区间名);

有range分区：用partition按自己分配的区间分区。

list分区：用partition按list集合分区。

CREATE TABLE provinces (
       id INT,
       province_name VARCHAR(20),
       province_id INT,
       num_people INT
     )DEFAULT CHARSET = utf8       
     PARTITION BY LIST(province_id) (
      PARTITION p0 VALUES IN (0),
      PARTITION p1 VALUES IN (1)
     );

hash分区：

CREATE TABLE tbhash (
    id INT NOT NULL,
    store_id INT
)
PARTITION BY HASH(store_id)
PARTITIONS 4
;

ALTER TABLE tbhash ADD INDEX ix_store_id(store_id);

INSERT INTO tbhash() VALUES(1,100),(1,101),(2,102),(3,103),(4,104);

SELECT PARTITION_NAME,PARTITION_METHOD,PARTITION_EXPRESSION,PARTITION_DESCRIPTION,TABLE_ROWS,SUBPARTITION_NAME,SUBPARTITION_METHOD,SUBPARTITION_EXPRESSION 
FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA=SCHEMA() AND TABLE_NAME='tbhash';

hash分区只对整数进行hash，非整形的需要函数或者表达式来计算，所以不推荐太过复杂的函数来计算，会降低效率，给定分区，然后平均分给每个分区。

线性HASH(LINEAR HASH)：与常规hash分区不同的是，partition by linear hash(store_id) partitions 4;

优点是增加，修改，合并拆分效率更高，但常规hash的数据分布更均匀。

hash分区和range分区不同的是:range分区能直接用drop删除某一个分区，hash只能合并分区，

alert table ... coalesce partition num 此处num代表合并的分区数量。

alert table ... add partition partitions num 此处num代表新增的分区。

移除分区用:alert table ... remove partitions。与drop不同，drop会连数据一起删除，remove仅仅是移除分区。

key分区：partition by linear key () partitions 4;

子分区：假如一家员工的数据存储到数据库，按员工日期年份分区之后又再次按天分区，就可以用到子分区。

mysql数据到千万级别分区分表

分表：

继续阅读

Kafka：Topic概念与API介绍

5G小型蜂应用指南

PAT (Advanced Level) Practise 1012 The Best Rank (25)

mysql5.7的sql优化

线程通信和进程通信区别（线程进程区别）

Matlab随机波动率SV、GARCH用MCMC马尔可夫链蒙特卡罗方法分析汇率时间序列

微信小程序前端解密获取用户信息

Spring MVC 自学杂记（五） -- SpringMVC与前台的json数据交互

《MySQL技术内幕：InnoDB存储引擎》笔记

扩容TIKV节点遇到的坑

PHP辅导代做编程：CS353 Database System

自学Zabbix3.10.2-事件通知Notifications upon events-Actions报警配置点击返回：自学zabbix集锦

HDU 5678 ztr loves trees

拓端tecdat|R语言弹性网络Elastic Net正则化惩罚回归模型交叉验证可视化

二叉树及其应用--二叉树创建

详解STM32单片机的堆栈