天天看點

Greenplum -- 最全分區表操作

一、Greenplum 分區原理

分區表意思是将一個大表在實體上分割成幾塊,GPDB中的分區表和PostgreSQL中實作原理一樣,都是用過表繼承、限制來實作。但是與PostgreSQL也有所不同,在PostgreSQL中,一個父表,多個子表來實作分區表,需要手動向子表插入資料,如果向父表插入資料,則直接會被插入到父表中,在GPDB中,可以直接想父表插入資料,便可以根據限制直接自動向對應的子表插入資料,當分區子表不存在時,插入失敗

二、分區表建立

2.1、範圍分區(range)

根據分區字段的值範圍區間來分區,每一個分區就是一個子表

eg:
create table test_partition_range
(
    id int, 
    name varchar(64), 
    fdate varchar(64)
    ) distributed by (id) 
    partition by range(fdate) 
    (
        partition p1 start ('2017-01-01') inclusive end ('2017-01-31') exclusive, 
        partition p2 start ('2017-02-01') inclusive end ('2017-02-29') exclusive, 
        default partition default_p
    );

    inclusive :指定包含,例如上面的 start ('2017-01-01') inclusive 則是包含'2017-01-01'
    exclusive : 指定不包含, 例如上面的 end ('2017-01-31') exclusive 則是不包含'2017-01-31'           

2.2、快速分區(every)

根據標明的範圍,跨越基數,快速分區每一個子表

eg:
create table test_partition_every_1 
(
    id int, 
    name varchar(64), 
    fdate date
) 
distributed by (id) 
partition by range (fdate) 
(
    partition pn_ start ('2017-01-01'::date) end ('2017-12-31'::date) every ('1 day'::interval), 
    default partition default_p
);

every:指定跨越基數           

2.3、list分區(list)

根據值的分組,相同的資料歸類到一組,也就一個分區中

eg:
create table test_partition_list 
(
    id int, 
    name varchar(64), 
    fdate varchar(10)
) 
distributed by (id) 
partition by list (fdate) 
(
    partition p1 values ('2017-01-01', '2017-01-02'), 
    partition p2 values ('2017-01-03'), 
    default partition pd
);           

三、分區相關操作

3.1、分區split

切割普通分區:

将分區p2 在 '2017-02-20' 左右切分成兩塊
 alter table test_partition_range split partition p2 at ('2017-02-20') into (partition p2, partition p3); 

切割預設分區:
alter table test_partition_range split default partition start ('2017-03-01')  end ('2017-03-31')  into (partition p4, default partition);           

3.2、分區add

如果存在default partition,則不能add分區,隻能split default partition

alter table test_partition_range_1 add partition p2 start ('2017-02-01') end ('2017-02-31');           

3.3、分區drop

徹底删除對應的分區表

alter table test_partition_range_1 DROP partition p2;           

3.4、分區truncate

清空分區表資料,相當于删除分區,然後再建立一個

alter table test_partition_range_1 truncate partition p1;           

四、子分區建立與操作

4.1、子分區建立

create table test_partition_range_2 
(
    id int, 
    name varchar(64), 
    fdate varchar(10)
) 
distributed by (id) 
partition by range(fdate) 
subpartition by list(name) 
subpartition template
(
    subpartition c1 values ('xiaoxiao'), 
    subpartition c2 values ('xiaohua')
)
(
    partition p1 start ('2017-01-01') end ('2017-01-31')
)
上面的分區中,p1會再分兩個c1/c2子分區           

4.2、truncate 子分區

alter table test_partition_range_2 alter partition p1 truncate partition c2;           

4.3、drop 子分區

alter table test_partition_range_2 alter partition p1 drop partition c2;            

繼續閱讀