天天看点

Oracle数据块格式

数据块结构

Oracle 数据块有三部分:

Cache layer

Transaction layer

Data layer

Oracle Data Block的结构简图如下,其中从Data header到Row Data部分合称Data Layer:

  • Cache Layer -
  • Transaction Layer -
  • Data Header -
  • Table Directory -
  • Row Directory -
  • Free Space -
  • Row Data -
  • Tailchk -

下面将使用bbed工具来显示相关结构信息

BBED> map

File: /u01/app/oracle/oradata/shardcat/users01.dbf (7)

Block: 135 Dba:0x01c00087

KTB Data Block (Table/Cluster)

struct kcbh, 20 bytes @0

struct ktbbh, 72 bytes @20

struct kdbh, 14 bytes @100

struct kdbt[1], 4 bytes @114

sb2 kdbr[8] @118

ub1 freespace[7983] @134

ub1 rowdata[71] @8117

ub4 tailchk @8188

数据块组件

Oracle数据块三层C结构,它被映射到SGA kcbh(内核缓存数据块头)中的数据块。Cache Layer包含关于块格式,类型(数据,索引,头等)信息和序列数据。

BBED> p kcbh

struct kcbh, 20 bytes @0

ub1 type_kcbh @0 0x06

ub1 frmt_kcbh @1 0xa2

ub2 wrp2_kcbh @2 0x0000

ub4 rdba_kcbh @4 0x01c00087

ub4 bas_kcbh @8 0x01286184

ub2 wrp_kcbh @12 0x0000

ub1 seq_kcbh @14 0x01

ub1 flg_kcbh @15 0x06 (KCBHFDLC, KCBHFCKV)

ub2 chkval_kcbh @16 0x0137

ub2 spare3_kcbh @18 0x0000

Cache Layer:Block的第一部分,长度为20字节,内部数据结构名为kcbh,包括

type_kcbh:块类型(table/index,rollback segment,temporary segment等)

frmt_kcbh:块格式(v6,v7,v8)

rdba_kcbh:块地址DBA

bas_kcbh/wrp_kcbh:SCN

seq_kcbh:块的序列号

flg_kcbh:块的标志

事务层存储了关于数据块的事务信息

Transaction Layer:内部结构名ktbbh。分成两部分,第一部分为固定长度,长度为24字节,包含事务相关的一些基本信息。第二部分为可变长度,包含itl,长度根据itl条目的个数变化,每个itl长度为24字节,内部结构名ktbbhitl

BBED> p ktbbh

struct ktbbh, 72 bytes @20

ub1 ktbbhtyp @20 0x01 (KDDBTDATA)

union ktbbhsid, 4 bytes @24

ub4 ktbbhsg1                          @24       0x0001af27
  ub4 ktbbhod1                          @24       0x0001af27           

struct ktbbhcsc, 8 bytes @28

ub4 kscnbas                           @28       0x01286182
  ub2 kscnwrp                           @32       0x8000
  ub2 kscnwrp2                          @34       0x0000           

sb2 ktbbhict @36 7938

ub1 ktbbhflg @38 0x32 (NONE)

ub1 ktbbhfsl @39 0x00

ub4 ktbbhfnx @40 0x01c00080

struct ktbbhitl[0], 24 bytes @44

struct ktbitxid, 8 bytes              @44
     ub2 kxidusn                        @44       0x0006
     ub2 kxidslt                        @46       0x0012
     ub4 kxidsqn                        @48       0x000038f6
  struct ktbituba, 8 bytes              @52
     ub4 kubadba                        @52       0x010002d9
     ub2 kubaseq                        @56       0x10c9
     ub1 kubarec                        @58       0x09
  ub2 ktbitflg                          @60       0x8000 (KTBFCOM)
  union _ktbitun, 2 bytes               @62
     sb2 _ktbitfsc                      @62      -32768
     ub2 _ktbitwrp                      @62       0x8000
  ub4 ktbitbas                          @64       0x01228dbb           

struct ktbbhitl[1], 24 bytes @68

struct ktbitxid, 8 bytes              @68
     ub2 kxidusn                        @68       0x0008
     ub2 kxidslt                        @70       0x001b
     ub4 kxidsqn                        @72       0x00003a9a
  struct ktbituba, 8 bytes              @76
     ub4 kubadba                        @76       0x010002b5
     ub2 kubaseq                        @80       0x114f
     ub1 kubarec                        @82       0x20
  ub2 ktbitflg                          @84       0x2001 (KTBFUPB)
  union _ktbitun, 2 bytes               @86
     sb2 _ktbitfsc                      @86       10
     ub2 _ktbitwrp                      @86       0x000a
  ub4 ktbitbas                          @88       0x01286184           

这种结构出现在数据库每个数据块的开头部分。它甚至出现在不由redo改变的排序块中。它也会出现在数据文件头块和控制文件头块的开头部分。缓存层提供了对坏数据的规模。它也用来确保正确的数据块被读取并且数据块没有破裂或损坏。所谓破裂的数据块就是只有一部分被写入磁盘,数据块的一部分保留了之前的版本。

Data Layer:包括Data Header,Table Directory,Row Directory,Free Space和Row Data。

Data Header:长度14字节,内部数据结构名kdbh

BBED> p kdbh

struct kdbh, 14 bytes @100

ub1 kdbhflag @100 0x00 (NONE)

sb1 kdbhntab @101 1

sb2 kdbhnrow @102 8

sb2 kdbhfrre @104 -1

sb2 kdbhfsbo @106 34

sb2 kdbhfseo @108 8017

sb2 kdbhavsp @110 7977

sb2 kdbhtosp @112 7989

其中kdbhnrow是存储在数据块中的记录数为8,而表中确实有8条记录。(从ROWID可以判断出来)

SQL> select dbms_rowid.rowid_block_number(rowid),t1.t_id,t1.t_name from jy.t1;

DBMS_ROWID.ROWID_BLOCK_NUMBER(ROWID) T_ID T_NAME

------------------------------------ ---------- ----------------------------------------

134          9 YYL
                             135          1 A
                             135          2 B
                             135          3 C
                             135          4 D
                             135          5 E
                             135          6 F
                             135          7 JYHY
                             135          8 JYYYL
           

9 rows selected.

Table Directory: 一般table只有一个条目,cluster则有一个或多个条目。每个条目长4字节,内部数据结构名kdbt

BBED> p kdbt

struct kdbt[0], 4 bytes @114

sb2 kdbtoffs @114 0

sb2 kdbtnrow @116 8

Row Directory:数目由块中数据的行数决定,每个条目长2字节,内部数据结构名kdbr

BBED> p kdbr

sb2 kdbr[0] @118 8080

sb2 kdbr[1] @120 8072

sb2 kdbr[2] @122 8064

sb2 kdbr[3] @124 8056

sb2 kdbr[4] @126 8048

sb2 kdbr[5] @128 8040

sb2 kdbr[6] @130 8029

sb2 kdbr[7] @132 8017

查看表中的记录数据,一个重复计数也可以被指定用来重复执行examine命令来检查后续的行记录。下面的例子显示了先使用print命令来设置最后一行记录的偏移量,然后检查后面的8行记录的操作.

BBED> p *kdbr[7]

rowdata[0]

ub1 rowdata[0] @8117 0x2c

BBED> x /8rnc

rowdata[0] @8117

flag@8117: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8118: 0x02

cols@8119: 2

col 0[2] @8120: 8

col 1[5] @8123: JYYYL

rowdata[12] @8129

flag@8129: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8130: 0x00

cols@8131: 2

col 0[2] @8132: 7

col 1[4] @8135: JYHY

rowdata[23] @8140

flag@8140: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8141: 0x00

cols@8142: 2

col 0[2] @8143: 6

col 1[1] @8146: F

rowdata[31] @8148

flag@8148: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8149: 0x00

cols@8150: 2

col 0[2] @8151: 5

col 1[1] @8154: E

rowdata[39] @8156

flag@8156: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8157: 0x00

cols@8158: 2

col 0[2] @8159: 4

col 1[1] @8162: D

rowdata[47] @8164

flag@8164: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8165: 0x00

cols@8166: 2

col 0[2] @8167: 3

col 1[1] @8170: C

rowdata[55] @8172

flag@8172: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8173: 0x00

cols@8174: 2

col 0[2] @8175: 2

col 1[1] @8178: B

rowdata[63] @8180

flag@8180: 0x2c (KDRHFL, KDRHFF, KDRHFH)

lock@8181: 0x00

cols@8182: 2

col 0[2] @8183: 1

col 1[1] @8186: A

Free Space:表示数据块中可用空间,内部数据结构名freespace

Row Data:表示实际的数据,内部数据结构名rowdata

BBED> p rowdata[0]

BBED> d /v offset 8117

Block: 135 Offsets: 8117 to 8191 Dba:0x01c00087

2c020202 c109054a 5959594c 2c000202 l ,......JYYYL,...

c108044a 5948592c 000202c1 0701462c l ...JYHY,......F,

000202c1 0601452c 000202c1 0501442c l ......E,......D,

000202c1 0401432c 000202c1 0301422c l ......C,......B,

000202c1 02014101 068461 l ......A...a

<16 bytes per line>

Tailchk:保存在块结尾用于校验的数据,长度4个字节,内部结构名tailchk。所有Oracle块的最后四个字节都是tail check(结尾检查)。

对于一个Oracle 8以上版本的数据块的tail它是由SCN base的低位两字节的内容,数据块的类型与SCN序列号组成的。例如,如果SCN base为 0x01286184,数据块类型为0x06,SCN序列号为0x01,那么tail check将是0x61840601

BBED> p tailchk

ub4 tailchk @8188 0x61840601

虽然tail check的值通常是由这三个组件级成,Oracle会对最终的值作为一个值(4字节)以单无符号整数来存储。在小字节序编码(little-endian)的构架机器中,比如Intel,这个值将以低位字节优先的方式来存储。因此如果使用标准块编辑器或dump命令来检查数据块的tail check时,字节顺序可能不一样。一个tail check为0x61840601,在Intel机器上它将以"01068461"的形式存储在磁盘。

BBED> dump /v offset 8188

Block: 135 Offsets: 8188 to 8191 Dba:0x01c00087

01068461 l ...a