`

Oracle 高水位概念(hwm)

阅读更多

说到HWM,我们首先要简要的谈谈ORACLE的逻辑存储管理.我们知道,ORACLE在逻辑存储上分4个粒度:表空间,段,区和块. 

(1)块:是粒度最小的存储单位,现在标准的块大小是8K,ORACLE每一次I/O操作也是按块来操作的,也就是说当ORACLE从数据文件读数据时,是读取多少个块,而不是多少行. 


(2)区:由一系列相邻的块而组成,这也是ORACLE空间分配的基本单位,举个例子来说,当我们创建一个表PM_USER时,首先 ORACLE会分配一区的空间给这个表,随着不断的INSERT数据到PM_USER,原来的这个区容不下插入的数据时,ORACLE是以区为单位进行扩展的,也就是说再分配多少个区给PM_USER,而不是多少个块. 


(3)段:是由一系列的区所组成,一般来说,当创建一个对象时(表,索引),就会分配一个段给这个对象.所以从某种意义上来说,段就是某种特定的数据.如CREATE TABLE PM_USER,这个段就是数据段,而CREATE INDEX ON PM_USER(NAME),ORACLE同样会分配一个段给这个索引,但这是一个索引段了.查询段的信息可以通过数据字典: SELECT * FROM USER_SEGMENTS来获得, 


(4)表空间:包含段,区及块.表空间的数据物理上储存在其所在的数据文件中.一个数据库至少要有一个表空间. 




OK,我们现在回到HWM上来,那么,什么是高水位标记呢?这就跟ORACLE的段空间管理相关了. 


(一)ORACLE用HWM来界定一个段中使用的块和未使用的块. 


举个例子来说,当我们创建一个表:PT_SCHE_DETAIL时,ORACLE就会为这个对象分配一个段.在这个段中,即使我们未插入任何记录,也至少有一个区被分配,第一个区的第一个块就称为段头(SEGMENT HEADE),段头中就储存了一些信息,基中HWM的信息就存储在此.此时,因为第一个区的第一块用于存储段头的一些信息,虽然没有存储任何实际的记录, 但也算是被使用,此时HWM是位于第2个块.当我们不断插入数据到PM_USER后,第1个块已经放不下后面新插入的数据,此时,ORACLE将高水位之上的块用于存储新增数据,同时,HWM本身也向上移.也就是说,当我们不断插入数据时,HWM会往不断上移,这样,在HWM之下的,就表示使用过的块,HWM之上的就表示已分配但从未使用过的块. 


(二)HWM在插入数据时,当现有空间不足而进行空间的扩展时会向上移,但删除数据时不会往下移. 


这就好比是水库的水位,当涨水时,水位往上移,当水退出后,最高水位的痕迹还是清淅可见. 


考虑让我们看一个段,如一张表,其中填满了块,如图 1 所示。在正常操作过程中,删除了一些行,如图 2 所示。现有就有了许多浪费的空间:(I) 在表的上一个末端和现有的块之间,以及 (II) 在块内部,其中还有一些没有删除的行。   


  


   


图" 1:分配给该表的块。用灰色正方形表示行 


ORACLE 不会释放空间以供其他对象使用,有一条简单的理由:由于空间是为新插入的行保留的,并且要适应现有行的增长。被占用的最高空间称为最高使用标记 (HWM),如图 2 所示。   


  


   


图" 2:行后面的块已经删除了;HWM 仍保持不变 


(三)HWM的信息存储在段头当中. 


HWM本身的信息是储存在段头.在段空间是手工管理方式时,ORACLE是通过FREELIST(一个单向链表)来管理段内的空间分配.在段空间是自动管理方式时(ASSM),ORACLE是通过BITMAP来管理段内的空间分配. 


(四)ORACLE的全表扫描是读取高水位标记(HWM)以下的所有块. 


所以问题就产生了(一直不解为何ORACLE会采用这种不合理的方式).当用户发出一个全表扫描时,ORACLE 始终必须从段一直扫描到 HWM,即使它什么也没有发现。该任务延长了全表扫描的时间。 


(五)当用直接路径插入行时 — 例如,通过直接加载插入(用 APPEND 提示插入)或通过 SQL*LOADER 直接路径 — 数据块直接置于 HWM 之上。它下面的空间就浪费掉了。 




我们来分析这两个问题,后者只是带来空间的浪费,但前者不仅是空间的浪费,而且会带来严重的性能问题.我们来看看下面的例子: 


(A)我们先来搭建测试的环境,第一步先创建一个段空间为手工管理的表空间: 


CREATE TABLESPACE "RAINNY" 
LOGGING 
DATAFILE 'D:ORACLE_HOMEORADATARAINNYRAINNY.ORA' SIZE 5M 
AUTOEXTEND 
ON NEXT 10M MAXSIZE UNLIMITED EXTENT MANAGEMENT LOCAL 
SEGMENT SPACE MANAGEMENT MANUAL; 

(B)创建一个表,注意,此表的第二个字段我故意设成是CHAR(100),以让此表在插入1千万条记录后,空间有足够大: 


CREATE TABLE TEST_TAB(C1 NUMBER(10),C2 CHAR(100)) TABLESPACE RAINNY; 


插入记录DECLARE 
I NUMBER(10);BEGIN 
FOR I IN 1..10000000 LOOP 
INSERT INTO TEST_TAB VALUES(I,'TESTSTRING'); 
END LOOP; 
COMMIT;END ; 


(C)我们来查询一下,看在插入一千万条记录后所访问的块数和查询所用时间: 


SQL> SET TIMING ON 


SQL> SET AUTOTRACE TRACEONLY 


SQL> SELECT COUNT(*) FROM TEST_TAB; 




ELAPSED: 00:01:03.05 




EXECUTION PLAN 


---------------------------------------------------------- 


0 SELECT STATEMENT OPTIMIZER=CHOOSE (COST=15056 CARD=1) 


1 0 SORT (AGGREGATE) 


2 1 TABLE ACCESS (FULL) OF 'TEST_TAB' (COST=15056 CARD=10000 


000) 






STATISTICS 


---------------------------------------------------------- 


0 RECURSIVE CALLS 


0 DB BLOCK GETS 


156310 CONSISTENT GETS 


154239 PHYSICAL READS 


0 REDO SIZE 


379 BYTES SENT VIA SQL*NET TO CLIENT 


503 BYTES RECEIVED VIA SQL*NET FROM CLIENT 


2 SQL*NET ROUNDTRIPS TO/FROM CLIENT 


0 SORTS (MEMORY) 


0 SORTS (DISK) 


1 ROWS PROCESSED 




SQL> 


我们来看上面的执行计划,这句SQL总供耗时是:1分3秒.访问方式是采用全表扫描方式(FTS),逻辑读了156310个BLOCK,物理读了154239个BLOCK. 


我们来分析一下这个表: 


BEGIN 
DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=> 'TEST', 
TABNAME=> 'TEST_TAB', 
PARTNAME=> NULL);END; 


发现这个表目前使用的BLOCK有: 156532,未使用的BLOCK(EMPTY_BLOCKS)为:0,总行数为(NUM_ROWS):1000 0000 


(D)接下来我们把此表的记录用DELETE方式删掉,然后再来看看SELECT COUNT(*) FROM TEST_TAB所花的时间: 


DELETE FROM TEST_TAB; 


COMMIT; 


SQL> SELECT COUNT(*) FROM TEST_TAB; 


ELAPSED: 00:01:04.03 


EXECUTION PLAN 


---------------------------------------------------------- 


0 SELECT STATEMENT OPTIMIZER=CHOOSE (COST=15056 CARD=1) 


1 0 SORT (AGGREGATE) 


2 1 TABLE ACCESS (FULL) OF 'TEST_TAB' (COST=15056 CARD=1) 






STATISTICS 


---------------------------------------------------------- 


0 RECURSIVE CALLS 


0 DB BLOCK GETS 


156310 CONSISTENT GETS 


155565 PHYSICAL READS 


0 REDO SIZE 


378 BYTES SENT VIA SQL*NET TO CLIENT 


503 BYTES RECEIVED VIA SQL*NET FROM CLIENT 


2 SQL*NET ROUNDTRIPS TO/FROM CLIENT 


0 SORTS (MEMORY) 


0 SORTS (DISK) 


1 ROWS PROCESSED 


SQL> 

大家来看,在DELETE表后,此时表中已没有一条记录,为什么SELECT COUNT(*) FROM TEST_TAB花的时间为1分4秒, 反而比有记录稍微长点,这是为什么呢?而且大家看,其逻辑读了156310个 BLOCK,跟之前有一千万行记录时差不多,ORACLE怎么会这么笨啊? 

我们在DELETE表后再次分析表,看看有什么变化: 

这时, TEST_TAB表目前使用的BLOCK是: 156532,未使用的BLOCK(EMPTY_BLOCKS)为:0,总行数为(NUM_ROWS)已变成:0 

为什么表目前使的BLOCK数还是156532呢? 

问题的根源就在于ORACLE的HWM.也就是说,在新增记录时,HWM会慢慢往上移,但是在删除记录后,HWM却不会往下移,也就是说,DELETE一千万条记录后,此表的HWM根本没移动,还在原来的那个位置,所以,HWM以下的块数同样也是一样的.ORACLE的全表扫描是读取 ORACLE高水位标记下的所有BLOCK,也就是说,不管HWM下的BLOCK现在实际有没有存放数据,ORACLE都会一一读取,这样,大家可想而知,在我们DELETE表后,ORACLE读了大量的空块,耗去了大量的时间. 

我们再来看DELETE表后段空间实际使用的状况: 

VAR TOTAL_BLOCKS NUMBER 
VAR TOTAL_BYTES NUMBER 
VAR UNUSED_BLOCKS NUMBER 
VAR UNUSED_BYTES NUMBER 
VAR LAST_USED_EXTENT_FILE_ID NUMBER 
VAR LAST_USED_EXTENT_BLOCK_ID NUMBER 
VAR LAST_USED_BLOCK NUMBER 
EXEC DBMS_SPACE.UNUSED_SPACE('TEST','TEST_TAB','TABLE',:TOTAL_BLOCKS,:TOTAL_BYTES,:UNUSED_BLOCKS,:UNUSED_BYTES,:LAST_USED_EXTENT_FILE_ID,:LAST_USED_EXTENT_BLOCK_ID,:LAST_USED_BLOCK);
PRINT TOTAL_BLOCKS 
PRINT TOTAL_BYTES 
PRINT UNUSED_BLOCKS 
PRINT UNUSED_BYTES 
PRINT LAST_USED_EXTENT_FILE_ID 
PRINT LAST_USED_EXTENT_BLOCK_ID 
PRINT LAST_USED_BLOCK 

输出结果为: 

PL/SQL PROCEDURE SUCCESSFULLY COMPLETED 

TOTAL_BLOCKS 

---------------------------------------------------------------------- 

164352 

TOTAL_BYTES 

---------------------------------------------------------------------- 

1346371584 

UNUSED_BLOCKS 

---------------------------------------------------------------------- 

7168 

UNUSED_BYTES 

---------------------------------------------------------------------- 

58720256 

LAST_USED_EXTENT_FILE_ID 

---------------------------------------------------------------------- 



LAST_USED_EXTENT_BLOCK_ID 

---------------------------------------------------------------------- 

158856 

LAST_USED_BLOCK 

---------------------------------------------------------------------- 

1024 

我们再来看看SHOW_SPACE显示的数据: 

SQL> EXEC SHOW_SPACE('TEST_TAB','TEST'); 

TOTAL BLOCKS............................164352 --总共164352块 

TOTAL BYTES.............................1346371584 

UNUSED BLOCKS...........................7168 --有7168块没有用过,也就是在HWM上面的块数 

UNUSED BYTES............................58720256 

LAST USED EXT FILEID....................9 

LAST USED EXT BLOCKID...................158856--- BLOCK ID 是针对数据文件来编号的,表示最后使用的一个EXTENT的第一个BLOCK的编号 

LAST USED BLOCK.........................1024 在最后使用的一个EXTENT 中一共用了1024块 

PL/SQL PROCEDURE SUCCESSFULLY COMPLETED 

总共用了164352块,除了一个SEGMENT HEADER,实际总共用了164351个块,有7168块从来没有使用过。LAST USED BLOCK表示在最后一个使用的EXTENT 中使用的BLOCK, 结合 LAST USED EXT BLOCK ID可以计算 HWM 位置 : 
LAST USED EXT BLOCK ID + LAST USED BLOCK -1 = HWM 所在的数据文件的BLOCK编号 

代入得出: 158856+1024-1=159879,这个就是HWM所有的BLOCK编号 

HWM所在的块:TOTAL BLOCKS- UNUSED BLOCKS=164352-7168=157184,也就是说,HWM在第157184个块,其BLOCKID是159879 

(E)结下来,我们再做几个试验: 

第一步:执行ALTER TABLE TEST_TAB DEALLOCATE UNUSED; 

我们看看段空间的使用状况: 

SQL> EXEC SHOW_SPACE('TEST_TAB','TEST'); 


TOTAL BLOCKS............................157184 

TOTAL BYTES.............................1287651328 

UNUSED BLOCKS...........................0 

UNUSED BYTES............................0 

LAST USED EXT FILEID....................9 

LAST USED EXT BLOCKID...................158856 

LAST USED BLOCK.........................1024 


PL/SQL PROCEDURE SUCCESSFULLY COMPLETED 


SQL> 

此时我们再代入上面的公式,算出HWM的位置: 157184-0=157184 HWM所在的BLOCK ID是158856+1024-1=159879,跟刚刚的没有变化,也就是说执行ALTER TABLE TEST_TAB DEALLOCATE UNUSED后,段的高水位标记的位置没有改变,但是大家看看UNUSED BLOCKS变为0了,总的块数减少到157184,这证明,DEALLOCATE UNUSED为释放HWM上面的未使用空间,但是并不会释放HWM下面的自由空间,也不会移动HWM的位置. 

第二步:我们再来看看执行ALTER TABLE TEST_TAB MOVE后段空间的使用状况: 

SQL> EXEC SHOW_SPACE('TEST_TAB','TEST'); 


TOTAL BLOCKS............................8 

TOTAL BYTES.............................65536 

UNUSED BLOCKS...........................5 

UNUSED BYTES............................40960 

LAST USED EXT FILEID....................9 

LAST USED EXT BLOCKID...................2632 

LAST USED BLOCK.........................3 


PL/SQL PROCEDURE SUCCESSFULLY COMPLETED 


SQL> 

此时,总共用到的块数已变为8, 我们再代入上面的公式,算出HWM的位置: 8-5=3 HWM所在的BLOCK ID是2632+3-1=2634, 

OK,我们发现,此时HWM的位置已经发生变化,现在HWM的位置是在第3个BLOCK,其BLOCK ID是2634,所有数据文件的ID是9(这个没有发生变化,数据文件还是原来的那个数据文件,只是释放了原来的自由空间),最后使用的块数也变为3,也就是说已经使用了3块,HWM就是在最后一个使用的块上,即第3个块上.大家可能会觉得奇怪,为什么释放空间后,未使用的块还有5个啊?也就是说HWM之上还是有5个已分配但从未使用的块.答案就跟HWM移动的规律有关.当我们在插入数据时,ORACLE首先在HWM之下的块当中定位自由空间(通过自由列表FREELIST),如果FREELIST当中没有自由块了,ORACLE就开始往上扩展,而HWM也跟着往上移,每5块移动一次.我们来看 ORACLE的说明: 

The high water mark is: 

-Recorded in the segment header block 

-Set to the beginning of the segment on the creation 

-Incremented in five-block increments as rows are inserted 

-Reset by the truncate command 

-Never reset by the delete command 

-Space above the high-water-mark can be reclaimed at the table level by using the following command: 

ALTER TABLE DEALLOCATE UNUSED… 

我们再来看看:SELECT COUNT(*) FROM TEST_TAB所花的时间: 

SQL> SELECT COUNT(*) FROM TEST_TAB; 

ELAPSED: 00:00:00.00 

EXECUTION PLAN 

---------------------------------------------------------- 

0 SELECT STATEMENT OPTIMIZER=CHOOSE 

1 0 SORT (AGGREGATE) 

2 1 TABLE ACCESS (FULL) OF 'TEST_TAB' 


STATISTICS 

---------------------------------------------------------- 

0 RECURSIVE CALLS 

0 DB BLOCK GETS 

3 CONSISTENT GETS 

0 PHYSICAL READS 

0 REDO SIZE 

378 BYTES SENT VIA SQL*NET TO CLIENT 

503 BYTES RECEIVED VIA SQL*NET FROM CLIENT 

2 SQL*NET ROUNDTRIPS TO/FROM CLIENT 

0 SORTS (MEMORY) 

0 SORTS (DISK) 

1 ROWS PROCESSED 


SQL> 

很快,不到1秒. 

我们最后再来对表作一次分析, 此时这个表目前使用的BLOCK为: 0,未使用的BLOCK(EMPTY_BLOCKS)为:0,总行数为(NUM_ROWS):0 

从中我们也可以发现,分析表和SHOW_SPACE显示的数据有点不一致.那么哪个是准的呢?其实这两个都是准的,只不过计算的方法有点不同.事实上,当你创建了一个对象如表以后,不管你有没有插入数据,它都会占用一些块,ORACLE也会给它分配必要的空间.同样,用ALTER TABLE MOVE释放自由空间后,还是保留了一些空间给这个表. 

最后,我们再来执行TRUNCATE命令,截断这个表,看看段空间的使用状况: 

TRUNCATE TABLE TEST_TAB; 

SQL> EXEC SHOW_SPACE('TEST_TAB','TEST'); 

TOTAL BLOCKS............................8 

TOTAL BYTES.............................65536 

UNUSED BLOCKS...........................5 

UNUSED BYTES............................40960 

LAST USED EXT FILEID....................9 

LAST USED EXT BLOCKID...................2632 

LAST USED BLOCK.........................3 

PL/SQL PROCEDURE SUCCESSFULLY COMPLETED 

SQL> 

我们发现TRUNCATE后和MOVE没有什么变化. 

为了,最终验证一下我上面的观点,我再DROP一下表,然后新建这个表,看看这时在没有插入任何数据之前,是否ORACLE确实有给这个对象分配必要的空间: 

DROP TABLE TEST_TAB; 

CREATE TABLE TEST_TAB(C1 NUMBER(10),C2 CHAR(100)) TABLESPACE RAINNY; 

SQL> EXEC SHOW_SPACE('TEST_TAB','TEST'); 

TOTAL BLOCKS............................8 

TOTAL BYTES.............................65536 

UNUSED BLOCKS...........................5 

UNUSED BYTES............................40960 

LAST USED EXT FILEID....................9 

LAST USED EXT BLOCKID...................2112 

LAST USED BLOCK.........................3 


PL/SQL PROCEDURE SUCCESSFULLY COMPLETED 

SQL> 

大家看,即使我没有插入任何一行记录,ORACLE还是给它分配了8个块.当然这个跟建表语句的INITIAL 参数及MINEXTENTS参数有关:请看TEST_TAB的存储参数: 

STORAGE 

INITIAL 64K 
MINEXTENTS 1 
MAXEXTENTS UNLIMITED 
); 

也就是说,在这个对象创建以后,ORACLE至少给它分配一个区,初始大小是64K,一个标准块的大小是8K,刚好是8个BLOCK. 

总结: 

在9I中: 

(1)如果MINEXTENT 可以使ALTER TABLE TABLENAME DEALLOCATE UNUSED将HWM以上所有没使用的空间释放 
(2)如果MINEXTENT >HWM 则释放MINEXTENTS 以上的空间。如果要释放HWM以上的空间则使用KEEP 0。 
ALTER TABLE TABLESNAME DEALLOCATE UNUSED KEEP 0; 
(3) TRUNCATE TABLE DROP STORAGE(缺省值)命令可以将MINEXTENT 之上的空间完全释放(交还给操作系统),并且重置HWM。 

(4)如果仅是要移动HWM,而不想让表长时间锁住,可以用TRUNCATE TABLE REUSE STORAGE,仅将HWM重置。 
(5)ALTER TABLE MOVE会将HWM移动,但在MOVE时需要双倍的表空间,而且如果表上有索引的话,需要重构索引 

(6)DELETE表不会重置HWM,也不会释放自由的空间(也就是说DELETE空出来的空间只能给对象本身将来的INSERT/UPDATE使用,不能给其它的对象使用) 

在ORACLE 10G: 

(1)可以使用ALTER TABLE TEST_TAB SHRINK SPACE命令来联机移动HWM, 

(2)如果要同时压缩表的索引,可以发布:ALTER TABLE TEST_TAB SHRINK SPACE CASCADE

 

----------------------------------------------------------------------------------------------------------------

用delete   方法删掉表中的数据后,发现数据所占的空间释放不了,怎么办? 
 需要你对   high   water   mark (高水位)  有一个认识   
  除了truncate表和drop表外   
  要释放空间,就只能重新建立表(exp/imp等)或者:  
  Alter   table   table_name   move   tablespace   tab_space_name; 
  把表移动到其他表空间,这样索引会失效的   
 oracle的数据空间是只能增大,不能减小的

分享到:
评论

相关推荐

    Oracle_高水位(HWM_High_Water_Mark)_说明.rar_High Water_Oracle 高水位

    理解oracle的高水位以及如何降低, 增加空间的利用

    Oracle Freelist和HWM原理及性能优化

    本文以FreeList为线索对Oracle的存储管理的原理进行较深入的探讨,涉及Oracle段区块管理的原理,FreeList算法等

    高水位线详解

    在 Oracle 数据的存储中,可以把存储空间想象为一个水库,数据想象为水 库中的水。水库中的水的位置有一条线叫做水位线,在 Oracle 中,这条线被称为`高水位线(High-warter mark, HWM)

    Oracle Freelist和HWM原理探讨及相关性能优化

    近期来,FreeList的重要作用逐渐为 Oracle DBA所认识,网上也出现一些相关的讨论。本文以FreeList为线索对Oracle的存储管理的原理进行较深入的探讨,涉及 Oracle段区块管理的原理,FreeList算法等。而与FreeList密切...

    如何降低DB2的管理表空间的高水位标记

    对于DB2数据库管理(DMS)表空间的高水位标记(HWM)是指该表空间曾经使用到的最大数据页数。如果使用:db2 list tablespaces show detail,看到某个DMS表空间的已用页数低于高水位标记,则有可能通过如下方法降低高...

    Oracle 10g HWM原理及性能优化.pdf

    Oracle 10g HWM原理及性能优化.pdf

    Oracle 10g HWM原理及性能优化

    当全表扫描时,Oracle会读取HWM下所有的块,即使这些块中有很多是空块,空块的存在,也即是表中碎片的存在,必将增加全表扫描额外的物理I/O开销及CPU开销,严重降低访问Oracle数据表的性能。通过对Oracle中关于表中...

    高水位(High_Water_Mark)的概念及高水位问题的解决

    orcal中关于HWM介绍,及相关操作说明。

    DB2V9.7新特性-降低高水位标记

    内容表空间高水位标记(HWM)为什么要降低高水位标记在9.7以前如何降低高水位标记9.7降低高水位标记的新功能总结参考资料表空间高水位标记(HWM)高水位标记是一个应用广泛的术语,在很多的场合都会使用到,一般用以...

    ORACLE表空间的回收脚本

    针对oracle表空间收缩的操作!请仔细查看内部的说明。对于表空间过于庞大的数据库能起到回收剩余空间,并降低高水位HWM的作用

    HWM14高层大气风场模式

    HWM-14为HWM(水平风场模型)系列模型的最新版本,主要改进在120km以上高度,增加了赤道和极区地基630 nm FPI和GOCE卫星风场测量数据,填补了部分纬度和地方时覆盖范围上的空白。

    Oracle数据文件收缩实例

    近期来,FreeList的重要作用逐渐为Oracle DBA所认识,网上也出现一些相关的讨论。本文以FreeList为线索对Oracle的存储管理的原理进行较深入的探讨,涉及Oracle段区块管理的原理,FreeList算法等。而与FreeList密切...

    hwm.dll

    hwm

    HWM14_风场_中性大气_

    中性大气风场模型(2014):计算中性大气风场速度

    hwm93:Python和Matlab中的NASA水平风模型HWM93

    Python中的HWM93 Python≥3.6的NASA水平风模型HWM93 适用于许多Fortran编译器,包括: Gfortran≥5 英特尔ifort PGI pgf90 Nvidia flang 安装 需要诸如gfortran类的Fortran编译器。 我们使用f2py ( numpy一...

    62332440_hwm840Dsl

    62332440_hwm840Dsl

    show hwm sql

    show hwm sql sql script javascript develop

    HWM_MBUS-M13_1.08_EN_mbus_

    MBUS power line communication module

Global site tag (gtag.js) - Google Analytics