postgresql之ctid的浅谈

   ctid: 表示数据记录的物理行当信息,指的是 一条记录位于哪个数据块的哪个位移上面。 跟oracle中伪列 rowid 的意义一样的;只是形式不一样。
   例如这有个一表test;查看每行记录的ctid情况

mydb=> select ctid,* from test;
 ctid  |  id  |  name  
-------+------+--------
 0,1) | 1001 | lottu
 0,2) | 1002 | rax
 0,3) | 1003 | xuan
 0,4) | 1004 | li0924
 0,5) | 1001 | ak

    格式blockid,itemid):拿其中0,1)来说;0表示块id;1表示在这块第一条记录。
 
  1. 去重:  我们知道rowid在oracle有个重要的作用;被用作表记录去重;同理 ctid在postgresql里面同样可以使用。例如test表id为1001有两条记录;现在演示下;

mydb=> delete from test where ctid not in select minctid) from test group by id);
DELETE 1
mydb=> select ctid,* from test;
 ctid  |  id  |  name  
-------+------+--------
 0,1) | 1001 | lottu
 0,2) | 1002 | rax
 0,3) | 1003 | xuan
 0,4) | 1004 | li0924
4 rows)

刚刚我们删除了0,5)这条记录; 现在我们把这条记录插入下;看下;

mydb=> insert into test values 1001,'ak');
INSERT 0 1
mydb=> select ctid,* from test;
 ctid  |  id  |  name  
-------+------+--------
 0,1) | 1001 | lottu
 0,2) | 1002 | rax
 0,3) | 1003 | xuan
 0,4) | 1004 | li0924
 0,6) | 1001 | ak
5 rows)

奇怪了;为什么不是0,5),而是0,6)这个跟postgresql多版本事务有关;跟伪列cmin,cmax有关;跟本文讲的ctid没点关系;这是postgresql的特性;也就是这样;postgresql里面没有回滚段的概念;那怎么把0,5)在显示呢;想这块0,5)的空间再存放数据;postgresql里面有AUTOVACUUM进程;当然我们也可以手动回收这段空间;

mydb=> delete from test where name = 'ak';
DELETE 1
mydb=> vacuum test;          
VACUUM
mydb=> insert into test values 1001,'ak');
INSERT 0 1
mydb=> select ctid,* from test;
 ctid  |  id  |  name  
-------+------+--------
 0,1) | 1001 | lottu
 0,2) | 1002 | rax
 0,3) | 1003 | xuan
 0,4) | 1004 | li0924
 0,5) | 1001 | ak
5 rows)

2. 我们刚刚说道 0表示块id; test数据太少了;不好解释;新建一个表test2

mydb=> drop table test2;
DROP TABLE
mydb=> create table test2 id int primary key, name varchar10));
CREATE TABLE
mydb=> insert into test2 select generate_series1,1000),'lottu' || generate_series1,1000);
INSERT 0 1000

 我们看下id=1000的ctid的blockid是多少;答案是5;意思是说该表的记录记录到第6个块;(因为是从0开始的)

mydb=> select ctid,* from test2 where id = 1000;
  ctid  |  id  |   name    
--------+------+-----------
 5,75) | 1000 | lottu1000
1 row)

当然这样查表记录占了几个block;假如我这是随机插入的;那id=1000;就不一定是在第6块;
我们可以借助系统视图pg_class;其中relpages,reltuples分别代表块数,记录数!

mydb=> analyze test2;
ANALYZE
mydb=> select relpages,reltuples from pg_class where relname = 'test2';
 relpages | reltuples 
----------+-----------
        6 |      1000
1 row)

总结: ctid存在的意义:表示数据记录的物理行当信息,指的是 一条记录位于哪个数据块的哪个位移上面。 跟oracle中伪列 rowid 的意义一样的;只是形式不一样。
vacuum: 回收未显示的物理位置;标明可以继续使用。
generate_series: 为一个序列函数;例如1-100;就是generate_series1,100);0-100直接的偶数generate_series0,100,2)
                          其中的0表示序列开始位置;100代表结束位置;2为偏移量。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注