52.49. pg_statistic

目录pg_statistic存储有关数据库内容的统计数据。 其中的项由ANALYZE创建,查询规划器会使用这些数据来进行查询规划。 注意所有的统计数据天然就是近似的,即使它刚刚被更新。

通常对于数据表中一个已经被 ANALYZE 过的列,在本目录中会存在一个stainherit = false的项。如果该列所在的表具有后代(即有其他表继承该表),对于该列还会创建第二个stainherit = true的项。stainherit = true的项表示列在整个继承树上的统计数据,即通过SELECT column FROM table*看到的数据的统计,而stainherit = false的项表示对SELECT column FROM ONLY table的结果的统计。

pg_statistic也存储关于索引表达式值的统计数据,就好像它们是真正的数据列,但在这种情况中starelid指索引。对一个普通非表达式索引列不会创建项,因为它将是底层表列的项的冗余。当前,索引表达式的项都具有stainherit = false

因为不同类型的统计信息适用于不同类型的数据, pg_statistic 被设计成不太在意自己存储的是什么类型的统计。 只有极为常用的统计信息(比如NULL的含量)才在pg_statistic里给予专用的字段。 其它所有东西都存储在槽位中,而槽位是一组相关的列, 它们的内容用槽位中的一个列里的代码表示。 更详细的信息请参阅 src/include/catalog/pg_statistic.h

pg_statistic不应该是公共可读的,因为即使是一个表内容的统计性信息也可能被认为是敏感的(例子:一个薪水列的最大和最小值可能是非常有趣的)。pg_statspg_statistic上的一个公共可读的视图,它只会显示出当前用户可读的表的信息。

表 52.49. pg_statistic Columns

列类型

描述

starelid oid (references pg_class.oid)

被描述列所属的表或索引

staattnum int2 (references pg_attribute.attnum)

被描述列的编号

stainherit bool

如果为真,统计包含了继承后代的列而不仅仅是指定关系的列

stanullfrac float4

列的项为空的比例

stawidth int4

非空项的平均存储宽度,以字节计

stadistinct float4

列中非空唯一值的数目。一个大于零的值是唯一值的真正数目。 一个小于零的值是表中行数的乘数的负值;例如,对于一个 80% 的值为非空且每个非空值平均出现两次的列,可以表示为stadistinct = -0.4。一个0值表示唯一值的数目未知。

stakindN int2

一个代码,它表示存储在该pg_statistic行中第N槽位的统计类型。

staopN oid (references pg_operator.oid)

一个用于生成这些存储在第N槽位的统计信息的操作符。 比如,一个柱面图槽位会用<操作符,该操作符定义了该数据的排序顺序。 如果统计类型不需要操作符则为零。

stacollN oid (references pg_collation.oid)

排序规则用于导出存储在第N中的统计信息。 例如,可排序列的直方图槽将显示定义数据排序顺序的排序规则。对于不可整理数据,为零。

stanumbersN float4[]

N槽位的类型的数值类型统计, 如果该槽位不涉及数值类型则为NULL

stavaluesN anyarray

N槽位的类型的列值,如果该槽位类型不存储任何数据值则为 NULL。 每个数组的元素值实际上都是指定列的数据类型或者是一个相关类型(如数组元素类型), 因此,除了把这些列的类型定义成anyarray之外别无他法。