打印

SQL 语法

5.11. 依赖性追踪
如果你创建了一个包含许多表,并且带有外键约束,视图, 触发器,函数等等的复杂数据库结构。那么你就会在对象 之间隐含地创建了一个依赖性的网络。比如,一个带有外键 约束的表依赖于它引用的表。

为了保证整个数据库结构的完整性,PostgreSQL 保证 你无法删除那些还有其它对象依赖的对象。比如,试图删除我们在 Section 5.3.5 里考虑的产品表,这个时候 订单表仍然依赖它,这样的删除动作是不能成功的,会有类似下面的错误信息出现:

DROP TABLE products;

NOTICE:  constraint orders_product_no_fkey on table orders depends on table products
ERROR:  Cannot drop table products because other objects depend on it
        Use DROP ... CASCADE to drop the dependent objects too这个错误信息包含一个有用的提示:如果你不想惹来分别删除所有 依赖对象的麻烦,你可以运行

DROP TABLE products CASCADE;然后所有被依赖的对象都将被删除。在这种情况下, 它并不删除订单表,它只删除外键约束。(如果你想检查 DROP ... CASCADE 会干什么,运行不带 CASCADE 的 DROP然后阅读 NOTICE 信息。)

PostgreSQL 里的所有删除命令都 支持声明 CASCADE。当然,具体的依赖性实体 取决于对象的类型。你也可以写 RESTRICT,而 不是 CASCADE,以获取缺省的行为, 这个时候限制于删除那些其它对象依赖的对象。

注意: 根据 SQL 标准,要求至少声明 RESTRICT 或者 CASCADE 中的一个。 实际上没有哪种数据库系统强制这一点,但是缺省的行为是 RESTRICT 还是 CASCADE 则因系统而异。

注意: 在 PostgreSQL 7.3 之前的外键约束依赖性和序列字段依赖性 在升级过程中都不会得到维护或者创建。所有其它的依赖性类型 在从 7.3 版本以前的数据库升级过程中都将得到恰当的创建。
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

Chapter 6. 数据操作
Table of Contents
6.1. 插入数据
6.2. 更新数据
6.3. 删除数据
前面的章节讨论了如何创建存储你的数据的表和其他结构。 现在是给表填充数据的时候了。本章介绍如何插入,更新和删除表数据。 我们还将介绍在一些事件发生的时候可以自动影响数据变化的方法: 触发器器和重写规则。在下一章将最终解释如何把你丢失已久的数据从数据库中抽取出来。

6.1. 插入数据
在创建一个表的时候,它里面没有数据。在数据库可以有点用之前 要做的第一件事就是向里面插入数据。数据在概念上是每次一行地插入的。 我们当然可以每次插入多行, 但是的确没有办法一次插入少于一行的数据。即使你只知道几个字段 的数值,那么你也必须创建一个完整的行。

要创建一个新行,我们使用 INSERT 命令。 这条命令要求提供表名字和给表中每个字段提供一个数值。 比如,假设来自 Chapter 5 的产品表:

CREATE TABLE products (
    product_no integer,
    name text,
    price numeric
);下面是一个向表中插入一行的例子:

INSERT INTO products VALUES (1, 'Cheese', 9.99);数据值是按照这些字段在表中出现的顺序列出的,并且用逗号分隔。 通常,数据值是文本(常量),但也允许使用标量表达式。

上面的语法的缺点是你必须知道表中字段的顺序。要避免这个问题, 你也可以明确地列出字段。比如,下面的两条命令都有和上面那条 命令一样的效果:

INSERT INTO products (product_no, name, price) VALUES (1, 'Cheese', 9.99);
INSERT INTO products (name, price, product_no) VALUES ('Cheese', 9.99, 1);许多用户认为明确列出字段名字是个好习惯。

如果你没有获得所有字段的数值,那么你可以省略其中的一些。 这个时候,这些字段将被填充为它们的缺省数值。比如,

INSERT INTO products (product_no, name) VALUES (1, 'Cheese');
INSERT INTO products VALUES (1, 'Cheese');第二种形式是 PostgreSQL 的一个扩展。 它从左开始填充我们给出的数值个数的字段数,其他的将是缺省。

为了保持清晰,你也可以明确要求缺省值,用于独立的字段或者用于 整个行:

INSERT INTO products (product_no, name, price) VALUES (1, 'Cheese', DEFAULT);
INSERT INTO products DEFAULT VALUES;
提示: 要进行"批量装载",也就是说,插入大量数据, 我们可以看看 COPY 命令。 它不像 INSERT 命令那么灵活,但是更高效。 参考 Section 13.4 获取更多有关海量装载数据的信息。
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

6.2. 更新数据
修改已经存储在数据库中的数据的行为叫做更新。你可以更新 独立的行,也可以更新表中所有的行,还可以更新其中的一部分行。 我们可以独立地更新每个字段,而其他的字段则不受影响。

要执行一次更新,你需要三种信息:



表的名字和要更新的字段名,

字段的新数值,

要更新的是哪行。


我们在 Chapter 5 里说过,SQL 通常并不为数据行提供唯一标识。 因此我们无法直接声明需要更新哪一行。但是, 我们可以通过声明一个要更新的行必须满足的条件。 只有在表里面存在主键的时候(不管你叫它什么),我们才能可靠地指定一个独立的行, 方法是选取一个匹配主键的行。图形化的数据库访问工具依赖这个东西来让我们可以独立地更新某些行。

比如,这条命令更新价格为5的所有产品的的价格为10:

UPDATE products SET price = 10 WHERE price = 5;这样做可能导致零行,一行或者更多数据行被更新。 如果我们试图做一个不匹配任何数据行的更新,那也不算错误。

让我们仔细看看这个命令。首先是关键字 UPDATE, 然后跟着表名字。和平常一样,表名字也可以是用模式修饰的, 否则就会从路径中把它找出来。然后是关键字 SET, 后面跟着字段名,一个等号以及新的字段数值。新的字段数值可以是任意标量表达式, 而不仅仅是常量。比如,如果你想把所有产品的价格提高 10%,你可以用:

UPDATE products SET price = price * 1.10;如你所见,用于新值的表达式也可以引用行中现有的数值。我们还忽略了 WHERE 子句。如果我们忽略了这个子句, 那么就意味着表中的所有行都要更新。如果出现了WHERE 子句, 那么只有匹配它后面的条件的行被更新。请注意在 SET 子句中的等号是一个赋值, 而在 WHERE 子句中的等号是比较,不过这样并不会导致任何歧义。 当然条件 WHERE 不一定非得是相等测试。 许多其他操作符也都可以使用(参阅 Chapter 9)。 但是表达式必须得出一个布尔结果。

你还可以在一个 UPDATE 命令中更新更多的字段, 方法是在 SET 子句中列出更多赋值。比如:

UPDATE mytable SET a = 5, b = 3, c = 1 WHERE a > 0;
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

6.3. 删除数据
到目前为止我们已经解释了如何向表中增加数据以及如何改变数据。 剩下的是讨论如何删除不再需要的数据。和前面增加数据一样,删除数据也必须是从表中整行整行地删除。 在前面的一节里我们解释了 SQL不提供直接访问独立行的方法。 因此,删除行只能是通过声明被删除行必须匹配的条件的情况下进行。 如果你在表上有一个主键,那么你可以声明准确的行。但是你也可以删除匹配条件的行组, 或者你可以一次从表中删除所有行。

我们使用 DELETE 命令删除行: 它的语法和 UPDATE 命令非常类似。比如,要从产品表中删除所有价格为 10 的产品,用

DELETE FROM products WHERE price = 10;
如果你只是写到

DELETE FROM products;那么表中所有行都会被删除!程序员一定要注意。
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

Chapter 7. 查询
Table of Contents
7.1. 概述
7.2. 表表达式
7.2.1. FROM 子句
7.2.2. WHERE 子句
7.2.3. GROUP BY 和 HAVING 子句
7.3. 选择列表
7.3.1. 选择列表项
7.3.2. 字段标签
7.3.3. DISTINCT
7.4. 组合查询
7.5. 行排序
7.6. LIMIT 和 OFFSET
前面的章节解释了如何创建表,如何用数据填充它们, 以及如何操作那些数据。现在我们终于可以讨论如何从数据库中检索数据了。

7.1. 概述
从数据库中检索数据的过程或命令叫做查询。 在 SQL 里 SELECT 命令用于声明查询。 SELECT 命令的通用语法是

SELECT select_list FROM table_expression [sort_specification]下面几节描述选择列表,表表达式,和排序声明的细节。

简单的查询的形式如下

SELECT * FROM table1;假设有一个表叫做table1,这条命令将从table1中检索所有行和所有字段。 (检索的方法取决于客户端应用。比如,psql 程序将在屏幕上显示一个 ASCII 艺术构成的表格, 客户端库将提供检索独立行和字段的函数。) 选择列表声明 * 意味着所有表表达式提供的字段。 一个选择列表也可以选择可用字段的一个子集或者在检索它们之前对字段进行计算; 比如,如果table1有叫做a,b,和c的字段(可能还有其他),那么你可以用下面的查询:

SELECT a, b + c FROM table1;(假设b和c都是数字数据类型)。 参阅 Section 7.3 获取更多细节。

FROM table1 是一种非常简单的表表达式:它只读取了一个表。 通常,表表达式可以是基本表,连接,和子查询的复杂构造。 但你也可以省略表表达式记录而用SELECT命令当做一个计算器:

SELECT 3 * 4;如果选择列表里的表达式返回变化的结果,那么这个东西就更有用了。 比如,你可以用这个方法调用函数:

SELECT random();
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

7.2. 表表达式
表表达式计算一个表。 该表表达式包含一个FROM子句,该子句可以根据需要选用WHERE,GROUP BY, 和HAVING 子句。大部分的表表达式只是指向磁盘上的一个表,一个所谓的基本表,但是我们可以用更复杂的表表达式以各种方法修改或组合基本表。

表表达式里的WHERE,GROUP BY,和 HAVING 子句声明一系列对源自 FROM 子句的表的转换操作。所有这些转换最后生成一个虚拟表,提供传递给选择列表计算查询输出行的数据行。

7.2.1. FROM 子句
FROM 子句 从一个用逗号分隔的表引用列表中的一个或更多个其它表中生成一个表。

FROM table_reference [, table_reference [, ...]]表引用可以是一个表名字(可能有模式修饰)或者是一个生成的表, 比如子查询,一个表连接,或者这些东西的复杂组合。如果在FROM子句中列出了多于一个表, 那么它们被 cross join (见下文)形成一个派生表,该表可以进行 WHERE,GROUP BY 和 HAVING 子句的转换处理,并最后生成所有表表达式的结果。

如果一个表引用是一个简单的表名字并且它是表继承级别中的超级表, 那么该表的行包括所有它的后代子表的行,除非你在该表名字前面加ONLY关键字。 这样的话,这个引用就只生成出现在命名表中的列 — 任何在子表中追加的列都会被忽略。

7.2.1.1. 连接表
一个连接表是根据特定的连接类型的规则从两个其它表(真实表或生成表)中派生的表。 我们支持内连接,外连接和交叉连接类型。


连接类型

交叉连接
T1 CROSS JOIN T2对每个从 T1 和 T2 来的行的组合, 生成的表将包含这样一行:它包含所有 T1 里面的字段后面跟着所有 T2 里面的字段。 如果两表分别有 N 和 M 行,连接成的表将有 N * M 行。

FROM T1 CROSS JOIN T2 等效于 FROM T1, T2。 它还等效于 FROM T1 INNER JOIN T2 ON TRUE(见下文)。

条件连接(join)
T1 { [INNER] | { LEFT | RIGHT | FULL } [OUTER] } JOIN T2 ON boolean_expression
T1 { [INNER] | { LEFT | RIGHT | FULL } [OUTER] } JOIN T2 USING ( join column list )
T1 NATURAL { [INNER] | { LEFT | RIGHT | FULL } [OUTER] } JOIN T2INNER 和 OUTER 对所有连接(join) 类型都是可选的。 INNER 是缺省;LEFT,RIGHT,和 FULL 隐含外连接。

连接条件在ON或USING子句里声明, 或者用关键字NATURAL隐含地声明。连接条件判断来自两个源表中的那些行是"匹配"的,这些我们将在下面详细解释。

ON子句是最常见的连接条件的类型:它接收一个和WHERE子句里用的一样的布尔值表达式。 如果两个分别来自T1和T2的行在ON表达式上运算的结果为真,那么它们就算是匹配的行。

USING是个缩写的概念:它接收一个用逗号分隔的字段名字列表, 这些字段必须是连接表共有的,最终形成一个连接条件,表示这些字段对必须相同。 最后,JOIN USING 的输出会为每一对相等的输入字段输出一个字段,后面跟着来自各个表的所有其它字段。 因此,USING (a, b, c) 等效于 ON (t1.a = t2.a AND t1.b = t2.b AND t1.c = t2.c) 只不过是如果使用了ON,那么在结果里 a,b,和 c字段每个都会有两个, 而用USING的时候每个字段就只会有一个。

最后,NATURAL 是 USING 的缩写形式:它形成一个 USING 列表, 该列表由那些在两个表里都出现了的字段名字组成。和USING一样,这些字段只在输出表里出现一次。

条件连接可能的类型是:



INNER JOIN
对于 T1 的每一行 R1,生成的连接表都有一行对应 T2 中的每一个满足和 R1 的连接条件的行。

LEFT OUTER JOIN
首先,执行一次内连接。然后,为 T1 里那些和 T2 里任何一行都不满足连接条件的行返回一个连接行, 同时该连接行里对应 T2 的列用空值补齐。因此, 生成的连接表里无条件地包含来自 T1 里的每一行至少一个副本。

RIGHT OUTER JOIN
首先,执行一次内连接。然后,为 T2 里那些和 T1 里任何一行都不满足连接条件的行返回一个连接行, 同时该连接行里对应 T1 的列用空值补齐。因此, 生成的连接表里无条件地包含来自 T2 里的每一行。

FULL OUTER JOIN
首先,执行一次内连接。然后,为 T1 里那些和 T2 里任何一行都不满足连接条件的行返回一个连接行, 同时该连接行里对应 T2 的列用空值补齐。 同样,为 T2 里那些和 T1 里的任何行都不满足连接条件的行返回一个连接行,该行里对应 T1 的列用空值补齐。


如果 T1 和 T2 有一个或者都是可以连接的表, 那么所有类型的连接都可以串在一起或嵌套在一起。 你可以在JOIN子句周围使用圆括弧来控制连接顺序, 如果没有圆括弧,那么JOIN子句是从左向右嵌套的。

为了解释这些问题,假设我们有一个表 t1

num | name
-----+------
   1 | a
   2 | b
   3 | c和 t2

num | value
-----+-------
   1 | xxx
   3 | yyy
   5 | zzz然后我们用不同的连接方式可以获得各种结果:

=> SELECT * FROM t1 CROSS JOIN t2;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   1 | a    |   3 | yyy
   1 | a    |   5 | zzz
   2 | b    |   1 | xxx
   2 | b    |   3 | yyy
   2 | b    |   5 | zzz
   3 | c    |   1 | xxx
   3 | c    |   3 | yyy
   3 | c    |   5 | zzz
(9 rows)

=> SELECT * FROM t1 INNER JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   3 | c    |   3 | yyy
(2 rows)

=> SELECT * FROM t1 INNER JOIN t2 USING (num);
num | name | value
-----+------+-------
   1 | a    | xxx
   3 | c    | yyy
(2 rows)

=> SELECT * FROM t1 NATURAL INNER JOIN t2;
num | name | value
-----+------+-------
   1 | a    | xxx
   3 | c    | yyy
(2 rows)

=> SELECT * FROM t1 LEFT JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   2 | b    |     |
   3 | c    |   3 | yyy
(3 rows)

=> SELECT * FROM t1 LEFT JOIN t2 USING (num);
num | name | value
-----+------+-------
   1 | a    | xxx
   2 | b    |
   3 | c    | yyy
(3 rows)

=> SELECT * FROM t1 RIGHT JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   3 | c    |   3 | yyy
     |      |   5 | zzz
(3 rows)

=> SELECT * FROM t1 FULL JOIN t2 ON t1.num = t2.num;
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   2 | b    |     |
   3 | c    |   3 | yyy
     |      |   5 | zzz
(4 rows)
用 ON 声明的连接条件也可以包含与连接不直接相关的条件。这种功能可能对某些查询很有用,但是需要我们仔细想清楚。 比如:

=> SELECT * FROM t1 LEFT JOIN t2 ON t1.num = t2.num AND t2.value = 'xxx';
num | name | num | value
-----+------+-----+-------
   1 | a    |   1 | xxx
   2 | b    |     |
   3 | c    |     |
(3 rows)
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

7.2.1.2. 表和列别名
你可以给一个表或复杂表引用一个临时的名字,用于剩下的查询中引用那些派生的表。 这样做叫做表别名。

要创建一个表别名,我们可以写:

FROM table_reference AS alias或者

FROM table_reference aliasAS 关键字目前没啥特别的含义。 alias 可以是任意标识符。

表别名的典型应用是给长表名赋予比较短的标识符, 好让连接子句更好读一些。比如:

SELECT * FROM some_very_long_table_name s JOIN another_fairly_long_name a ON s.id = a.num;
别名成为当前查询的表引用的新名称 — 我们不再能够用该表最初的名字引用它了。因此

SELECT * FROM my_table AS m WHERE my_table.a > 5;是不合法的 SQL 语法。这里将发生的事情(这是 PostgreSQL对标准的扩展)是在 FROM 子句里面隐含地增加了一个表引用,因此这个查询将会象下面这样处理

SELECT * FROM my_table AS m, my_table AS my_table WHERE my_table.a > 5;这样会生成一个交叉连接,通常可不是你想要的。

圆括弧用于解决歧义.下面的语句将把别名 b 赋予连接的结果,这是和前面的例子不同的:

SELECT * FROM (my_table AS a CROSS JOIN my_table) AS b ...
另外一种形式的除了给表别名还给该表的字段赋予了临时名字:

FROM table_reference [AS] alias ( column1 [, column2 [, ...]] )如果声明的字段别名比表里实际的字段少,那么后面的字段就没有重命名. 这个语法对于自连接或子查询特别有用.

如果用这些形式中的任何一种给一个JOIN子句的输出附加了一个别名, 那么该别名就在JOIN里隐藏了其原始的名字。比如

SELECT a.* FROM my_table AS a JOIN your_table AS b ON ...是合法 SQL,但是

SELECT a.* FROM (my_table AS a JOIN your_table AS b ON ...) AS c是不合法的:表别名 a 在别名c外面是看不到的。

7.2.1.3. 子查询
声明一个派生表的子查询必须包围在圆括弧里并且必须赋予一个别名。 (参阅 Section 7.2.1.2.)比如:

FROM (SELECT * FROM table1) AS alias_name
这个例子等效于 FROM table1 AS alias_name。 更有趣的例子是在子查询里面有分组或聚集的时候, 这个时候子查询不能归纳成一个简单的连接。
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

7.2.1.4. 表函数
表函数是那些生成一个行集合的函数,这个集合可以是由基本数据类型(标量类型)组成, 也可以是由符合数据类型(表的行)组成。他们的用法类似一个表,视图,或者在查询的FROM子句里的子查询。 表函数返回的字段可以像一个表,视图,或者子查询字段那样包含在 SELECT,JOIN,或者 WHERE 子句里。

如果一个表函数返回一个基本数据类型,那么单列的结果数据是以函数的名字命名的。 如果函数返回一个复合类型,那么结果字段的名字和该类型的每个独立属性的名字相同。

表函数可以在 FROM 子句中取一个别名,但你也可以不给它别名。 如果一个函数在 FROM 子句中没有别名,那么将使用函数名作为结果表的名字。

例子:

CREATE TABLE foo (fooid int, foosubid int, fooname text);

CREATE FUNCTION getfoo(int) RETURNS SETOF foo AS $$
    SELECT * FROM foo WHERE fooid = $1;
$$ LANGUAGE SQL;

SELECT * FROM getfoo(1) AS t1;

SELECT * FROM foo
    WHERE foosubid IN (select foosubid from getfoo(foo.fooid) z
                           where z.fooid = foo.fooid);

CREATE VIEW vw_getfoo AS SELECT * FROM getfoo(1);

SELECT * FROM vw_getfoo;
有时侯,把一个函数定义成根据不同的调用方法可以返回不同的字段是很有用的。 为了支持这些,表函数可以声明为返回伪类型 record。 如果在查询里使用这样的函数,那么我们必须在查询中声明预期的行结构, 这样系统才知道如何分析和规划该查询。让我们看看下面的例子:

SELECT *
    FROM dblink('dbname=mydb', 'select proname, prosrc from pg_proc')
      AS t1(proname name, prosrc text)
    WHERE proname LIKE 'bytea%';dblink 函数执行一个远程的查询(参阅 contrib/dblink)。 它声明为返回 record,因为它可能会被用于任何类型的查询。 实际的字段集必须在调用它的查询中声明,这样分析器才知道类似 * 这样的东西应该扩展成什么样子。
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

7.2.2. WHERE 子句
WHERE 子句 的语法是

WHERE search_condition这里的 search_condition 是任意返回一个类型为boolean的值表达式 (参阅 Section 4.2)。

在完成对FROM子句的处理之后,生成的每一行都会对搜索条件进行检查。 如果该条件的结果是真,那么该行输出到输出表中,否则(也就是说, 如果结果是假或空)就把它抛弃。搜索条件通常至少要引用一些在FROM子句里生成的列; 这不是必须的,但如果不是这样的话,那么WHERE子句就没什么用了。

注意: 内连接的连接条件既可以写在 WHERE 子句也可以写在 JOIN 子句里。 比如,这些表表达式是等效的:

FROM a, b WHERE a.id = b.id AND b.val > 5和

FROM a INNER JOIN b ON (a.id = b.id) WHERE b.val > 5或者可能还有

FROM a NATURAL JOIN b WHERE b.val > 5你想用哪个只是一个风格问题。FROM子句里的JOIN语法可能不那么容易移植到其它产品中。 对于外部连接(outer join)而言,我们在任何情况下都没有选择:它们必须在FROM子句中完成。 外部连接的 ON/USING 子句不等于WHERE条件, 因为它判断最终结果中行的增(那些不匹配的输入行)和删。

这里是一些 WHERE 子句的例子:

SELECT ... FROM fdt WHERE c1 > 5

SELECT ... FROM fdt WHERE c1 IN (1, 2, 3)

SELECT ... FROM fdt WHERE c1 IN (SELECT c1 FROM t2)

SELECT ... FROM fdt WHERE c1 IN (SELECT c3 FROM t2 WHERE c2 = fdt.c1 + 10)

SELECT ... FROM fdt WHERE c1 BETWEEN (SELECT c3 FROM t2 WHERE c2 = fdt.c1 + 10) AND 100

SELECT ... FROM fdt WHERE EXISTS (SELECT c1 FROM t2 WHERE c2 > fdt.c1)在上面的例子里,fdt是从FROM子句中派生的表。 那些不符合WHERE子句的搜索条件的行从fdt中删除。 请注意我们把标量子查询当做一个值表达式来用。 就好象任何其它查询一样,子查询里可以使用复杂的表表达式。 同时还请注意fdt是如何引用子查询的。 把c1修饰成fdt.c1只有在c1是该子查询生成的列的名字时才是必须的。 但修饰列名字可以增加语句的准确性,即使有时候不是必须的。 这个例子就演示了字段名字范围如何从外层查询扩展到它的内层查询.

7.2.3. GROUP BY 和 HAVING 子句
在通过了WHERE过滤器之后,生成的输出表可以继续用GROUP BY 子句进行分组,然后用HAVING子句删除一些分组行。

SELECT select_list
        FROM ...
        [WHERE ...]
        GROUP BY grouping_column_reference [, grouping_column_reference]...GROUP BY 子句 用于把那些在表中所列出的列上共享相同值的行聚集在一起。 这些列的列出顺序并没有什么关系。 效果是把每组共享相同值的行缩减为一个组行,它代表该组里的所有行。 这样就可以删除输出里的重复和/或计算应用于这些组的聚集。 比如:

=> SELECT * FROM test1;
x | y
---+---
a | 3
c | 2
b | 5
a | 1
(4 rows)

=> SELECT x FROM test1 GROUP BY x;
x
---
a
b
c
(3 rows)
在第二个查询里,我们不能写成 SELECT * FROM test1 GROUP BY x, 因为字段 y 里没有哪个值可以和每个组相关联起来。 被分组的字段可以在选择列表中引用是因为它们每个组都有单一的数值。

通常,如果一个表被分了组,那么没有在分组中引用的字段都不能引用,除了在聚集表达式中以外。 一个带聚集表达式的例子是:

=> SELECT x, sum(y) FROM test1 GROUP BY x;
x | sum
---+-----
a |   4
b |   5
c |   2
(3 rows)这里的 sum 是一个聚集函数,它在整个组上计算一个数值。 有关可用的聚集函数的更多信息可以在 Section 9.15 中找到。

提示: 没有聚集表达式的分组实际上计算了一个字段中独立数值的集合。 我们也可以用 DISTINCT 子句实现(参阅Section 7.3.3)。

这里是另外一个例子:它计算每种产品的总销售额。(而不是所有产品的总销售额)。

SELECT pid, p.name, (sum(s.units) * p.price) AS sales
  FROM products p LEFT JOIN sales s USING ( pid )
  GROUP BY pid, p.name, p.price;在这个例子里,字段pid, p.name,和p.price必须在GROUP BY子句里, 因为它们都在查询选择列表里被引用到。 (根据产品表具体的设置的不同,名字和价格可能和产品 ID 完全无关,因此理论上额外的分组可能是不必的, 但是这些尚未实现。) 字段s.units不必在GROUP BY列表里,因为它只是在一个聚集表达式(sum(...)) 里使用,它代表一组产品的销售额。对于每种产品,这个查询都返回一个该产品的所有销售额的总和。

在严格的 SQL 里,GROUP BY只能对源表的列进行分组,但 PostgreSQL 把这个扩展为也允许GROUP BY那些在选择列表中的字段。也允许对值表达式进行分组,而不仅是简单的字段.

如果一个表已经用GROUP BY子句分了组,然后你又只对其中的某些组感兴趣, 那么就可以用HAVING子句,它很象WHERE子句,用于删除一个分了组的表中的一些组。 语法是:

SELECT select_list FROM ... [WHERE ...] GROUP BY ... HAVING boolean_expression在 HAVING 子句中的表达式可以引用分组的表达式和未分组的表达式(后者必须涉及一个聚集函数)。

例子:

=> SELECT x, sum(y) FROM test1 GROUP BY x HAVING sum(y) > 3;
x | sum
---+-----
a |   4
b |   5
(2 rows)

=> SELECT x, sum(y) FROM test1 GROUP BY x HAVING x < 'c';
x | sum
---+-----
a |   4
b |   5
(2 rows)
然后是一个更现实的例子:

SELECT product_id, p.name, (sum(s.units) * (p.price - p.cost)) AS profit
    FROM products p LEFT JOIN sales s USING (product_id)
    WHERE s.date > CURRENT_DATE - INTERVAL '4 weeks'
    GROUP BY product_id, p.name, p.price, p.cost
    HAVING sum(p.price * s.units) > 5000;在上面的例子里,WHERE子句用于那些非分组的字段选择数据行。 (表达式只是对那些最近四周发生的销售为真)。 而HAVING子句选择那些单价超过 5000 的组的行。 请注意聚集函数不需要在查询中的所有地方都一样。
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP

7.3. 选择列表
如前面的小节说明的那样, 在 SELECT 命令里的表表达式构造了一个中介性的虚拟表, 方法可能有组合表,视图,删除行,分组等等。 这个表最后传递给选择列表处理。 选择列表判断中间表的哪个字段最终实际输出。

7.3.1. 选择列表项
最简单的选择列表类型是 *,它发出表表达式生成的所有字段。 否则,一个选择列表是一个逗号分隔的值表达式的列表, (和在Section 4.2 里定义的一样)。 比如,它可能是一个字段名字的列表:

SELECT a, b, c FROM ...字段名字a,b,和c要么是在 FROM子句里引用的表中字段的实际名字, 要么是象 Section 7.2.1.2 里解释的那样的别名。 在选择列表里的名字空间和在 WHERE 子句里的名字空间是一样的, 除非你使用了分组,这时候它和HAVING子句一样。

如果超过一个表有同样的字段名字,那么你还必须给出表名字,象

SELECT tbl1.a, tbl2.a, tbl1.b FROM ...(又见 Section 7.2.2)。

如果将任意值表达式用于选择列表,那么它在概念上向返回的表中增加了一个新的虚拟字段。 值表达式为结果的每一行进行一次计算,计算之前用该行的数值代换任何表达式里引用的字段。 不过选择列表中的这个表达式并非一定要引用来自FROM子句中表表达式里面的字段, 比如,它也可以是任意常量算术表达式。

7.3.2. 字段标签
选择列表中的记录可以赋予名字,用于进一步的处理。 这里的"进一步处理"是一个可选的排序声明和客户端应用(比如,用于显示的字段头)。比如:

SELECT a AS value, b + c AS sum FROM ...
如果没有使用AS声明字段名字,那么系统赋予一个缺省值。对于简单的字段引用, 它是该字段的名字。对于函数调用,它是函数的名字。对于复杂表达式,系统会生成一个通用的名字。

注意: 输出字段的命名和在FROM子句里的命名是不一样的 (参阅 Section 7.2.1.2)。 这个管道实际上允许你对同一个列命名两次,但是在选择列表中选择的名字是要传递的名字。

7.3.3. DISTINCT
在处理完选择列表之后,生成的表可以删除重复行。 我们可以直接在 SELECT 后面写上 DISTINCT 关键字声明:

SELECT DISTINCT select_list ...(如果不用 DISTINCT 你可以用 ALL 声明保留所有行的缺省行为。)

显然,如果两行里至少有一个列有不同的值,那么我们认为它是独立的。空值在这种考虑中认为是相同的。

另外,我们还可以用任意表达式来判断什么行可以认为是独立的:

SELECT DISTINCT ON (expression [, expression ...]) select_list ...这里 expression 是任意值表达式, 它为所有行计算。如果一个行集合里所有行计算出的该表达式的值是一样的, 那么我们认为它们是重复的并且因此只有第一行保留在输出中。 请注意这里的一个集合的"第一行"是不可预料的, 除非你在足够多的字段上对该查询排了序,保证到达DISTINCT过滤器的行的顺序是唯一的。 (DISTINCT ON处理是发生在ORDER BY排序后面的。)

DISTINCT ON子句不是 SQL 标准的一部分, 有时候有人认为它是一个糟糕的风格,因为它的结果是不可判定的。 如果用有选择的GROUP BY和在FROM中的子查询,那么我们可以避免使用这个构造, 但是通常它是更方便的候选方法。
燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。但是,聪明的,你告诉我,我们的日子为什么一去不复返呢?——是有人偷了他们罢:那是谁?又藏在何处呢?是他们自己逃走了罢:现在又到了哪里呢?

TOP


感谢一直以来您对我们的支持!
当前时区 GMT+8, 现在时间是 2008-9-7 20:50 京ICP证060528 号