INSERT
功能描述
向表中添加一行或多行数据。
注意事项
- 只有拥有表INSERT权限的用户,才可以向表中插入数据。用户被授予insert any table权限,相当于用户对除系统模式之外的任何模式具有USAGE权限,并且拥有这些模式下表的INSERT权限
- 如果使用RETURNING子句,用户必须要有该表的SELECT权限。
- 如果使用ON DUPLICATE KEY UPDATE,用户必须要有该表的SELECT、UPDATE权限,唯一约束(主键或唯一索引)的SELECT权限。
- 如果使用query子句插入来自查询里的数据行,用户还需要拥有在查询里使用的表的SELECT权限。
- 生成列不能被直接写入。在INSERT命令中不能为生成列指定值,但是可以指定关键字DEFAULT。
当连接到TD兼容模式的数据库,td_compatible_truncation参数设置为on时,将启用超长字符串自动截断功能,在后续的insert语句中(不包含外表的场景下),对目标表中char和varchar类型的列上插入超长字符串时,系统会自动按照目标表中相应列定义的最大长度对超长字符串进行截断。
如果向字符集为字节类型编码(SQL_ASCII,LATIN1等)的数据库中插入多字节字符数据(如汉字等),且字符数据跨越截断位置,这种情况下,按照字节长度自动截断,自动截断后会在尾部产生非预期结果。如果用户有对于截断结果正确性的要求,建议用户采用UTF8等能够按照字符截断的输入字符集作为数据库的编码集。
优化建议: 通过insert语句批量插入数据时,建议将多条记录合并入一条语句中执行插入,以提高数据加载性能。
例如,
INSERT INTO sections VALUES (30, 'Administration', 31, 1900),(40, 'Development', 35, 2000), (50, 'Development' , 60 , 2001);
。
语法格式
[ WITH [ RECURSIVE ] with_query [, ...] ]
INSERT [/*+ plan_hint */] [IGNORE] INTO table_name [ @dblink_name ] [partition_clause] [ AS alias ] [ ( column_name [, ...] ) ]
{ DEFAULT VALUES | VALUES | VALUE {( { expression | DEFAULT } [, ...] ) }[, ...] | query }
[ upsert_clause ]
[ RETURNING {* | {output_expression [ [ AS ] output_name ] }[, ...]} ];
INSERT [ FIRST | ALL ]
[ WHEN { condition } THEN INTO table [ [ AS ] alias ] [ ( column_name [, ...] ) ] VALUES (v1, ...), ...]
{ subquery }
IGNORE选项仅在MySQL兼容模式下可用,更多内容可参考MySQL兼容性手册下的INSERT。
其中upsert_clause可以是下列之一:
ON DUPLICATE KEY UPDATE { NOTHING | { column_name = { expression | DEFAULT } } [, ...] } ON CONFLICT [ conflict_target ] conflict_action
其中conflict_target可以是下列之一:
( { index_column_name | ( index_expression ) } [ COLLATE collation ] [ opclass ] [, ...] ) [ WHERE index_predicate ] ON CONSTRAINT constraint_name
其中conflict_action可以是下列之一:
DO NOTHING DO UPDATE SET { column_name = { expression | DEFAULT } | ( column_name [, ...] ) = [ ROW ] ( { expression | DEFAULT } [, ...] ) | ( column_name [, ...] ) = ( sub-SELECT ) } [, ...] [ WHERE condition ]
其中with_query可以是:
with_query_name [ ( column_name [, ...] ) ] AS [ [ NOT ] MATERIALIZED ] ( {select | values | insert | update | delete} )
其中partition_clause可以是:
PARTITION { ( partition_name ) | FOR ( partition_value [, ...] ) } | SUBPARTITION { ( subpartition_name ) | FOR ( subpartition_value [, ...] ) }
其中partition_clause仅在集中式模式支持。
参数说明
WITH [ RECURSIVE ] with_query [, …]
用于声明一个或多个可以在主查询中通过名称引用的子查询,相当于临时表。
如果声明了RECURSIVE,那么允许SELECT子查询通过名称引用它自己。
with_query_name指定子查询生成的结果集名称,在查询中可使用该名称访问子查询的结果集。
column_name指定子查询结果集中显示的列名。
每个子查询可以是SELECT,VALUES,INSERT,UPDATE或DELETE语句。
用户可以使用MATERIALIZED / NOT MATERIALIZED对CTE(Common Table Expression,即在SQL中构建一个临时数据集,给SQL的其他部分语义使用)进行修饰。
- 如果声明为MATERIALIZED,WITH查询将被物化,生成一个子查询结果集的拷贝,在引用处直接查询该拷贝,因此WITH子查询无法和主干SELECT语句进行联合优化(如谓词下推、等价类传递等),对于此类场景可以使用NOT MATERIALIZED进行修饰,如果WITH查询语义上可以作为子查询内联执行,则可以进行上述优化。
- 如果用户没有显示声明物化属性则遵守以下规则:如果CTE只在所属主干语句中被引用一次,且语义上支持内联执行,则会被改写为子查询内联执行,否则以CTE Scan的方式物化执行。
INSERT ON DUPLICATE KEY UPDATE不支持WITH及WITH RECURSIVE子句。
plan_hint子句
以/*+ */的形式在INSERT关键字后,用于对INSERT对应的语句块生成的计划进行hint调优,详细用法请参见章节使用Plan Hint进行调优。每条语句中只有第一个
/*+ plan_hint */
注释块会作为hint生效,里面可以写多条hint。table_name
要插入数据的目标表名。
取值范围:已存在的表名。
partition_clause
指定分区插入操作
PARTITION { ( partition_name ) | FOR ( partition_value [, ...] ) } |SUBPARTITION { ( subpartition_name ) | FOR ( subpartition_value [, ...] ) }
关键字详见SELECT一节介绍。 如果value子句的值和指定分区不一致,会抛出异常。 示例参见CREATE TABLE SUBPARTITION的示例。
column_name
目标表中的字段名:
- 字段名可以有子字段名或者数组下标修饰。
- 没有在字段列表中出现的每个字段,将由系统默认值,或者声明时的默认值填充,若都没有则用NULL填充。例如,向一个复合类型中的某些字段插入数据的话,其他字段将是NULL。
- 目标字段(column_name)可以按顺序排列。如果没有列出任何字段,则默认全部字段,且顺序为表声明时的顺序。
- 如果value子句和query中只提供了N个字段,则目标字段为前N个字段。
- value子句和query提供的值在表中从左到右关联到对应列。
取值范围:已存在的字段名。
expression
赋予对应column的一个有效表达式或值:
如果是INSERT ON DUPLICATE KEY UPDATE语句下,expression可以为
VALUES(column_name)
或EXCLUDED.column_name
用来表示引用冲突行对应的column_name字段的值。需注意,其中VALUES(column_name)不支持嵌套在表达式中(例如VALUES(column_name)+1),但EXCLUDED不受此限制。向表中字段插入单引号
'
时需要使用单引号自身进行转义。如果插入行的表达式不是正确的数据类型,系统试图进行类型转换,若转换不成功,则插入数据失败,系统返回错误信息。
DEFAULT
对应字段名的缺省值。如果没有缺省值,则为NULL。
query
一个查询语句(SELECT语句),将查询结果作为插入的数据。
RETURNING
返回实际插入的行,RETURNING列表的语法与SELECT的输出列表一致。
INSERT ON DUPLICATE KEY UPDATE不支持RETURNING子句。
在SQL Server兼容模式下支持RETURNING子句中的列名大小写不敏感的特性,详见SQL Server兼容性手册中的INSERT。
output_expression
INSERT命令在每一行都被插入之后用于计算输出结果的表达式。
取值范围:该表达式可以使用table的任意字段。可以使用*返回被插入行的所有字段。
output_name
字段的输出名称。
取值范围:字符串,符合标识符命名规范。
对于带有唯一约束(UNIQUE INDEX或PRIMARY KEY)的表,如果插入数据违反唯一约束,则对冲突行执行UPDATE子句完成更新,对于不带唯一约束的表,则仅执行插入。UPDATE时,若指定NOTHING则忽略此条插入,可通过
EXCLUDE.
或者VALUES()
来选择源数据相应的列。
支持触发器,触发器执行顺序由实际执行流程决定:
- 执行insert:触发 before insert、after insert触发器。
- 执行update:触发before insert、before update、after update触发器。
- 执行update nothing:触发before insert触发器。
不支持延迟生效(DEFERRABLE)的唯一约束或主键。
如果表中存在多个唯一约束,如果所插入数据违反多个唯一约束,对于检测到冲突的第一行进行更新,其他冲突行不更新(检查顺序与索引维护具有强相关性,一般先创建的索引先进行冲突检查)。
如果插入多行,这些行均与表中同一行数据存在唯一约束冲突,则按照顺序,第一条执行插入或更新,之后依次执行更新。
主键、唯一索引列不允许UPDATE。
不支持列存,不支持外表、内存表。
expression支持使用子查询表达式,其语法与功能同UPDATE。子查询表达式中支持使用
EXCLUDED.
来选择源数据相应的列。ON CONFLICT [ conflict_target ] conflict_action
PG风格的ON CONFLICT子句指定插入数据违反唯一约束时的替换动作,无冲突时直接插入,存在冲突时执行UPDATE,因此也被称为UPSERT功能——“UPDATE 或 INSERT”,用法介绍详见UPSERT功能。
示例
1、创建表reason_t2。
CREATE TABLE reason_t2 ( r_reason_sk integer, r_reason_id character(16), r_reason_desc character(100) );
2、向表中插入一条记录并查询。
INSERT INTO reason_t2(r_reason_sk, r_reason_id, r_reason_desc) VALUES (1, 'AAAAAAAABAAAAAAA', 'reason1'); SELECT * FROM reason_t2;
查询结果为:
r_reason_sk | r_reason_id | r_reason_ desc -------------+------------------+----------------------------------------------------- ------------------------------------------------- 1 | AAAAAAAABAAAAAAA | reason1 (1 row)
2、向表中插入一条记录并查询,和上一条语法等效。
INSERT INTO reason_t2 VALUES (2, 'AAAAAAAABAAAAAAA', 'reason2'); SELECT * FROM reason_t2;
查询结果为:
r_reason_sk | r_reason_id | r_reason_ desc -------------+------------------+----------------------------------------------------- ------------------------------------------------- 1 | AAAAAAAABAAAAAAA | reason1 2 | AAAAAAAABAAAAAAA | reason2 (2 rows)
3、向表中插入多条记录并查询。
INSERT INTO reason_t2 VALUES (3, 'AAAAAAAACAAAAAAA','reason3'),(4, 'AAAAAAAADAAAAAAA', 'reason4'),(5, 'AAAAAAAAEAAAAAAA','reason5'); SELECT * FROM reason_t2;
查询结果为:
r_reason_sk | r_reason_id | r_reason_ desc -------------+------------------+----------------------------------------------------- ------------------------------------------------- 1 | AAAAAAAABAAAAAAA | reason1 2 | AAAAAAAABAAAAAAA | reason2 3 | AAAAAAAACAAAAAAA | reason3 4 | AAAAAAAADAAAAAAA | reason4 5 | AAAAAAAAEAAAAAAA | reason5 (5 rows)
4、向表中插入reason中r_reason_sk小于5的记录并查询。
INSERT INTO reason_t2 SELECT * FROM reason_t2 WHERE r_reason_sk <5; SELECT * FROM reason_t2;
查询结果为:
r_reason_sk | r_reason_id | r_reason_ desc -------------+------------------+----------------------------------------------------- ------------------------------------------------- 1 | AAAAAAAABAAAAAAA | reason1 2 | AAAAAAAABAAAAAAA | reason2 3 | AAAAAAAACAAAAAAA | reason3 4 | AAAAAAAADAAAAAAA | reason4 5 | AAAAAAAAEAAAAAAA | reason5 1 | AAAAAAAABAAAAAAA | reason1 2 | AAAAAAAABAAAAAAA | reason2 3 | AAAAAAAACAAAAAAA | reason3 4 | AAAAAAAADAAAAAAA | reason4 (9 rows)
5、对表创建索引。
CREATE INDEX reason_t2_u_index ON reason_t2(r_reason_sk);
6、向表中插入多条记录,如果冲突则更新冲突数据行中r_reason_id字段为'BBBBBBBBCAAAAAAA',并查询。
INSERT INTO reason_t2 VALUES (5, 'BBBBBBBBCAAAAAAA','reason5'),(6, 'AAAAAAAADAAAAAAA', 'reason6') ON DUPLICATE KEY UPDATE r_reason_id = 'BBBBBBBBCAAAAAAA'; SELECT * FROM reason_t2;
查询结果为:
r_reason_sk | r_reason_id | r_reason_ desc -------------+------------------+----------------------------------------------------- ------------------------------------------------- 1 | AAAAAAAABAAAAAAA | reason1 2 | AAAAAAAABAAAAAAA | reason2 3 | AAAAAAAACAAAAAAA | reason3 4 | AAAAAAAADAAAAAAA | reason4 5 | AAAAAAAAEAAAAAAA | reason5 1 | AAAAAAAABAAAAAAA | reason1 2 | AAAAAAAABAAAAAAA | reason2 3 | AAAAAAAACAAAAAAA | reason3 4 | AAAAAAAADAAAAAAA | reason4 5 | BBBBBBBBCAAAAAAA | reason5 6 | AAAAAAAADAAAAAAA | reason6 (11 rows)
7、删除表reason_t2。
DROP TABLE reason_t2;