简介
Teradata数据库 (以下简称TD) 为存储和处理XML数据提供以下支持:
- XML数据类型,允许用户以紧密二进制形式存储XML内容,用来保留XML文档的信息集
- 支持常见XML操作,如解析,验证,转换(XSLT)和查询(XPath和XQuery)等和方法
- 用于查询和转换XML内容的XQuery查询语言
- 存储过程,允许用户以XML格式发布SQL查询的结果
- 粉碎功能,允许用户从XML文档中提取值并使用它们来更新数据库表
XML 数据类型
TD为XML数据提供了XML数据类型。你可以像使用其他TD支持的SQL数据类型一样使用它。它可以保留XML文档的信息集,包括从XML验证派生的层次结构信息和类型信息。XML类型可以存储最大2GB的XML数据,并支持XML处理功能。
创建新的XML类型实例
你可以通过以下方法创建XML类型实例:
- New 操作符
- CREATEXML 函数
- XMLPARSE 函数
例如以下例子,我们假设XML数据以文本形式被载入到customerText表的customerXMLText (VARCHAR或者CLOB类型)的列中。然后我们可以利用New 操作符来从以文本表达的XML数据中创建一个XML实例。
SELECT customerID, (NEW XML(customerXMLText)).XMLEXTRACT('/Customer/Address', NULL)
FROM customerText;
查询的结果如下:
customerID NEW XML(customerXMLText).XMLEXTRACT('/Customer/Address', Null)
-------------------------------------------------------------------------
1 <Address>100 1st Street, San Francisco, CA 94118</Address>
同样地我们也用用CREATEXML来创建相应实例:
SELECT customerID, (CREATEXML(customerXMLText)).XMLEXTRACT('/Customer/Address', NULL)
FROM customerText;
用法
你可以指定XML类型:
- 在表定义中
注意:XML类型是LOB类型,最多一行占用4096个字节。考虑到一个64K的行大小,你可以在单个表上定义不超过15个XML类型的列。 - 作为存储过程中的IN,OUT或INOUT参数
- 作为结构化UDT的一部分
INSERT and UPDATE statements can also assign XML type values to columns.
限制
你不能将XML类型指定为:
- UDF或UDM中的输入参数或结果类型
- 外部存储过程中的IN,OUT或INOUT参数
UDF,UDM和外部存储过程只能将XML数据处理为VARCHAR,CLOB,VARBYTE或BLOB值; 因此,在将XML值传递给外部例程之前,必须使用XMLSERIALIZE函数将XML值序列化为VARCHAR,CLOB,VARBYTE或BLOB值。 您可以使用CREATEXML函数将外部例程的结果转化为XML类型值。
- XML类型可以容纳最大2GB的值。However, operations like XSLT and XQuery are only supported on documents that are smaller in size where the processing operation does not require more memory than specified by the XML_MemoryLimit DBS Control field.
- XML类型的列不能:
- 存在于队列表中
- 成为索引的一部分
- 参与JOIN操作
- 你不能在依赖于排序或比较的子句中使用XML类型的列,例如ORDER BY,GROUP BY或HAVING。
- 你不能在算术表达式中使用XML值。 XML值可以是一个类型,如xs:int,可用于算术计算。 在这种情况下,您可以将XML值转换为适当的SQL类型来执行计算。
- XML类型值不具有可比性,不应在关系比较操作中使用(例如>,<,=)。 XML值可以显式转换为其他标量SQL类型,这些类型的值可能是可比较的。 例如,如果已知该值是XML类型xs:int,则可以将其转换为SQL整数数据类型。
注意:因为XML值不具有可比性,所以它们不包含在对行重复的检查中(例如,在插入到一个集表中)。 这种行为类似于也不参与行重复检查的CLOB / BLOB类型。
- 尽管XML值的外部表示是字符串类型,但是字符串操作不能直接在XML值上使用。 在应用字符串操作之前,可以对XML进行序列化或强制转换以生成字符串表示。
排序
XML值不具有可比性。 在任何依赖比较值(如ORDER BY,GROUP BY或DISTINCT)的子句中引用XML类型列都会导致错误。
转换
从其他SQL类型转换为XML类型时,an XML value of the nearest xml schema primitive type is created. 。 例如,VARCHAR / CLOB的xs:string和DATE的xs:date。在向另一个方向转换时,XML实例的字符串值应该与目标数据类型兼容。 例如,将xs:date值转换为SQL DATE类型。
以下数据类型支持向和从XML类型转换。
VARCHAR | CLOB | VARBYTE | BLOB | BYTEINT | SMALLINT
INTEGER | DATE | DECIMAL | FLOAT | NUMBER |BIGINT
TIME | TIME WITH TIMEZONE
TIMESTAMP | TIMESTAMP WITH TIMEZONE
注意:从大对象类型(CLOB和BLOB)转换为XML类型受限于其大小,只有小于64K才能成功转换。
数据迁移
要将存储在VARCHAR或CLOB列中的XML数据迁移到具有XML类型列的等效模式,请执行以下操作:
- 验证XML数据是否格式正确,并符合XML格式的规则。
- 使用XML类型为保存XML数据的列创建新版本的表。
- 使用NEW XML运算符或CREATEXML函数将XML文本插入到XML列中。
范例
该语句创建一个包含XML类型列customerXML的表:
CREATE TABLE customer (
customerID INTEGER,
customerName VARCHAR(256),
customerXML XML
) PRIMARY INDEX (customerID);