在文本格式的文件中转义

在文本格式的文件中转义

默认情况下,文本格式文件的转义字符是一个\(反斜线)。用户可以在COPYCREATE EXTERNAL TABLE或者gploadESCAPE子句中声明一个不同的转义字符。如果用户的转义字符出现在用户的数据中,用它来转义自身。

例如,假定用户有一个具有三列的表并且用户想载入下列三个域:

  • backslash = \
  • vertical bar = |
  • exclamation point = !

用户指派的分隔字符是|(竖线字符)并且用户指派的转义字符是\(反斜线)。用户的数据文件中的已格式化行看起来像这样:

backslash = \\ | vertical bar = \| | exclamation point = !

注意是如何用另一个反斜线字符转义作为数据一部分的反斜线字符和竖线字符的。

用户可以使用转义字符来转义十进制和十六进制序列。在被载入到Greenplum数据库时,被转义的值会被转换成等效的字符。例如,要载入花号字符(&),使用转义字符来转义其等效的十六进制(\0x26)或者十进制(\046)表达。

用户可以这样使用COPYCREATE EXTERNAL TABLE或者gploadESCAPE子句来禁用TEXT格式文件中的转义:

ESCAPE 'OFF'

这对于包含很多反斜线字符的输入数据(例如Web日志数据)有用。