例 4—带错误日志的单gpfdist实例

例 4—带错误日志的单gpfdist实例

使用gpfdist协议从所有具有txt扩展名的文件创建一个可读外部表ext_expenses。列定界符是一个竖线(|)并且NULL(' ')是一个空格。

访问该外部表是一种单行错误隔离模式。Greenplum数据库在内部捕捉输入数据格式化错误时会带有一个对该错误的描述。有调查错误行的信息请见在错误日志中查看不正确的行。用户可以查看错误、修复问题然后重新载入被拒绝的数据。如果一个Segment上遇到的错误超过5个(SEGMENT REJECT LIMIT值),整个外部表操作都会失败并且没有行会被处理。

=# CREATE EXTERNAL TABLE ext_expenses ( name text, 
   date date, amount float4, category text, desc1 text ) 
   LOCATION ('gpfdist://etlhost-1:8081/*.txt', 
             'gpfdist://etlhost-2:8082/*.txt')
   FORMAT 'TEXT' ( DELIMITER '|' NULL ' ')
   LOG ERRORS SEGMENT REJECT LIMIT 5;

要从CSV格式的文本文件创建可读的ext_expenses表:

=# CREATE EXTERNAL TABLE ext_expenses ( name text, 
   date date,  amount float4, category text, desc1 text ) 
   LOCATION ('gpfdist://etlhost-1:8081/*.txt', 
             'gpfdist://etlhost-2:8082/*.txt')
   FORMAT 'CSV' ( DELIMITER ',' )
   LOG ERRORS SEGMENT REJECT LIMIT 5;