例 2 - 从Greenplum数据库写自定义格式的数据到HDFS

例 2 - 从Greenplum数据库写自定义格式的数据到HDFS

这段示例代码做了以下假定。

  • Greenplum数据库格式的数据位于端口8081上的Hadoop分布式文件系统的/demo/data/writeFromGPDB_42中。
  • 这段代码把数据写入到端口8081上的/demo/data/MRTest2中。
  1. 运行一个SQL命令来创建该可写表。
    =# CREATE WRITABLE EXTERNAL TABLE demodata 
       LOCATION ('gphdfs://hdfshost-1:8081/demo/data/MRTest2') 
       FORMAT 'custom' (formatter='gphdfs_export');
    
  2. 为一个MapReduce任务编写并且运行代码。使用例 1 - 从HDFS读取自定义格式数据中展示的相同导入语句。
注意: 在使用gpmr-1.0-gnet-1.0.0.1连接器是省略端口号。