例 1 - 从HDFS读取自定义格式数据

例 1 - 从HDFS读取自定义格式数据

这里的示例代码做了下列假定。

  • 数据被包含在HDFS目录/demo/data/temp中并且NameNode运行在端口8081上。
  • 这段代码会把Greenplum数据库格式的数据写入到HDFS上的 /demo/data/MRTest1中。
  • 数据按顺序包含下面的列。
    1. 一个长整数
    2. 一个布尔值
    3. 一个文本串