博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
lzo文件创建索引
阅读量:6605 次
发布时间:2019-06-24

本文共 488 字,大约阅读时间需要 1 分钟。

lzo文件默认不支持split,创建索引后支持split,这样作为map输入时就可以将文件分割成多个map,否则只能有一个map

创建索引,执行:

hadoop jar /usr/hdp/2.2.6.0-2800/hadoop/lib/hadoop-lzo-0.6.0.2.2.6.0-2800.jar  com.hadoop.compression.lzo.DistributedLzoIndexer  hdfs://hadoop001:8020/apps/hive/warehouse/hly.db/lzo_aa/1.txt.lzo

说明:可以只写到hdfs://hadoop001:8020/apps/hive/warehouse/hly.db/lzo_aa/ 目录层

索引文件:

 hdfs://hadoop001:8020/apps/hive/warehouse/hly.db/lzo_aa/1.txt.lzo.index

本文转自 yntmdr 51CTO博客,原文链接:http://blog.51cto.com/yntmdr/1898507,如需转载请自行联系原作者
你可能感兴趣的文章
Android特效源码分享,看了你就赚啦!
查看>>
Android手机模拟器旋转快捷键
查看>>
Linux 修改IP地址
查看>>
shell
查看>>
如何使用Office Deployment Tool离线安装office 365
查看>>
Linux常用指令
查看>>
重发布、路由策略、PBR策略路由、路径优选
查看>>
SVN使用
查看>>
为什么会用微服务???
查看>>
oracle优化器
查看>>
drdb 安装
查看>>
Linux Shell常用技巧(五)
查看>>
oracle中decode函数
查看>>
linux系统运维企业常见面试题集合(三)
查看>>
Oracle查询表名及模糊查询
查看>>
Spark 实现自己的RDD,让代码更优雅
查看>>
PHP 精确运算
查看>>
Python基础-Python流程控制
查看>>
Windows Server 2012体验之卸载额外域控制器
查看>>
MySQL主从同步配置实现数据库备份
查看>>