1. 数据导入流程
一般数据存放在关系型数据库,Oracle、MySQL中。如果数据量不大,少于30G,量少于5000万条,可以用Sqoop 直接 Oracle -> HBase。
量大的话,HBase 性能会严重影响,建议
1、Sqoop Oracle -> HDFS;
2、HDFS -> HFile;
3、HFile -> HBase;
2. Sqoop Oracle->HBase
1 2 |
sqoop import --connect jdbc:oracle:thin:@//192.168.0.43:1521/orapop --table PM_BIRTH --hbase-table PM_BIRTH --column-family INFO --hbase-row-key ID --username ZJPX -P -m 20 |
3. Sqoop Oracle->HDFS
1 2 3 4 5 6 7 8 9 10 |
sqoop import --connect jdbc:oracle:thin:@//192.168.0.43:1521/orapop \ --null-string '\\N' \ --null-non-string '\\N' \ --table PR_TRANSFER \ --target-dir /tmp/zhaomin/data/PR_TRANSFER \ --fields-terminated-by '\t' \ --lines-terminated-by '\n' \ -m 30 \ --username PX -P |
近期评论