您现在的位置是:首页 >技术教程 >3.完成ODS层数据采集操作网站首页技术教程

3.完成ODS层数据采集操作

小布先生~噫嘘唏 2024-08-19 12:01:03
简介3.完成ODS层数据采集操作

将原始数据导入mysql

1 选中mysql 运行脚本

 

2 验证结果

数据存储格式和压缩方案 

存储格式

分类

1.行式存储(textFile)

缺点:可读性较好  执行 select  * 效率比较高

缺点:耗费磁盘资源  执行 select 字段 效率比较低

2.列式存储(orc)

优点:节省磁盘空间. 执行 select 字段 效率比较高

缺点:执行 select * 效率比较低 , 可读性不是特别好

orc的本质

ORC是兼具行式存储优势又具有列式存储优势, 数据按行分块, 每块中按列存储数据, 同时在每个块内部, 对数据构建索引, 提升查询的效率。

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。