如何设置 Hive 3.x 的具体配置参数?
- 内容介绍
- 文章标签
- 相关推荐
本文共计11844个文字,预计阅读时间需要48分钟。
Hive数据仓库概述
1.1 基本概念
数据仓库(Data Warehouse,简称DW),简称为数据仓库,是一个用于存储、分析和报告数据的系统。它主要用于存储历史数据,以便进行数据分析和决策支持。数据仓库的目标是构建一个面向分析的数据集成环境,以便于对数据进行深入分析。其主要目的是提供数据分析和报告功能,帮助企业做出更明智的决策。 Hive 1. 数据仓库概述 1.1 基本概念-
数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。
-
数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)
数仓专注分析
- 数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统
- 同时数据仓库自身也不需要“消费”任何的数据,其结果开放给各个外部应用使用
- 这也是为什么叫“仓库”,而不叫“工厂”的原因。
为了分析数据而来,分析结果给企业决策提供支撑
案例:中国人手保险公司
1. 业务数据的存储问题
- 中国人寿保险(集团)公司下辖多条业务线,包括:人寿险、财险、车险,养老险等。各业务线的业务正常运营需 要记录维护包括客户、保单、收付费、核保、理赔等信息。
本文共计11844个文字,预计阅读时间需要48分钟。
Hive数据仓库概述
1.1 基本概念
数据仓库(Data Warehouse,简称DW),简称为数据仓库,是一个用于存储、分析和报告数据的系统。它主要用于存储历史数据,以便进行数据分析和决策支持。数据仓库的目标是构建一个面向分析的数据集成环境,以便于对数据进行深入分析。其主要目的是提供数据分析和报告功能,帮助企业做出更明智的决策。 Hive 1. 数据仓库概述 1.1 基本概念-
数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。
-
数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)
数仓专注分析
- 数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统
- 同时数据仓库自身也不需要“消费”任何的数据,其结果开放给各个外部应用使用
- 这也是为什么叫“仓库”,而不叫“工厂”的原因。
为了分析数据而来,分析结果给企业决策提供支撑
案例:中国人手保险公司
1. 业务数据的存储问题
- 中国人寿保险(集团)公司下辖多条业务线,包括:人寿险、财险、车险,养老险等。各业务线的业务正常运营需 要记录维护包括客户、保单、收付费、核保、理赔等信息。

