KLOOK客路旅行如何运用Apache Hudi技术构建高效数据湖?

2026-05-06 07:070阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计2936个文字,预计阅读时间需要12分钟。

KLOOK客路旅行如何运用Apache Hudi技术构建高效数据湖?

1. KLOOK介绍:KLOOK是一家专注于户外旅行的在线旅游平台,提供景点门票、一日游、特色体验、当地交通与美食预订等服务。覆盖全球100多个国家和地区。

1. 业务背景介绍

客路旅行(KLOOK)是一家专注于境外目的地旅游资源整合的在线旅行平台,提供景点门票、一日游、特色体验、当地交通与美食预订服务。覆盖全球100个国家及地区,支持12种语言和41种货币的支付系统,与超过10000家商户合作伙伴紧密合作,为全球旅行者提供10万多种旅行体验预订服务。
KLOOK数仓RDS数据同步是一个很典型的互联网电商公司数仓接入层的需求。对于公司数仓,约60%以上的数据直接来源与业务数据库,数据库有很大一部分为托管的AWS RDS-MYSQL 数据库,有超100+数据库/实例。RDS直接通过来的数据通过标准化清洗即作为数仓的ODS层,公司之前使用第三方商业工具进行同步,限制为每隔8小时的数据同步,无法满足公司业务对数据时效性的要求,数据团队在进行调研及一系列poc验证后,最后我们选择Debezium+Kafka+Flink+Hudi的ods层pipeline方案,数据秒级入湖,后续数仓可基于近实时的ODS层做更多的业务场景需求。

阅读全文
标签:

本文共计2936个文字,预计阅读时间需要12分钟。

KLOOK客路旅行如何运用Apache Hudi技术构建高效数据湖?

1. KLOOK介绍:KLOOK是一家专注于户外旅行的在线旅游平台,提供景点门票、一日游、特色体验、当地交通与美食预订等服务。覆盖全球100多个国家和地区。

1. 业务背景介绍

客路旅行(KLOOK)是一家专注于境外目的地旅游资源整合的在线旅行平台,提供景点门票、一日游、特色体验、当地交通与美食预订服务。覆盖全球100个国家及地区,支持12种语言和41种货币的支付系统,与超过10000家商户合作伙伴紧密合作,为全球旅行者提供10万多种旅行体验预订服务。
KLOOK数仓RDS数据同步是一个很典型的互联网电商公司数仓接入层的需求。对于公司数仓,约60%以上的数据直接来源与业务数据库,数据库有很大一部分为托管的AWS RDS-MYSQL 数据库,有超100+数据库/实例。RDS直接通过来的数据通过标准化清洗即作为数仓的ODS层,公司之前使用第三方商业工具进行同步,限制为每隔8小时的数据同步,无法满足公司业务对数据时效性的要求,数据团队在进行调研及一系列poc验证后,最后我们选择Debezium+Kafka+Flink+Hudi的ods层pipeline方案,数据秒级入湖,后续数仓可基于近实时的ODS层做更多的业务场景需求。

阅读全文
标签: