MD 更新:未知

🏗️ 大数据分层架构

1️⃣ 总体结构

数据源 → 数据采集 → 数据存储 → 数据分析 → 数据应用


2️⃣ 分层详解

📥 数据源层

类型示例
业务系统ERP / CRM
日志数据用户行为日志
外部数据API / 第三方

🚚 数据采集层(ETL)

功能技术
数据抽取Flume / Logstash
数据清洗Spark / MapReduce
数据同步Sqoop / Kafka

👉 说明:

  • 负责数据采集、清洗、转换
  • 支持实时 / 离线

💾 数据存储层

类型技术
分布式存储HDFS
数据仓库Hive
NoSQLHBase

👉 说明:

  • 存储海量数据
  • 支持高扩展

📊 数据分析层

类型技术
SQL分析Hive / Presto
实时计算Spark Streaming / Flink
数据挖掘ML / 算法

📈 数据应用层

类型示例
BI报表Tableau
数据接口API服务
可视化大屏

3️⃣ 数据流(重点!)

数据源

采集(ETL)

存储(HDFS/Hive)

分析(SQL/计算)

应用(报表/API)