Đề cương khóa học

Giới thiệu về Apache Iceberg

  • Tổng quan về Apache Iceberg
  • Tầm quan trọng và các trường hợp sử dụng trong kiến trúc dữ liệu hiện đại
  • Các tính năng và lợi ích chính

Các Khái Niệm Cốt Lõi

  • Định dạng và kiến trúc bảng Iceberg
  • So sánh với các định dạng bảng khác
  • Phân vùng và tiến hóa lược đồ
  • Du hành thời gian và quản lý phiên bản dữ liệu

Thiết Lập Apache Iceberg

  • Cài đặt và cấu hình
  • Tích hợp Iceberg với các công cụ xử lý dữ liệu khác nhau
  • Thiết lập môi trường Iceberg trên máy cục bộ

Các Thao Tác Cơ Bản

  • Tạo và quản lý bảng Iceberg
  • Ghi vào và đọc từ bảng Iceberg
  • Các thao tác CRUD cơ bản

Di Chuyển Dữ Liệu và Tích Hợp

  • Di chuyển dữ liệu từ Hive và các hệ thống khác sang Iceberg
  • Tích hợp với các công cụ BI
  • Di chuyển một tập dữ liệu mẫu sang Iceberg

Tối Ưu Hóa Hiệu Suất

  • Các kỹ thuật điều chỉnh hiệu suất
  • Tối ưu hóa truy vấn và quét dữ liệu
  • Tối ưu hóa hiệu suất trong Iceberg

Tổng Quan về Các Tính Năng Nâng Cao

  • Tiến hóa phân vùng và phân vùng ẩn
  • Tiến hóa bảng và thay đổi lược đồ
  • Các tính năng du hành thời gian và khôi phục
  • Triển khai các tính năng nâng cao trong Iceberg

Tóm Tắt và Các Bước Tiếp Theo

Requirements

  • Nắm vững các khái niệm như bảng, lược đồ, phân vùng và nạp dữ liệu
  • Kiến thức cơ bản về SQL

Đối tượng

  • Kỹ sư dữ liệu
  • Kiến trúc sư dữ liệu
  • Nhà phân tích dữ liệu
  • Nhà phát triển phần mềm
 14 Hours

Number of participants


Price per participant

Testimonials (3)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories