Đề cương khóa học

Giới thiệu

  • Tổng quan về Databricks và Apache Spark
  • Hiểu kiến trúc Databricks

Bắt đầu

  • Thiết lập Môi trường
  • Thiết lập và cấu hình Databricks
  • Điều hướng giao diện người dùng Databricks
  • Tạo không gian làm việc Databricks

Làm việc với Dữ liệu trong Databricks

  • Kết nối với nguồn dữ liệu Apache Spark
  • Hiểu các cột và kiểu dữ liệu cơ bản
  • Quản lý hệ thống tệp thành Notebooks

Quản lý Công việc và Cụm

  • Tạo và cấu hình cụm
  • Tạo công việc bằng Notebook
  • Chạy công việc
  • Xem công việc và chi tiết công việc

Sử dụng Delta Lake trong Databricks

  • Tải dữ liệu vào Delta Lake
  • Quản lý dữ liệu trong Delta Lake

Bảo mật Databricks

  • Quản lý bảo mật Databricks
  • Quản lý sao lưu và khôi phục

Khắc phục sự cố

Tóm tắt và Các bước tiếp theo

Requirements

  • Hiểu biết cơ bản về phân tích dữ liệu
  • Kiến thức về Apache Spark

Đối tượng

  • Kỹ sư Dữ liệu
  • Nhà Khoa học Dữ liệu
  • Nhà Phát triển
 14 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories