Đề cương khóa học

Giới thiệu

Tổng quan về Spark Streaming Tính năng và Kiến trúc

  • Các nguồn dữ liệu được hỗ trợ
  • Các API cốt lõi

Chuẩn bị Môi trường

  • Các phụ thuộc
  • Spark và ngữ cảnh luồng
  • Kết nối đến Kafka

Xử lý Tin nhắn

  • Phân tích cú pháp tin nhắn đến dưới dạng JSON
  • Các quy trình ETL
  • Khởi động ngữ cảnh luồng

Thực hiện Stream Processing theo Cửa sổ

  • Khoảng thời gian trượt
  • Cấu hình phân phối điểm kiểm tra
  • Triển khai môi trường

Nguyên mẫu Mã Xử lý

  • Kết nối đến một chủ đề Kafka
  • Truy xuất JSON từ nguồn dữ liệu bằng Paw
  • Biến thể và xử lý bổ sung

Truyền Mã

  • Biến điều khiển công việc
  • Xác định các giá trị để khớp
  • Hàm và điều kiện

Thu thập Đầu ra Luồng

  • Bộ đếm
  • Đầu ra Kafka (khớp và không khớp)

Khắc phục sự cố

Tóm tắt và Kết luận

Requirements

  • Có kinh nghiệm với Python và Apache Kafka
  • Thông thạo các nền tảng xử lý luồng

Đối tượng

  • Kỹ sư dữ liệu
  • Nhà khoa học dữ liệu
  • Lập trình viên
 7 Hours

Number of participants


Price per participant

Testimonials (5)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories