Đề cương khóa học
Giới thiệu
- Apache Spark so với Hadoop MapReduce
Tổng quan về Tính năng và Kiến trúc của Apache Spark
Lựa chọn Ngôn ngữ Programming
Cài đặt Apache Spark
Tạo một Ứng dụng Mẫu
Lựa chọn Bộ Dữ liệu
Chạy Data Analysis trên Dữ liệu
Xử lý Dữ liệu Cấu trúc với Spark SQL
Xử lý Dữ liệu Dòng với Spark Streaming
Tích hợp Apache Spark với các Công cụ Machine Learning của Bên Thứ Ba
Sử dụng Apache Spark cho Xử lý Đồ thị
Tối ưu hóa Apache Spark
Khắc phục sự cố
Tóm tắt và Kết luận
Requirements
- Có kinh nghiệm với dòng lệnh Linux
- Hiểu biết chung về xử lý dữ liệu
- Programming kinh nghiệm với Java, Scala, Python hoặc R
Đối tượng
- Nhà phát triển
Testimonials (5)
A lot of practical examples, different ways to approach the same problem, and sometimes not so obvious tricks how to improve the current solution
Rafal - Nordea
Course - Apache Spark MLlib
The live examples
Ahmet Bolat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Course - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift