Đề cương khóa học
Giới thiệu
Tổng quan về các Phương pháp Tiếp cận Dữ liệu Access (cơ sở dữ liệu, v.v.)
Tổng quan về các Tính năng và Kiến trúc của Spark
Cài đặt và Cấu hình Spark
Hiểu về Dataframes trong Spark
Định nghĩa Bảng và Nhập Bộ Dữ liệu
Truy vấn Data Frames bằng SQL
Thực hiện Tổng hợp, JOIN và Truy vấn Lồng nhau
Tải lên và Access Dữ liệu
Truy vấn Các Loại Dữ liệu Khác nhau
- JSON, Parquet, v.v.
Truy vấn Data Lakes với SQL
Khắc phục sự cố
Tóm tắt và Kết luận
Requirements
- Kinh nghiệm làm việc với SQL truy vấn
- Programming kinh nghiệm với bất kỳ ngôn ngữ nào
Đối tượng
- Chuyên viên phân tích dữ liệu
- Nhà khoa học dữ liệu
- Kỹ sư dữ liệu
Testimonials (5)
A lot of practical examples, different ways to approach the same problem, and sometimes not so obvious tricks how to improve the current solution
Rafal - Nordea
Course - Apache Spark MLlib
very interactive...
Richard Langford
Course - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Course - Apache Spark in the Cloud
practice tasks