Đề cương khóa học
Giới thiệu về Google Colab và Apache Spark
- Tổng quan về Google Colab
- Giới thiệu về Apache Spark
- Thiết lập Spark trong Google Colab
Xử lý Dữ liệu với Apache Spark
- Làm việc với RDD và DataFrames
- Tải và xử lý các tập dữ liệu lớn
- Sử dụng Spark SQL để truy vấn dữ liệu có cấu trúc
Phân tích Nâng cao với Spark
- Học máy với Spark MLlib
- Thực hiện phân tích dữ liệu thời gian thực
- Tính toán phân tán với Spark
Trực quan hóa và Collaboration trong Google Colab
- Tích hợp Colab với các thư viện trực quan hóa phổ biến
- Quy trình làm việc cộng tác với sổ ghi chép Colab
- Chia sẻ và xuất kết quả
Tối ưu hóa Quy trình Big Data
- Điều chỉnh Spark để đạt hiệu suất cao
- Tối ưu hóa sử dụng bộ nhớ và lưu trữ
- Mở rộng quy trình làm việc cho các tập dữ liệu lớn
Big Data trên Đám mây
- Tích hợp Google Colab với các công cụ dựa trên đám mây
- Sử dụng bộ nhớ đám mây cho dữ liệu lớn
- Làm việc với Spark trong môi trường đám mây phân tán
Nghiên cứu điển hình và Thực hành tốt nhất
- Xem xét các ứng dụng dữ liệu lớn trong thế giới thực
- Nghiên cứu điển hình sử dụng Apache Spark và Colab
- Thực hành tốt nhất để phân tích dữ liệu lớn
Tóm tắt và Các bước tiếp theo
Requirements
- Kiến thức cơ bản về các khái niệm khoa học dữ liệu
- Làm quen với Apache Spark
- Kỹ năng lập trình Python
Đối tượng
- Nhà khoa học dữ liệu
- Kỹ sư dữ liệu
- Nghiên cứu viên làm việc với dữ liệu lớn
Testimonials (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
I liked Pablo's style, the fact that he covered a lot of subjects from report design , customization with html to implementing simple ML algortithms. Good balance theoretical information / exercices. Pablo really covered all topics i was interested in and gave comprehensive answers to my questions.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Course - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location