Đề cương khóa học
Giới thiệu về Apache Kylin
- Tổng quan về OLAP và tầm quan trọng của nó trong phân tích dữ liệu lớn
- Sự phát triển của Apache Kylin và kiến trúc của nó
- Các tính năng và khả năng chính của Kylin 50
Cài đặt Apache Kylin
- Yêu cầu cài đặt và thiết lập môi trường
- Cấu hình Kylin với Hadoop, Spark, và Kafka
- Nắm bắt giao diện web của Kylin và công cụ dòng lệnh
Xây dựng Mô hình Dữ liệu trong Kylin
- Tạo mô hình sao và tuyếtflake cho các khối OLAP
- Định nghĩa chiều và đo lường
- Tạo và quản lý mô hình dữ liệu trong giao diện web của Kylin
Xây dựng và Quản lý Khối
- Quá trình xây dựng khối và quản lý công việc
- Các bản dựng tăng lượng và chiến lược tự động hợp nhất
- Theo dõi sức khỏe và hiệu suất của khối
Tiếp nhận Dữ liệu Streaming thời gian thực với Kylin
- Đưa Kafka vào làm nguồn dữ liệu streaming
- Cài đặt các khối thời gian thực và mô hình tích hợp
- Thực hiện phân tích độ trễ thấp với dữ liệu streaming
Truy vấn và Phân tích
- Thực thi các câu lệnh SQL bằng giao diện truy vấn của Kylin
- Kết nối các công cụ BI (ví dụ, Tableau, Power BI) với Kylin
- Thực hiện phân tích đa chiều và xem chi tiết
Tối ưu hóa Hiệu suất
- Các thực hành tốt nhất trong thiết kế khối và tổng hợp
- Quản lý tài nguyên và điều chỉnh để mở rộng quy mô
- Xử lý các vấn đề hiệu suất phổ biến
Những Chủ đề Nâng cao
- Bảo mật và kiểm soát truy cập trong Kylin
- Mở rộng Kylin với các plugin tùy chỉnh và tích hợp
- Khám phá REST APIs của Kylin cho tự động hóa
Tóm tắt và Bước Tiếp theo
Requirements
- Hiểu biết về Hadoop và hệ sinh thái big data
- Nắm vững các khái niệm về SQL và kho dữ liệu
- Kiến thức cơ bản về nền tảng dữ liệu luồng như Kafka
Đối tượng
- Các kỹ sư big data muốn triển khai giải pháp phân tích thời gian thực
- Các nhà phân tích dữ liệu mong muốn tận dụng khả năng OLAP trên các tập dữ liệu lớn
- Các kiến trúc sư kho dữ liệu quan tâm đến việc hiện đại hóa hạ tầng của mình
Testimonials (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
I liked Pablo's style, the fact that he covered a lot of subjects from report design , customization with html to implementing simple ML algortithms. Good balance theoretical information / exercices. Pablo really covered all topics i was interested in and gave comprehensive answers to my questions.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Course - Data Vault: Building a Scalable Data Warehouse
Actual application of spotfire and all basic functions.