Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Đề cương khóa học
Giới thiệu
- Hiểu tầm quan trọng của việc chuẩn bị dữ liệu trong phân tích và học máy
- Quy trình chuẩn bị dữ liệu và vai trò của nó trong vòng đời dữ liệu
- Khám phá các thách thức phổ biến trong dữ liệu thô và tác động của nó đến phân tích
Thu thập và Tích lũy Dữ liệu
- Nguồn dữ liệu: cơ sở dữ liệu, API, bảng tính, tệp văn bản, v.v.
- Kỹ thuật thu thập dữ liệu và đảm bảo chất lượng dữ liệu trong quá trình thu thập
- Thu thập dữ liệu từ nhiều nguồn khác nhau
Data Cleaning Kỹ thuật
- Xác định và xử lý các giá trị bị thiếu, giá trị ngoại lệ và sự không nhất quán
- Xử lý các bản sao và lỗi trong tập dữ liệu
- Làm sạch các tập dữ liệu thực tế
Chuyển đổi và Chuẩn hóa Dữ liệu
- Kỹ thuật chuẩn hóa và chuẩn hóa dữ liệu
- Xử lý dữ liệu phân loại: mã hóa, phân nhóm và kỹ thuật đặc trưng
- Chuyển đổi dữ liệu thô thành các định dạng có thể sử dụng
Data Integration và Tổng hợp
- Hợp nhất và kết hợp các tập dữ liệu từ các nguồn khác nhau
- Giải quyết xung đột dữ liệu và căn chỉnh các loại dữ liệu
- Kỹ thuật tổng hợp và hợp nhất dữ liệu
Data Quality Đảm bảo
- Phương pháp đảm bảo chất lượng và tính toàn vẹn của dữ liệu trong suốt quá trình
- Triển khai kiểm tra chất lượng và quy trình xác thực
- Nghiên cứu điển hình và ứng dụng thực tế của đảm bảo chất lượng dữ liệu
Giảm chiều và Lựa chọn Đặc trưng
- Hiểu nhu cầu giảm chiều
- Kỹ thuật như PCA, lựa chọn đặc trưng và chiến lược giảm
- Triển khai các kỹ thuật giảm chiều
Tóm tắt và Các Bước Tiếp Theo
Requirements
- Hiểu biết cơ bản về các khái niệm dữ liệu
Đối tượng
- Chuyên viên phân tích dữ liệu
- Database quản trị viên
- Chuyên gia IT
14 Hours
Testimonials (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Course - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.