Đề cương khóa học

Giới thiệu

  • Hiểu tầm quan trọng của việc chuẩn bị dữ liệu trong phân tích và học máy
  • Quy trình chuẩn bị dữ liệu và vai trò của nó trong vòng đời dữ liệu
  • Khám phá các thách thức phổ biến trong dữ liệu thô và tác động của nó đến phân tích

Thu thập và Tích lũy Dữ liệu

  • Nguồn dữ liệu: cơ sở dữ liệu, API, bảng tính, tệp văn bản, v.v.
  • Kỹ thuật thu thập dữ liệu và đảm bảo chất lượng dữ liệu trong quá trình thu thập
  • Thu thập dữ liệu từ nhiều nguồn khác nhau

Data Cleaning Kỹ thuật

  • Xác định và xử lý các giá trị bị thiếu, giá trị ngoại lệ và sự không nhất quán
  • Xử lý các bản sao và lỗi trong tập dữ liệu
  • Làm sạch các tập dữ liệu thực tế

Chuyển đổi và Chuẩn hóa Dữ liệu

  • Kỹ thuật chuẩn hóa và chuẩn hóa dữ liệu
  • Xử lý dữ liệu phân loại: mã hóa, phân nhóm và kỹ thuật đặc trưng
  • Chuyển đổi dữ liệu thô thành các định dạng có thể sử dụng

Data Integration và Tổng hợp

  • Hợp nhất và kết hợp các tập dữ liệu từ các nguồn khác nhau
  • Giải quyết xung đột dữ liệu và căn chỉnh các loại dữ liệu
  • Kỹ thuật tổng hợp và hợp nhất dữ liệu

Data Quality Đảm bảo

  • Phương pháp đảm bảo chất lượng và tính toàn vẹn của dữ liệu trong suốt quá trình
  • Triển khai kiểm tra chất lượng và quy trình xác thực
  • Nghiên cứu điển hình và ứng dụng thực tế của đảm bảo chất lượng dữ liệu

Giảm chiều và Lựa chọn Đặc trưng

  • Hiểu nhu cầu giảm chiều
  • Kỹ thuật như PCA, lựa chọn đặc trưng và chiến lược giảm
  • Triển khai các kỹ thuật giảm chiều

Tóm tắt và Các Bước Tiếp Theo

Requirements

  • Hiểu biết cơ bản về các khái niệm dữ liệu

Đối tượng

  • Chuyên viên phân tích dữ liệu
  • Database quản trị viên
  • Chuyên gia IT
 14 Hours

Number of participants


Price per participant

Testimonials (2)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories