Đề cương khóa học

Tổng quan nhanh

  • Nguồn dữ liệu
  • Quản lý dữ liệu
  • Hệ thống gợi ý
  • Đối tượng Marketing

Kiểu dữ liệu

  • Dữ liệu có cấu trúc so với dữ liệu phi cấu trúc
  • Dữ liệu tĩnh so với dữ liệu luồng
  • Dữ liệu thái độ, hành vi và nhân khẩu học
  • Phân tích hướng dữ liệu so với phân tích hướng người dùng
  • Tính hợp lệ của dữ liệu
  • Khối lượng, tốc độ và sự đa dạng của dữ liệu

Mô hình

  • Xây dựng mô hình
  • Mô hình thống kê
  • Học máy

Phân loại dữ liệu

  • Phân cụm
  • kGroups, k-means, các láng giềng gần nhất
  • Các đàn kiến, các đàn chim

Mô hình dự đoán

  • Cây quyết định
  • Máy vector hỗ trợ
  • Phân loại Naive Bayes
  • Mạng nơ-ron
  • Mô hình Markov
  • Hồi quy
  • Phương pháp tập hợp

ROI

  • Tỷ lệ lợi ích/chi phí
  • Chi phí phần mềm
  • Chi phí phát triển
  • Lợi ích tiềm năng

Xây dựng mô hình

  • Chuẩn bị dữ liệu (MapReduce)
  • Làm sạch dữ liệu
  • Chọn phương pháp
  • Phát triển mô hình
  • Kiểm tra mô hình
  • Đánh giá mô hình
  • Triển khai và tích hợp mô hình

Tổng quan về phần mềm mã nguồn mở và thương mại

  • Lựa chọn gói R-project
  • Python thư viện
  • Hadoop và Mahout
  • Các dự án Apache được chọn liên quan đến Big Data và Phân tích
  • Giải pháp thương mại được chọn
  • Tích hợp với phần mềm và nguồn dữ liệu hiện có

Requirements

Hiểu biết về các phương pháp quản lý và phân tích dữ liệu truyền thống như SQL, kho dữ liệu, thông minh nghiệp vụ, OLAP, v.v... Hiểu biết về thống kê cơ bản và xác suất (trung bình, phương sai, xác suất, xác suất có điều kiện, v.v....)

 21 Hours

Number of participants


Price per participant

Testimonials (2)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories