Đề cương khóa học

Giới thiệu

  • Quy trình Data Science
  • Vai trò và trách nhiệm của một Nhà khoa học dữ liệu

Chuẩn bị Môi trường Phát triển

  • Thư viện, khung, ngôn ngữ và công cụ
  • Phát triển cục bộ
  • Phát triển dựa trên nền tảng web cộng tác

Thu thập Dữ liệu

  • Các Loại Dữ liệu khác nhau
    • Cấu trúc
      • Cơ sở dữ liệu cục bộ
      • Database connectors
      • Định dạng phổ biến: xlxs, XML, Json, csv, ...
    • Phi cấu trúc
      • Clicks, cảm biến, điện thoại thông minh
      • APIs
      • Internet of Things (IoT)
      • Tài liệu, hình ảnh, video, âm thanh
  • Nghiên cứu điển hình: Thu thập lượng lớn dữ liệu phi cấu trúc liên tục

Lưu trữ Dữ liệu

  • Cơ sở dữ liệu quan hệ
  • Cơ sở dữ liệu phi quan hệ
  • Hadoop: Hệ thống Tệp Phân tán (HDFS)
  • Spark: Tập dữ liệu Phân tán Bền bỉ (RDD)
  • Lưu trữ đám mây

Chuẩn bị Dữ liệu

  • Thu thập, lựa chọn, làm sạch và chuyển đổi
  • Đảm bảo chất lượng dữ liệu - tính chính xác, ý nghĩa và bảo mật
  • Báo cáo ngoại lệ

Languages được sử dụng để Chuẩn bị, Xử lý và Phân tích

  • Ngôn ngữ R
    • Giới thiệu về R
    • Thao tác dữ liệu, tính toán và hiển thị đồ họa
  • Python
    • Giới thiệu về Python
    • Thao tác, xử lý, làm sạch và phân tích dữ liệu

Phân tích Dữ liệu

  • Phân tích thăm dò
    • Thống kê cơ bản
    • Bản nháp trực quan hóa
    • Hiểu dữ liệu
  • Quan hệ nhân quả
  • Tính năng và chuyển đổi
  • Machine Learning
    • Giám sát so với không giám sát
    • Khi nào sử dụng mô hình nào
  • Natural Language Processing (NLP)

Data Visualization

  • Các Thực hành Tốt nhất
  • Chọn biểu đồ phù hợp cho dữ liệu phù hợp
  • Bảng màu
  • Nâng cao hơn nữa
    • Dashboards
    • Trực quan hóa tương tác
  • Kể chuyện bằng dữ liệu

Tóm tắt và Kết luận

Requirements

  • Một hiểu biết chung về các khái niệm cơ sở dữ liệu
  • Một hiểu biết cơ bản về thống kê
 35 Hours

Number of participants


Price per participant

Testimonials (3)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories