Đề cương khóa học

Giới thiệu về Data Analysis và Big Data

  • Tại sao Makes Big Data lại "Lớn"?
    • Tốc độ, Khối lượng, Đa dạng, Độ chính xác (VVVV)
  • Giới hạn của Xử lý Dữ liệu Truyền thống
  • Xử lý Phân tán
  • Phân tích Thống kê
  • Các Loại Phân Tích Machine Learning
  • Data Visualization

Vai trò và Trách nhiệm của Big Data

  • Quản trị viên
  • Nhà phát triển
  • Nhà phân tích Dữ liệu

Languages Được Sử Dụng cho Data Analysis

  • R Language
    • Tại sao R cho Data Analysis?
    • Thao tác dữ liệu, tính toán và hiển thị đồ họa
  • Python
    • Tại sao Python cho Data Analysis?
    • Thao tác, xử lý, làm sạch và phân tích dữ liệu

Các Phương Pháp Tiếp Cận Data Analysis

  • Phân tích Thống kê
    • Phân tích Chuỗi Thời gian
    • Forecasting với các Mô hình Tương quan và Hồi quy
    • Suy luận Statistics (ước tính)
    • Mô tả Statistics trong các tập dữ liệu Big Data (ví dụ: tính trung bình)
  • Machine Learning
    • Học có giám sát so với học không giám sát
    • Phân loại và gom nhóm
    • Ước tính chi phí của các phương pháp cụ thể
    • Lọc
  • Xử lý Ngôn ngữ Tự nhiên
    • Xử lý văn bản
    • Hiểu ý nghĩa của văn bản
    • Tạo văn bản tự động
    • Phân tích tình cảm / phân tích chủ đề
  • Computer Vision
    • Thu thập, xử lý, phân tích và hiểu hình ảnh
    • Tái tạo, diễn giải và hiểu các cảnh 3D
    • Sử dụng dữ liệu hình ảnh để đưa ra quyết định

Cơ sở Hạ tầng Big Data

  • Lưu Trữ Dữ Liệu
    • Cơ sở dữ liệu quan hệ (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Cơ sở dữ liệu phi quan hệ (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • Hiểu các sắc thái
      • Cơ sở dữ liệu phân cấp
      • Cơ sở dữ liệu hướng đối tượng
      • Cơ sở dữ liệu hướng tài liệu
      • Cơ sở dữ liệu hướng đồ thị
      • Khác
  • Xử Lý Phân Tán
    • Hadoop
      • HDFS như một hệ thống tập tin phân tán
      • MapReduce để xử lý phân tán
    • Spark
      • Khung tính toán cụm trong bộ nhớ tất cả trong một cho xử lý dữ liệu quy mô lớn
      • Truyền phát có cấu trúc
      • Spark SQL
      • Machine Learning thư viện: MLlib
      • Xử lý đồ thị với GraphX
  • Scala Khả năng mở rộng
    • Cloud công cộng
      • AWS, Google, Aliyun, v.v.
    • Cloud riêng
      • OpenStack, Cloud Foundry, v.v.
    • Khả năng tự động mở rộng

Chọn Giải Pháp Phù Hợp cho Vấn Đề

Tương Lai của Big Data

Tóm Tắt và Các Bước Tiếp Theo

Requirements

  • Kiến thức toán học phổ thông
  • Kiến thức lập trình phổ thông
  • Kiến thức cơ bản về cơ sở dữ liệu

Đối tượng

  • Nhà phát triển / lập trình viên
  • Tư vấn viên IT
 35 Hours

Number of participants


Price per participant

Testimonials (7)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories