Đề cương khóa học

Big Data Tổng quan:

  • Big Data là gì
  • Tại sao Big Data đang trở nên phổ biến
  • Các nghiên cứu điển hình về Big Data
  • Đặc điểm của Big Data
  • Các giải pháp để làm việc trên Big Data.

Hadoop & Các thành phần của nó:

  • Hadoop là gì và các thành phần của nó là gì.
  • Kiến trúc của Hadoop và đặc điểm của Dữ liệu mà nó có thể xử lý / Xử lý.
  • Tổng quan về Lịch sử của Hadoop, các công ty đang sử dụng nó và lý do họ bắt đầu sử dụng nó.
  • Khung Hadoop & các thành phần của nó - giải thích chi tiết.
  • HDFS là gì và Đọc - Ghi vào Hệ thống Tệp Phân tán Hadoop.
  • Cách Thiết lập Cụm Hadoop ở các chế độ khác nhau - Độc lập / Giả lập / Cụm Đa nút.

(Điều này bao gồm thiết lập cụm Hadoop trong VirtualBox / KVM / VMware, Cấu hình Mạng cần được xem xét cẩn thận, chạy các Daemon Hadoop và kiểm tra cụm).

  • Khung Map Reduce là gì và nó hoạt động như thế nào.
  • Chạy các công việc Map Reduce trên cụm Hadoop.
  • Hiểu về Sao chép, Gương và Nhận biết Giá trong bối cảnh của các cụm Hadoop.

Lập kế hoạch Cụm Hadoop:

  • Cách lập kế hoạch cho cụm hadoop của bạn.
  • Hiểu về phần cứng-phần mềm để lập kế hoạch cho cụm hadoop của bạn.
  • Hiểu về khối lượng công việc và lập kế hoạch cụm để tránh lỗi và thực hiện tối ưu.

MapR là gì và tại sao MapR:

  • Tổng quan về MapR và kiến trúc của nó.
  • Hiểu & làm việc với Hệ thống Điều khiển MapR, MapR Volumes, snapshots & Mirrors.
  • Lập kế hoạch cụm trong bối cảnh MapR.
  • So sánh MapR với các bản phân phối khác và Apache Hadoop.
  • Cài đặt MapR và triển khai cụm.

Thiết lập & Quản trị Cụm:

  • Quản lý các dịch vụ, nút, snapshots, volume gương và các cụm từ xa.
  • Hiểu và quản lý các Nút.
  • Hiểu về các thành phần Hadoop, Cài đặt các thành phần Hadoop cùng với các Dịch vụ MapR.
  • Accessing Dữ liệu trên cụm bao gồm thông qua NFS Quản lý các dịch vụ & nút.
  • Quản lý dữ liệu bằng cách sử dụng các volume, quản lý người dùng và nhóm, quản lý & gán vai trò cho các nút, đưa vào hoạt động và ngừng hoạt động của các nút, quản trị cụm và giám sát hiệu suất, cấu hình / phân tích và giám sát các số liệu để giám sát hiệu suất, cấu hình và quản trị bảo mật MapR.
  • Hiểu và làm việc với M7- Lưu trữ Native cho các bảng MapR.
  • Cấu hình và điều chỉnh cụm để có hiệu suất tối ưu.

Nâng cấp Cụm và tích hợp với các thiết lập khác:

  • Nâng cấp phiên bản phần mềm MapR và các loại nâng cấp.
  • Cấu hình cụm Mapr để truy cập cụm HDFS.
  • Thiết lập cụm MapR trên Amazon Elastic Mapreduce.

Tất cả các chủ đề trên bao gồm các bản trình diễn và các buổi thực hành để người học có được kinh nghiệm thực tế với công nghệ.

Requirements

  • Kiến thức cơ bản về Linux FS
  • Kiến thức cơ bản về Java
  • Kiến thức về Apache Hadoop (khuyến nghị)
 28 Hours

Number of participants


Price per participant

Testimonials (1)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories