Đề cương khóa học

Giới thiệu về Reinforcement Learning

  • Tổng quan về học tăng cường và các ứng dụng của nó
  • Sự khác biệt giữa học có giám sát, học không giám sát và học tăng cường
  • Các khái niệm chính: tác nhân, môi trường, phần thưởng và chính sách

Tiến trình quyết định Markov (MDP)

  • Hiểu về trạng thái, hành động, phần thưởng và chuyển đổi trạng thái
  • Hàm giá trị và Phương trình Bellman
  • Lập trình động để giải các MDP

Các thuật toán RL cốt lõi

  • Các phương pháp bảng: Q-Learning và SARSA
  • Các phương pháp dựa trên chính sách: Thuật toán REINFORCE
  • Các khung Actor-Critic và ứng dụng của chúng

Deep Reinforcement Learning

  • Giới thiệu về Mạng lưới Q sâu (DQN)
  • Tái phát kinh nghiệm và mạng mục tiêu
  • Gradient chính sách và các phương pháp deep RL nâng cao

Các khung và công cụ RL

  • Giới thiệu về OpenAI Gym và các môi trường RL khác
  • Sử dụng PyTorch hoặc TensorFlow để phát triển mô hình RL
  • Huấn luyện, kiểm tra và đánh giá hiệu suất của các tác nhân RL

Những thách thức trong RL

  • Cân bằng giữa khám phá và khai thác trong quá trình huấn luyện
  • Xử lý các phần thưởng thưa thớt và các vấn đề gán thưởng
  • Scalability và các thách thức về tính toán trong RL

Thực hành Activities

  • Triển khai các thuật toán Q-Learning và SARSA từ đầu
  • Huấn luyện một tác nhân dựa trên DQN để chơi một trò chơi đơn giản trong OpenAI Gym
  • Tinh chỉnh các mô hình RL để cải thiện hiệu suất trong các môi trường tùy chỉnh

Tóm tắt và các bước tiếp theo

Requirements

  • Hiểu biết vững chắc về các nguyên tắc và thuật toán học máy
  • Thành thạo lập trình Python
  • Làm quen với mạng nơ-ron và các khuôn khổ học sâu

Đối tượng

  • Kỹ sư học máy
  • Chuyên gia AI
 14 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories