Đề cương khóa học

Giới thiệu về Reinforcement Learning

  • Học tăng cường là gì?
  • Các khái niệm chính: tác nhân, môi trường, trạng thái, hành động và phần thưởng
  • Những thách thức trong học tăng cường

Khám phá và Khai thác

  • Cân bằng giữa khám phá và khai thác trong các mô hình RL
  • Các chiến lược khám phá: epsilon-greedy, softmax và hơn thế nữa

Q-Learning và Mạng Nơ-ron Q Sâu (DQNs)

  • Giới thiệu về Q-learning
  • Triển khai DQNs bằng TensorFlow
  • Tối ưu hóa Q-learning với bộ nhớ kinh nghiệm và mạng mục tiêu

Phương pháp Dựa trên Chính sách

  • Thuật toán gradient chính sách
  • Thuật toán REINFORCE và cách triển khai
  • Phương pháp diễn viên-phê bình

Làm việc với OpenAI Gym

  • Thiết lập môi trường trong OpenAI Gym
  • Mô phỏng tác nhân trong môi trường động
  • Đánh giá hiệu suất của tác nhân

Các Kỹ thuật Reinforcement Learning Nâng cao

  • Học tăng cường đa tác nhân
  • Gradient chính sách xác định sâu (DDPG)
  • Tối ưu hóa chính sách lân cận (PPO)

Triển khai Mô hình Reinforcement Learning

  • Các ứng dụng thực tế của học tăng cường
  • Tích hợp các mô hình RL vào môi trường sản xuất

Tóm tắt và Các Bước Tiếp Theo

Requirements

  • Kinh nghiệm với lập trình Python
  • Hiểu biết cơ bản về các khái niệm học sâu và học máy
  • Kiến thức về các thuật toán và khái niệm toán học được sử dụng trong học tăng cường

Đối tượng

  • Nhà khoa học dữ liệu
  • Các chuyên gia thực hành học máy
  • Nhà nghiên cứu AI
 28 Hours

Number of participants


Price per participant

Testimonials (4)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories