Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Đề cương khóa học
Giới thiệu về Reinforcement Learning
- Học tăng cường là gì?
- Các khái niệm chính: tác nhân, môi trường, trạng thái, hành động và phần thưởng
- Những thách thức trong học tăng cường
Khám phá và Khai thác
- Cân bằng giữa khám phá và khai thác trong các mô hình RL
- Các chiến lược khám phá: epsilon-greedy, softmax và hơn thế nữa
Q-Learning và Mạng Nơ-ron Q Sâu (DQNs)
- Giới thiệu về Q-learning
- Triển khai DQNs bằng TensorFlow
- Tối ưu hóa Q-learning với bộ nhớ kinh nghiệm và mạng mục tiêu
Phương pháp Dựa trên Chính sách
- Thuật toán gradient chính sách
- Thuật toán REINFORCE và cách triển khai
- Phương pháp diễn viên-phê bình
Làm việc với OpenAI Gym
- Thiết lập môi trường trong OpenAI Gym
- Mô phỏng tác nhân trong môi trường động
- Đánh giá hiệu suất của tác nhân
Các Kỹ thuật Reinforcement Learning Nâng cao
- Học tăng cường đa tác nhân
- Gradient chính sách xác định sâu (DDPG)
- Tối ưu hóa chính sách lân cận (PPO)
Triển khai Mô hình Reinforcement Learning
- Các ứng dụng thực tế của học tăng cường
- Tích hợp các mô hình RL vào môi trường sản xuất
Tóm tắt và Các Bước Tiếp Theo
Requirements
- Kinh nghiệm với lập trình Python
- Hiểu biết cơ bản về các khái niệm học sâu và học máy
- Kiến thức về các thuật toán và khái niệm toán học được sử dụng trong học tăng cường
Đối tượng
- Nhà khoa học dữ liệu
- Các chuyên gia thực hành học máy
- Nhà nghiên cứu AI
28 Hours
Testimonials (4)
very friendly and helpful
Aktar Hossain - Unit4
Course - Building Microservices with Microsoft Azure Service Fabric (ASF)
The manual serverless setup. Also, I had no Idea sls web console exits, which is nice.
Rafal Kucharski - The Software House sp. z o.o.
Course - Serverless Framework for Developers
All good, nothing to improve
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Course - AWS Lambda for Developers
IOT applications