Đề cương khóa học

Giới thiệu về AI Đa phương thức

  • AI đa phương thức là gì?
  • Những thách thức và ứng dụng chính
  • Tổng quan về các mô hình đa phương thức hàng đầu

Xử lý Văn bản và Hiểu Ngôn ngữ Tự nhiên

  • Tận dụng LLM cho các tác nhân AI dựa trên văn bản
  • Hiểu kỹ thuật thiết kế lời nhắc (prompt engineering) cho các tác vụ đa phương thức
  • Tinh chỉnh các mô hình văn bản cho các ứng dụng cụ thể theo lĩnh vực

Nhận dạng và Tạo Hình ảnh

  • Xử lý hình ảnh với AI: phân loại, chú thích và phát hiện đối tượng
  • Tạo hình ảnh với mô hình khuếch tán (diffusion models) (Stable Diffusion, DALLE)
  • Tích hợp dữ liệu hình ảnh với các mô hình dựa trên văn bản

Xử lý Ngôn ngữ và Âm thanh

  • Nhận dạng giọng nói với Whisper ASR
  • Kỹ thuật tổng hợp văn bản thành giọng nói (TTS)
  • Nâng cao tương tác người dùng với AI dựa trên giọng nói

Tích hợp Các Đầu vào Đa phương thức

  • Xây dựng quy trình AI để xử lý nhiều loại đầu vào
  • Kỹ thuật hợp nhất để kết hợp dữ liệu văn bản, hình ảnh và âm thanh
  • Các ứng dụng thực tế của các tác nhân AI đa phương thức

Triển khai Đa phương thức AI Agents

  • Xây dựng các giải pháp AI đa phương thức dựa trên API
  • Tối ưu hóa mô hình để đạt hiệu suất và khả năng mở rộng
  • Các phương pháp hay nhất để triển khai AI đa phương thức trong môi trường sản xuất

Các Vấn đề Đạo đức và Xu hướng Tương lai

  • Thiên kiến và tính công bằng trong AI đa phương thức
  • Các vấn đề về quyền riêng tư với dữ liệu đa phương thức
  • Các phát triển trong tương lai của AI đa phương thức

Tóm tắt và Các Bước Tiếp theo

Requirements

  • Hiểu biết về các nguyên tắc cơ bản của học máy
  • Kinh nghiệm với lập trình Python
  • Làm quen với các khung học sâu (ví dụ: TensorFlow, PyTorch)

Đối tượng

  • Nhà phát triển AI
  • Nghiên cứu viên
  • Kỹ sư đa phương tiện
 21 Hours

Number of participants


Price per participant

Provisional Upcoming Courses (Require 5+ participants)

Related Categories