Đề cương khóa học

I. Giới thiệu và chuẩn bị

1. Tổng quan

  • Làm cho R thân thiện hơn, R và các GUI có sẵn
  • Rstudio
  • Phần mềm và tài liệu liên quan
  • R và thống kê
  • Sử dụng R một cách tương tác
  • Một buổi giới thiệu
  • Nhận trợ giúp về các hàm và tính năng
  • Các lệnh R, phân biệt chữ hoa chữ thường, v.v.
  • Ghi nhớ và sửa các lệnh trước đó
  • Thực thi các lệnh từ hoặc chuyển hướng đầu ra đến một tệp
  • Tính vĩnh viễn của dữ liệu và xóa các đối tượng
  • Go Thực hành lập trình tốt: Các tập lệnh tự chứa, khả năng đọc tốt, ví dụ: các tập lệnh có cấu trúc, tài liệu, markdown
  • Cài đặt các gói; CRAN và Bioconductor

2. Đọc dữ liệu

  • Các tệp Txt (read.delim)
  • Các tệp CSV

3. Các thao tác đơn giản; số và vectơ + mảng

  • Vectơ và gán
  • Phép toán vectơ
  • Tạo các chuỗi đều đặn
  • Vectơ logic
  • Giá trị bị thiếu
  • Vectơ ký tự
  • Vectơ chỉ mục; chọn và sửa đổi các tập hợp con của một tập dữ liệu
    • Mảng
  • Đánh mục mảng. Các phần của một mảng
  • Ma trận chỉ mục
  • Hàm array() + các phép toán đơn giản trên mảng, ví dụ: nhân, chuyển vị
  • Các loại đối tượng khác

4. Danh sách và khung dữ liệu

  • Danh sách
  • Tạo và sửa đổi danh sách
    • Nối danh sách
  • Khung dữ liệu
    • Tạo khung dữ liệu
    • Làm việc với khung dữ liệu
    • Gắn các danh sách tùy ý
    • Quản lý đường dẫn tìm kiếm

5. Thao tác dữ liệu

  • Chọn, tập hợp con quan sát và biến
  • Lọc, nhóm
  • Mã hóa lại, chuyển đổi
  • Tổng hợp, kết hợp các tập dữ liệu
  • Tạo ma trận phân vùng, cbind() và rbind()
  • Hàm nối, (), với mảng
  • Thao tác ký tự, gói stringr
  • Giới thiệu ngắn gọn về grep và regexpr

6. Đọc dữ liệu nâng cao

  • Các tệp XLS, XLSX
  • Các gói readr và readxl
  • Dữ liệu định dạng SPSS, SAS, Stata,…
  • Xuất dữ liệu sang txt, csv và các định dạng khác

6. Nhóm, vòng lặp và thực thi có điều kiện

  • Biểu thức nhóm
  • Câu lệnh điều khiển
  • Thực thi có điều kiện: câu lệnh if
  • Thực thi lặp đi lặp lại: vòng lặp for, repeat và while
  • Giới thiệu về apply, lapply, sapply, tapply

7. Hàm

  • Tạo hàm
  • Tham số tùy chọn và giá trị mặc định
  • Số lượng tham số thay đổi
  • Phạm vi và hậu quả của nó

8. Đồ họa đơn giản trong R

  • Tạo đồ thị
  • Đồ thị mật độ
  • Đồ thị chấm
  • Đồ thị thanh
  • Biểu đồ đường
  • Biểu đồ tròn
  • Biểu đồ hộp
  • Biểu đồ phân tán
  • Kết hợp các đồ thị

II. Phân tích thống kê trong R

1. Phân phối xác suất

  • R như một tập hợp các bảng thống kê
  • Kiểm tra phân phối của một tập dữ liệu

2. Kiểm định giả thuyết

  • Kiểm định về giá trị trung bình của quần thể
  • Kiểm định tỷ lệ khả năng
  • Kiểm định một mẫu và hai mẫu
  • Kiểm định phù hợp tốt Chi-Square Go
  • Thống kê Kolmogorov-Smirnov một mẫu
  • Kiểm định hạng đã ký Wilcoxon
  • Kiểm định hai mẫu
  • Kiểm định tổng hạng Wilcoxon
  • Kiểm định Mann-Whitney
  • Kiểm định Kolmogorov-Smirnov

3. Kiểm định nhiều giả thuyết

  • Lỗi loại I và FDR
  • Đường cong ROC và AUC
  • Quy trình kiểm định nhiều lần (BH, Bonferroni, v.v.)

4. Mô hình hồi quy tuyến tính

  • Các hàm chung để trích xuất thông tin mô hình
  • Cập nhật các mô hình phù hợp
  • Mô hình tuyến tính tổng quát
    • Gia đình
    • Hàm glm()
  • Phân loại
    • Hồi quy Logistic
    • Phân tích phân biệt tuyến tính
  • Học không giám sát
    • Phân tích thành phần chính
    • Phương pháp phân cụm (k-means, phân cụm phân cấp, k-medoids)

5. Phân tích sống sót (gói survival)

  • Đối tượng sống sót trong r
  • Ước tính Kaplan-Meier, kiểm định log-rank, hồi quy tham số
  • Băng tin cậy
  • Phân tích dữ liệu bị kiểm duyệt (kiểm duyệt khoảng)
  • Mô hình Cox PH, hiệp biến không đổi
  • Mô hình Cox PH, hiệp biến thay đổi theo thời gian
  • Mô phỏng: So sánh mô hình (So sánh các mô hình hồi quy)

6. Phân tích phương sai

  • ANOVA một chiều
  • ANOVA phân loại hai chiều
  • MANOVA

III. Các bài toán thực hành trong tin sinh học

  • Giới thiệu ngắn gọn về gói limma
  • Quy trình phân tích dữ liệu vi mảng
  • Tải dữ liệu từ GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Xử lý dữ liệu (QC, chuẩn hóa, biểu hiện khác biệt)
  • Biểu đồ núi lửa
  • Ví dụ phân cụm + bản đồ nhiệt
 28 Hours

Number of participants


Price per participant

Testimonials (5)

Provisional Upcoming Courses (Require 5+ participants)

Related Categories