Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Đề cương khóa học
I. Giới thiệu và chuẩn bị
1. Tổng quan
- Làm cho R thân thiện hơn, R và các GUI có sẵn
- Rstudio
- Phần mềm và tài liệu liên quan
- R và thống kê
- Sử dụng R một cách tương tác
- Một buổi giới thiệu
- Nhận trợ giúp về các hàm và tính năng
- Các lệnh R, phân biệt chữ hoa chữ thường, v.v.
- Ghi nhớ và sửa các lệnh trước đó
- Thực thi các lệnh từ hoặc chuyển hướng đầu ra đến một tệp
- Tính vĩnh viễn của dữ liệu và xóa các đối tượng
- Go Thực hành lập trình tốt: Các tập lệnh tự chứa, khả năng đọc tốt, ví dụ: các tập lệnh có cấu trúc, tài liệu, markdown
- Cài đặt các gói; CRAN và Bioconductor
2. Đọc dữ liệu
- Các tệp Txt (read.delim)
- Các tệp CSV
3. Các thao tác đơn giản; số và vectơ + mảng
- Vectơ và gán
- Phép toán vectơ
- Tạo các chuỗi đều đặn
- Vectơ logic
- Giá trị bị thiếu
- Vectơ ký tự
- Vectơ chỉ mục; chọn và sửa đổi các tập hợp con của một tập dữ liệu
- Mảng
- Đánh mục mảng. Các phần của một mảng
- Ma trận chỉ mục
- Hàm array() + các phép toán đơn giản trên mảng, ví dụ: nhân, chuyển vị
- Các loại đối tượng khác
4. Danh sách và khung dữ liệu
- Danh sách
- Tạo và sửa đổi danh sách
- Nối danh sách
- Khung dữ liệu
- Tạo khung dữ liệu
- Làm việc với khung dữ liệu
- Gắn các danh sách tùy ý
- Quản lý đường dẫn tìm kiếm
5. Thao tác dữ liệu
- Chọn, tập hợp con quan sát và biến
- Lọc, nhóm
- Mã hóa lại, chuyển đổi
- Tổng hợp, kết hợp các tập dữ liệu
- Tạo ma trận phân vùng, cbind() và rbind()
- Hàm nối, (), với mảng
- Thao tác ký tự, gói stringr
- Giới thiệu ngắn gọn về grep và regexpr
6. Đọc dữ liệu nâng cao
- Các tệp XLS, XLSX
- Các gói readr và readxl
- Dữ liệu định dạng SPSS, SAS, Stata,…
- Xuất dữ liệu sang txt, csv và các định dạng khác
6. Nhóm, vòng lặp và thực thi có điều kiện
- Biểu thức nhóm
- Câu lệnh điều khiển
- Thực thi có điều kiện: câu lệnh if
- Thực thi lặp đi lặp lại: vòng lặp for, repeat và while
- Giới thiệu về apply, lapply, sapply, tapply
7. Hàm
- Tạo hàm
- Tham số tùy chọn và giá trị mặc định
- Số lượng tham số thay đổi
- Phạm vi và hậu quả của nó
8. Đồ họa đơn giản trong R
- Tạo đồ thị
- Đồ thị mật độ
- Đồ thị chấm
- Đồ thị thanh
- Biểu đồ đường
- Biểu đồ tròn
- Biểu đồ hộp
- Biểu đồ phân tán
- Kết hợp các đồ thị
II. Phân tích thống kê trong R
1. Phân phối xác suất
- R như một tập hợp các bảng thống kê
- Kiểm tra phân phối của một tập dữ liệu
2. Kiểm định giả thuyết
- Kiểm định về giá trị trung bình của quần thể
- Kiểm định tỷ lệ khả năng
- Kiểm định một mẫu và hai mẫu
- Kiểm định phù hợp tốt Chi-Square Go
- Thống kê Kolmogorov-Smirnov một mẫu
- Kiểm định hạng đã ký Wilcoxon
- Kiểm định hai mẫu
- Kiểm định tổng hạng Wilcoxon
- Kiểm định Mann-Whitney
- Kiểm định Kolmogorov-Smirnov
3. Kiểm định nhiều giả thuyết
- Lỗi loại I và FDR
- Đường cong ROC và AUC
- Quy trình kiểm định nhiều lần (BH, Bonferroni, v.v.)
4. Mô hình hồi quy tuyến tính
- Các hàm chung để trích xuất thông tin mô hình
- Cập nhật các mô hình phù hợp
- Mô hình tuyến tính tổng quát
- Gia đình
- Hàm glm()
- Phân loại
- Hồi quy Logistic
- Phân tích phân biệt tuyến tính
- Học không giám sát
- Phân tích thành phần chính
- Phương pháp phân cụm (k-means, phân cụm phân cấp, k-medoids)
5. Phân tích sống sót (gói survival)
- Đối tượng sống sót trong r
- Ước tính Kaplan-Meier, kiểm định log-rank, hồi quy tham số
- Băng tin cậy
- Phân tích dữ liệu bị kiểm duyệt (kiểm duyệt khoảng)
- Mô hình Cox PH, hiệp biến không đổi
- Mô hình Cox PH, hiệp biến thay đổi theo thời gian
- Mô phỏng: So sánh mô hình (So sánh các mô hình hồi quy)
6. Phân tích phương sai
- ANOVA một chiều
- ANOVA phân loại hai chiều
- MANOVA
III. Các bài toán thực hành trong tin sinh học
- Giới thiệu ngắn gọn về gói limma
- Quy trình phân tích dữ liệu vi mảng
- Tải dữ liệu từ GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Xử lý dữ liệu (QC, chuẩn hóa, biểu hiện khác biệt)
- Biểu đồ núi lửa
- Ví dụ phân cụm + bản đồ nhiệt
28 Hours
Testimonials (5)
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Course - Data Vault: Building a Scalable Data Warehouse
Very useful in because it helps me understand what we can do with the data in our context. It will also help me
Nicolas NEMORIN - Adecco Groupe France
Course - KNIME Analytics Platform for BI
I genuinely enjoyed the hands passed exercises.
Yunfa Zhu - Environmental and Climate Change Canada
Course - Foundation R
The pace was just right and the relaxed atmosphere made candidates feel at ease to ask questions.
Rhian Hughes - Public Health Wales NHS Trust
Course - Introduction to Data Visualization with Tidyverse and R
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.