Predictive Modelling with R Training Course
R là một ngôn ngữ lập trình nguồn mở và miễn phí, được sử dụng cho các tính toán thống kê, phân tích dữ liệu và đồ họa. R đang được sử dụng ngày càng nhiều bởi các nhà quản lý và chuyên gia phân tích dữ liệu trong các tập đoàn và giới học thuật. R có nhiều gói (packages) đa dạng cho khai thác dữ liệu.
Đề cương khóa học
Những vấn đề mà các nhà dự báo đối mặt
- Lập kế hoạch nhu cầu khách hàng
- Sự không chắc chắn của nhà đầu tư
- Lập kế hoạch kinh tế
- Thay đổi theo mùa về nhu cầu/khả năng sử dụng
- Vai trò của rủi ro và sự không chắc chắn
Chuỗi thời gian Forecasting
- Điều chỉnh theo mùa
- Trung bình động
- Làm mịn hàm mũ
- Ngoại suy
- Dự đoán tuyến tính
- Ước tính xu hướng
- Tính dừng và mô hình ARIMA
Các phương pháp kinh tế lượng (phương pháp nhân quả)
- Phân tích hồi quy
- Hồi quy tuyến tính đa biến
- Hồi quy phi tuyến tính đa biến
- Xác thực hồi quy
- Forecasting từ hồi quy
Các phương pháp đánh giá chủ quan
- Khảo sát
- Phương pháp Delphi
- Xây dựng kịch bản
- Dự báo công nghệ
- Dự báo bằng phép tương tự
Mô phỏng và các phương pháp khác
- Mô phỏng
- Thị trường dự đoán
- Dự báo xác suất và Dự báo tập hợp
Requirements
Khóa học này là một phần của bộ kỹ năng Nhà khoa học dữ liệu (Lĩnh vực: Kỹ thuật và Phương pháp phân tích).
Open Training Courses require 5+ participants.
Predictive Modelling with R Training Course - Booking
Predictive Modelling with R Training Course - Enquiry
Predictive Modelling with R - Consultancy Enquiry
Consultancy Enquiry
Testimonials (2)
The exercises.
Elena Velkova - CEED Bulgaria
Course - Predictive Modelling with R
He was very informative and helpful.
Pratheep Ravy
Course - Predictive Modelling with R
Provisional Upcoming Courses (Require 5+ participants)
Related Courses
Algorithmic Trading with Python and R
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các nhà phân tích kinh doanh muốn tự động hóa giao dịch bằng giao dịch thuật toán, Python và R.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Sử dụng các thuật toán để mua và bán chứng khoán với các mức tăng chuyên biệt một cách nhanh chóng.
- Giảm chi phí liên quan đến giao dịch bằng giao dịch thuật toán.
- Tự động theo dõi giá cổ phiếu và thực hiện giao dịch.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 HoursTổng quan
Các nhà cung cấp dịch vụ Communications (CSP) đang phải đối mặt với áp lực giảm chi phí và tối đa hóa doanh thu trung bình trên mỗi người dùng (ARPU), đồng thời đảm bảo trải nghiệm khách hàng tuyệt vời, nhưng khối lượng dữ liệu vẫn tiếp tục tăng. Lưu lượng dữ liệu di động toàn cầu sẽ tăng trưởng với tốc độ tăng trưởng hàng năm gộp (CAGR) là 78% đến năm 2016, đạt 10,8 exabyte mỗi tháng.
Trong khi đó, các CSP đang tạo ra lượng lớn dữ liệu, bao gồm hồ sơ chi tiết cuộc gọi (CDR), dữ liệu mạng và dữ liệu khách hàng. Các công ty khai thác đầy đủ dữ liệu này sẽ có lợi thế cạnh tranh. Theo một khảo sát gần đây của The Economist Intelligence Unit, các công ty sử dụng việc ra quyết định dựa trên dữ liệu có mức tăng trưởng năng suất từ 5-6%. Tuy nhiên, 53% các công ty chỉ khai thác một nửa dữ liệu có giá trị của họ, và một phần tư số người được hỏi nhận thấy rằng một lượng lớn dữ liệu hữu ích vẫn chưa được khai thác. Khối lượng dữ liệu quá lớn khiến việc phân tích thủ công là bất khả thi, và hầu hết các hệ thống phần mềm cũ không thể đáp ứng được, dẫn đến việc dữ liệu có giá trị bị loại bỏ hoặc bỏ qua.
Với phần mềm big data có tốc độ cao, khả năng mở rộng của Big Data & Analytics, các CSP có thể khai thác tất cả dữ liệu của họ để đưa ra quyết định tốt hơn trong thời gian ngắn hơn. Các sản phẩm và kỹ thuật khác nhau của Big Data cung cấp một nền tảng phần mềm hoàn chỉnh để thu thập, chuẩn bị, phân tích và trình bày thông tin chi tiết từ big data. Các lĩnh vực ứng dụng bao gồm giám sát hiệu suất mạng, phát hiện gian lận, phát hiện khách hàng rời bỏ và phân tích rủi ro tín dụng. Các sản phẩm của Big Data & Analytics có thể mở rộng để xử lý terabyte dữ liệu, nhưng việc triển khai các công cụ này đòi hỏi một hệ thống cơ sở dữ liệu dựa trên đám mây mới như Hadoop hoặc bộ xử lý tính toán song song quy mô lớn (KPU, v.v.).
Khóa học này về BI Big Data cho Telco bao gồm tất cả các lĩnh vực mới nổi mà các CSP đang đầu tư để tăng năng suất và mở ra các nguồn doanh thu mới. Khóa học sẽ cung cấp một cái nhìn toàn diện 360 độ về BI Big Data trong Telco để các nhà quản lý và người ra quyết định có thể có một cái nhìn tổng quan rộng rãi và toàn diện về các khả năng của BI Big Data trong Telco để tăng năng suất và doanh thu.
Mục tiêu khóa học
Mục tiêu chính của khóa học là giới thiệu các kỹ thuật tình báo nghiệp vụ Big Data mới trong 4 lĩnh vực của Telecom Business (Marketing/Bán hàng, Vận hành Mạng, Vận hành Tài chính và Quan hệ Khách hàng Management). Sinh viên sẽ được giới thiệu những điều sau:
- Giới thiệu về Big Data - 4Vs (khối lượng, tốc độ, sự đa dạng và tính xác thực) trong Big Data - Tạo, trích xuất và quản lý từ góc độ Telco
- Phân tích Big Data khác với phân tích dữ liệu cũ như thế nào
- Chứng minh tính hợp lý của Big Data trong nội bộ - Góc độ Telco
- Giới thiệu về Hệ sinh thái Hadoop - làm quen với tất cả các công cụ Hadoop như Hive, Pig, SPARC - khi nào và làm thế nào chúng được sử dụng để giải quyết các vấn đề Big Data
- Cách trích xuất Big Data để phân tích cho các công cụ phân tích - cách Business Analysis có thể giảm bớt các điểm khó khăn của họ trong việc thu thập và phân tích dữ liệu thông qua cách tiếp cận bảng điều khiển Hadoop tích hợp
- Giới thiệu cơ bản về phân tích thông tin chi tiết, phân tích trực quan và phân tích dự đoán cho Telco
- Phân tích rời bỏ khách hàng và Big Data - cách phân tích Big Data có thể giảm thiểu tình trạng rời bỏ khách hàng và sự không hài lòng của khách hàng trong Telco - các nghiên cứu điển hình
- Phân tích lỗi mạng và lỗi dịch vụ từ siêu dữ liệu mạng và IPDR
- Phân tích tài chính - gian lận, lãng phí và ước tính ROI từ dữ liệu bán hàng và vận hành
- Vấn đề thu hút khách hàng - Tiếp thị mục tiêu, phân khúc khách hàng và bán chéo từ dữ liệu bán hàng
- Giới thiệu và tóm tắt tất cả các sản phẩm phân tích Big Data và vị trí của chúng trong không gian phân tích Telco
- Kết luận - cách tiếp cận từng bước để giới thiệu Big Data Business Intelligence trong tổ chức của bạn
Đối tượng mục tiêu
- Nhà vận hành mạng, Quản lý tài chính, Quản lý CRM và các nhà quản lý IT hàng đầu trong văn phòng CIO của Telco.
- Nhà phân tích Business trong Telco
- Quản lý/Nhà phân tích văn phòng CFO
- Quản lý vận hành
- Quản lý QA
Big Data Business Intelligence for Criminal Intelligence Analysis
35 HoursTrong khóa đào tạo trực tiếp do giảng viên hướng dẫn này tại Việt Nam, những người tham gia sẽ học được tư duy để tiếp cận các công nghệ Big Data, đánh giá tác động của chúng đối với các quy trình và chính sách hiện có và triển khai các công nghệ này nhằm mục đích xác định hoạt động tội phạm và ngăn ngừa tội phạm. Các nghiên cứu tình huống từ các tổ chức thực thi pháp luật trên toàn thế giới sẽ được xem xét để có được hiểu biết sâu sắc về các phương pháp tiếp cận, thách thức và kết quả áp dụng của họ.
Vào cuối khóa đào tạo này, người tham gia sẽ có thể:
- Kết hợp công nghệ Big Data với các quy trình thu thập dữ liệu truyền thống để ghép lại một câu chuyện trong quá trình điều tra.
- Triển khai các giải pháp lưu trữ và xử lý dữ liệu lớn trong công nghiệp để phân tích dữ liệu.
- Chuẩn bị đề xuất áp dụng các công cụ và quy trình phù hợp nhất để áp dụng phương pháp tiếp cận dựa trên dữ liệu vào điều tra tội phạm.
Programming with Big Data in R
21 HoursBig Data là một thuật ngữ đề cập đến các giải pháp được thiết kế để lưu trữ và xử lý các tập dữ liệu lớn. Ban đầu được phát triển bởi Google, các giải pháp Big Data này đã phát triển và truyền cảm hứng cho các dự án tương tự khác, nhiều dự án trong số đó có sẵn dưới dạng mã nguồn mở. R là một ngôn ngữ lập trình phổ biến trong ngành tài chính.
Introductory R (Basic to Intermediate)
14 HoursKhóa đào tạo trực tiếp, trực tuyến hoặc tại chỗ này dành cho các nhà phân tích dữ liệu mới bắt đầu, những người muốn sử dụng ngôn ngữ lập trình R để thao tác dữ liệu, thực hiện phân tích dữ liệu cơ bản và tạo ra các hình ảnh trực quan hấp dẫn để khám phá thông tin chi tiết.
Sau khi hoàn thành khóa đào tạo này, người tham gia sẽ có thể:
- Hiểu các khái niệm cơ bản của R Programming.
- Áp dụng các quy trình khoa học dữ liệu cơ bản.
- Tạo các biểu diễn trực quan của dữ liệu.
From Data to Decision with Big Data and Predictive Analytics
21 HoursĐối tượng
Nếu bạn cố gắng tìm ý nghĩa từ dữ liệu bạn có hoặc muốn phân tích dữ liệu phi cấu trúc có sẵn trên mạng (như Twitter, LinkedIn, v.v.), khóa học này dành cho bạn.
Khóa học chủ yếu dành cho những người ra quyết định và những người cần chọn dữ liệu nào đáng thu thập và dữ liệu nào đáng phân tích.
Khóa học không dành cho những người cấu hình giải pháp, mặc dù những người đó cũng sẽ được hưởng lợi từ bức tranh toàn cảnh.
Phương thức giảng dạy
Trong suốt khóa học, các đại biểu sẽ được giới thiệu các ví dụ thực tế về các công nghệ chủ yếu là mã nguồn mở.
Các bài giảng ngắn gọn sẽ được theo sau bởi bài thuyết trình và các bài tập đơn giản từ người tham gia.
Nội dung và Phần mềm sử dụng
Tất cả phần mềm được sử dụng đều được cập nhật mỗi khi khóa học được tổ chức, vì vậy chúng tôi kiểm tra các phiên bản mới nhất có thể.
Nó bao gồm quy trình từ thu thập, định dạng, xử lý và phân tích dữ liệu, đến giải thích cách tự động hóa quy trình ra quyết định bằng học máy.
DataRobot
7 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và nhà phân tích dữ liệu muốn tự động hóa, đánh giá và quản lý các mô hình dự đoán bằng khả năng học máy của DataRobot.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Tải các tập dữ liệu vào DataRobot để phân tích, đánh giá và kiểm tra chất lượng dữ liệu.
- Xây dựng và huấn luyện mô hình để xác định các biến quan trọng và đáp ứng các mục tiêu dự đoán.
- Giải thích mô hình để tạo ra những hiểu biết sâu sắc có giá trị, hữu ích trong việc đưa ra quyết định kinh doanh.
- Giám sát và quản lý mô hình để duy trì hiệu suất dự đoán tối ưu.
Generative & Predictive AI for Developers
21 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển ở trình độ trung cấp, những người muốn xây dựng các ứng dụng hỗ trợ AI bằng cách sử dụng phân tích dự đoán và mô hình tạo sinh.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Hiểu các nguyên tắc cơ bản của AI dự đoán và mô hình tạo sinh.
- Sử dụng các công cụ hỗ trợ AI để dự đoán mã, dự báo và tự động hóa.
- Triển khai LLM (Mô hình Ngôn ngữ Lớn) và bộ chuyển đổi để tạo văn bản và mã.
- Áp dụng dự báo chuỗi thời gian và đề xuất dựa trên AI.
- Phát triển và tinh chỉnh các mô hình AI cho các ứng dụng thực tế.
- Đánh giá các cân nhắc về đạo đức và các thực tiễn tốt nhất trong việc triển khai AI.
Introduction to Predictive AI
21 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các chuyên gia IT mới bắt đầu muốn nắm vững kiến thức cơ bản về Predictive AI.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Hiểu các khái niệm cốt lõi của Predictive AI và các ứng dụng của nó.
- Thu thập, làm sạch và tiền xử lý dữ liệu để phân tích dự đoán.
- Khám phá và trực quan hóa dữ liệu để khám phá những hiểu biết sâu sắc.
- Xây dựng các mô hình thống kê cơ bản để đưa ra dự đoán.
- Đánh giá hiệu suất của các mô hình dự đoán.
- Áp dụng các khái niệm Predictive AI vào các tình huống thực tế.
Introduction to R with Time Series Analysis
21 HoursR là một ngôn ngữ lập trình nguồn mở và miễn phí, được sử dụng cho các tính toán thống kê, phân tích dữ liệu và đồ họa. R đang được sử dụng ngày càng nhiều bởi các nhà quản lý và chuyên gia phân tích dữ liệu trong các tập đoàn và giới học thuật. R có nhiều gói (packages) đa dạng cho khai thác dữ liệu.
Matlab for Predictive Analytics
21 HoursPhân tích dự đoán là quá trình sử dụng phân tích dữ liệu để đưa ra dự đoán về tương lai. Quá trình này sử dụng dữ liệu cùng với các kỹ thuật khai thác dữ liệu, thống kê và học máy để tạo ra một mô hình dự đoán cho việc dự báo các sự kiện trong tương lai.
Trong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này, người tham gia sẽ học cách sử dụng Matlab để xây dựng các mô hình dự đoán và áp dụng chúng vào các tập dữ liệu lớn để dự đoán các sự kiện trong tương lai dựa trên dữ liệu.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Tạo các mô hình dự đoán để phân tích các mẫu trong dữ liệu lịch sử và giao dịch
- Sử dụng mô hình dự đoán để xác định rủi ro và cơ hội
- Xây dựng các mô hình toán học nắm bắt các xu hướng quan trọng
- Sử dụng dữ liệu từ các thiết bị và hệ thống kinh doanh để giảm lãng phí, tiết kiệm thời gian hoặc cắt giảm chi phí
Đối tượng
- Nhà phát triển
- Kỹ sư
- Chuyên gia trong lĩnh vực
Định dạng khóa học
- Kết hợp bài giảng, thảo luận, bài tập và thực hành chuyên sâu
Predictive AI in DevOps: Enhancing Software Delivery
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các chuyên gia trình độ trung cấp DevOps muốn tích hợp AI dự đoán vào thực tiễn DevOps của họ.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Triển khai các mô hình phân tích dự đoán để dự báo và giải quyết các thách thức trong quy trình DevOps.
- Sử dụng các công cụ hỗ trợ AI để tăng cường giám sát và vận hành.
- Áp dụng các kỹ thuật học máy để cải thiện quy trình phân phối phần mềm.
- Thiết kế các chiến lược AI để giải quyết và tối ưu hóa các vấn đề một cách chủ động.
- Tìm hiểu các cân nhắc về đạo đức khi sử dụng AI trong DevOps.
RapidMiner for Machine Learning and Predictive Analytics
14 HoursRapidMiner là một nền tảng phần mềm khoa học dữ liệu mã nguồn mở để tạo mẫu và phát triển ứng dụng nhanh chóng. Nó bao gồm một môi trường tích hợp để chuẩn bị dữ liệu, học máy, học sâu, khai thác văn bản và phân tích dự đoán.
Trong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này, người tham gia sẽ học cách sử dụng RapidMiner Studio để chuẩn bị dữ liệu, học máy và triển khai mô hình dự đoán.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Cài đặt và cấu hình RapidMiner
- Chuẩn bị và trực quan hóa dữ liệu với RapidMiner
- Xác thực các mô hình học máy
- Kết hợp dữ liệu và tạo các mô hình dự đoán
- Triển khai phân tích dự đoán trong quy trình kinh doanh
- Khắc phục sự cố và tối ưu hóa RapidMiner
Đối tượng
- Nhà khoa học dữ liệu
- Kỹ sư
- Nhà phát triển
Định dạng khóa học
- Kết hợp bài giảng, thảo luận, bài tập và thực hành chuyên sâu
Lưu ý
- Để yêu cầu đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Introduction to Data Visualization with Tidyverse and R
7 HoursBộ Tidyverse là một tập hợp các gói R đa năng để làm sạch, xử lý, mô hình hóa và trực quan hóa dữ liệu. Một số gói bao gồm: ggplot2, dplyr, tidyr, readr, purrr và tibble.
Trong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này, người tham gia sẽ học cách thao tác và trực quan hóa dữ liệu bằng các công cụ có trong Tidyverse.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thực hiện phân tích dữ liệu và tạo ra các hình ảnh trực quan hấp dẫn
- Rút ra những kết luận hữu ích từ nhiều tập dữ liệu mẫu
- Lọc, sắp xếp và tóm tắt dữ liệu để trả lời các câu hỏi thăm dò
- Chuyển đổi dữ liệu đã xử lý thành các biểu đồ đường, biểu đồ cột, biểu đồ tần suất thông tin
- Nhập và lọc dữ liệu từ nhiều nguồn dữ liệu khác nhau, bao gồm Excel, CSV và tệp SPSS
Đối tượng
- Người mới bắt đầu với ngôn ngữ R
- Người mới bắt đầu với phân tích dữ liệu và trực quan hóa dữ liệu
Định dạng khóa học
- Kết hợp bài giảng, thảo luận, bài tập và thực hành nặng nề