Web Scraping with Python Training Course
Web Scraping là kỹ thuật trích xuất dữ liệu từ một trang web sau đó lưu nó vào tệp cục bộ hoặc cơ sở dữ liệu.
Khóa đào tạo trực tiếp, trực tuyến hoặc tại chỗ này dành cho các nhà phát triển muốn sử dụng Python để tự động hóa quy trình thu thập dữ liệu từ nhiều trang web để xử lý và phân tích.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Cài đặt và cấu hình Python và tất cả các gói liên quan.
- Thu thập và phân tích dữ liệu được lưu trữ trên nhiều trang web.
- Hiểu cách thức hoạt động của các trang web và cách cấu trúc HTML của chúng.
- Xây dựng các spider để thu thập dữ liệu trên web một cách quy mô.
- Sử dụng Selenium để thu thập dữ liệu từ các trang web được điều khiển bởi AJAX.
Định dạng khóa học
- Bài giảng và thảo luận tương tác.
- Nhiều bài tập và thực hành.
- Thực hành trực tiếp trong môi trường lab thực tế.
Tùy chọn tùy chỉnh khóa học
- Khóa học này giả định kiến thức về lập trình.
- Để yêu cầu đào tạo tùy chỉnh cho khóa học này, vui lòng liên hệ với chúng tôi để sắp xếp.
Đề cương khóa học
Giới thiệu
Thiết lập Môi trường Phát triển
Python Bài tập cơ bản: Cấu trúc Dữ liệu, Điều kiện, Xử lý Tệp, v.v.
Python Các gói cho Web Scraping: Scrapy và BeautifulSoup
Cách một Website Hoạt động
Cách HTML được Cấu trúc
Thực hiện Yêu cầu Web
Scraping một Trang HTML
Làm việc với XPath và CSS
Lọc Dữ liệu Sử dụng Biểu thức Chính quy Express
Tạo Web Crawler
Thu thập dữ liệu (Crawling) các Trang AJAX và JavaScript với Selenium.
Các Thực hành Tốt nhất về Web Scraping
Khắc phục Sự cố
Tóm tắt và Kết luận
Requirements
- Programming kinh nghiệm, ưu tiên trong Python. Nếu người tham gia có kinh nghiệm lập trình bằng ngôn ngữ khác Python, khóa đào tạo có thể được mở rộng để bao gồm nhiều bài tập giới thiệu về Python hơn.
Đối tượng
- Các nhà phát triển
Open Training Courses require 5+ participants.
Web Scraping with Python Training Course - Booking
Web Scraping with Python Training Course - Enquiry
Web Scraping with Python - Consultancy Enquiry
Consultancy Enquiry
Testimonials (1)
Many different examples and topics has been covered, from basic investigation to login management and dynamic page management.
Daniele Tagliaferro - Creditsafe Italia Srl
Course - Web Scraping with Python
Provisional Upcoming Courses (Require 5+ participants)
Related Courses
Scaling Data Analysis with Python and Dask
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và kỹ sư phần mềm muốn sử dụng Dask với hệ sinh thái Python để xây dựng, mở rộng và phân tích các tập dữ liệu lớn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường để bắt đầu xây dựng xử lý dữ liệu lớn với Dask và Python.
- Khám phá các tính năng, thư viện, công cụ và API có sẵn trong Dask.
- Hiểu cách Dask tăng tốc tính toán song song trong Python.
- Tìm hiểu cách mở rộng hệ sinh thái Python (Numpy, SciPy và Pandas) bằng cách sử dụng Dask.
- Tối ưu hóa môi trường Dask để duy trì hiệu suất cao trong việc xử lý các tập dữ liệu lớn.
Data Analysis with Python, Pandas and Numpy
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển và nhà phân tích dữ liệu trình độ trung cấp, những người muốn nâng cao kỹ năng phân tích và thao tác dữ liệu bằng Pandas và NumPy.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển bao gồm Python, Pandas và NumPy.
- Tạo ứng dụng phân tích dữ liệu bằng Pandas và NumPy.
- Thực hiện các thao tác xử lý, sắp xếp và lọc dữ liệu nâng cao.
- Thực hiện các thao tác tổng hợp và phân tích dữ liệu chuỗi thời gian.
- Trực quan hóa dữ liệu bằng Matplotlib và các thư viện trực quan hóa khác.
- Gỡ lỗi và tối ưu hóa mã phân tích dữ liệu của họ.
Web Development with Django
21 HoursDjango là một framework Web Python cấp cao khuyến khích phát triển nhanh chóng và thiết kế sạch sẽ, thực dụng.
Đối tượng
Khóa học này dành cho các nhà phát triển và kỹ sư muốn tích hợp Django vào các dự án của họ.
Monax: Build a Smart Contract Application
7 HoursTrong khóa đào tạo trực tiếp, do giảng viên hướng dẫn tại Việt Nam này, người tham gia sẽ học cách xây dựng một ứng dụng blockchain hợp đồng thông minh với Monax.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Phát triển và triển khai một ứng dụng phân tán bằng công nghệ blockchain và hợp đồng thông minh.
- Hiểu thiết kế và chức năng của 'hợp đồng thông minh' và cách tạo một hợp đồng.
- Thực hiện các phương pháp hay nhất để phát triển ứng dụng blockchain an toàn.
- Tận dụng các công cụ Monax để tối ưu hóa quá trình phát triển ứng dụng phân tán.
FARM (FastAPI, React, and MongoDB) Full Stack Development
14 HoursKhóa đào tạo trực tiếp, trực tuyến hoặc tại chỗ này dành cho các nhà phát triển muốn sử dụng bộ công cụ FARM (FastAPI, React và MongoDB) để xây dựng các ứng dụng web động, hiệu suất cao và có khả năng mở rộng.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết tích hợp FastAPI, React và MongoDB.
- Hiểu các khái niệm, tính năng và lợi ích chính của bộ công cụ FARM.
- Tìm hiểu cách xây dựng REST API với FastAPI.
- Tìm hiểu cách thiết kế các ứng dụng tương tác với React.
- Phát triển, kiểm tra và triển khai các ứng dụng (front-end và back-end) bằng bộ công cụ FARM.
Developing APIs with Python and FastAPI
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển muốn sử dụng FastAPI với Python để xây dựng, kiểm tra và triển khai các API RESTful dễ dàng và nhanh chóng hơn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết để xây dựng API với Python và FastAPI.
- Tạo API nhanh chóng và dễ dàng hơn bằng thư viện FastAPI.
- Tìm hiểu cách tạo mô hình dữ liệu và lược đồ dựa trên Pydantic và OpenAPI.
- Kết nối API với cơ sở dữ liệu bằng SQLAlchemy.
- Triển khai bảo mật và xác thực trong API bằng các công cụ của FastAPI.
- Xây dựng hình ảnh container và triển khai API web lên máy chủ đám mây.
Web application development with Flask
14 HoursKhóa học thực hành này dành cho các nhà phát triển muốn tạo và duy trì ứng dụng web đầu tiên của họ. Nó cũng dành cho những người đã quen thuộc với các framework web khác như Django hoặc Web2py, và muốn tìm hiểu cách sử dụng một microframework (tức là một framework kết nối các thư viện bên thứ ba thay vì cung cấp một giải pháp toàn diện tự chứa) thay đổi quy trình.
Một phần đáng kể của khóa học dành cho việc không phải Flask bản thân (nó rất nhỏ gọn), mà là các thư viện và công cụ bên thứ ba thường được sử dụng trong các dự án Flask.
Advanced Flask
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển muốn sử dụng các tính năng nâng cao của Flask để xây dựng các ứng dụng web có khả năng mở rộng trên MongoDB.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết để bắt đầu phát triển các ứng dụng web với Flask.
- Tìm hiểu các khái niệm và kỹ thuật nâng cao cho các dự án Flask thực tế.
- Xây dựng một máy chủ API RESTful trên MongoDB.
- Tìm hiểu cách đóng gói, kiểm tra và triển khai các microservice với Flask, Docker và Amazon EC2.
- Có được một số hiểu biết sâu sắc về các tích hợp nâng cao của Flask để mở rộng các ứng dụng web.
Kivy: Building Android Apps with Python
7 HoursKivy là một thư viện giao diện người dùng đồ họa đa nền tảng, mã nguồn mở được viết bằng Python, cho phép phát triển ứng dụng đa chạm cho nhiều thiết bị khác nhau.
Trong khóa đào tạo trực tiếp, do giảng viên hướng dẫn này, người tham gia sẽ học cách cài đặt và triển khai Kivy trên các nền tảng khác nhau, tùy chỉnh và thao tác với các widget, lên lịch, kích hoạt và phản hồi các sự kiện, sửa đổi đồ họa bằng đa chạm, thay đổi kích thước màn hình, đóng gói ứng dụng cho Android và hơn thế nữa.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể
- Liên kết mã Python và ngôn ngữ Kivy.
- Có kiến thức vững chắc về cách Kivy hoạt động và sử dụng các thành phần quan trọng nhất của nó như widget, sự kiện, thuộc tính, đồ họa, v.v.
- Phát triển và triển khai ứng dụng Android một cách liền mạch dựa trên các yêu cầu kinh doanh và thiết kế khác nhau.
Định dạng khóa học
- Kết hợp bài giảng, thảo luận, bài tập và thực hành chuyên sâu.
Accelerating Python Pandas Workflows with Modin
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà khoa học dữ liệu và nhà phát triển muốn sử dụng Modin để xây dựng và triển khai các phép tính song song với Pandas để phân tích dữ liệu nhanh hơn.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường cần thiết để bắt đầu phát triển các quy trình làm việc Pandas quy mô lớn với Modin.
- Hiểu các tính năng, kiến trúc và lợi thế của Modin.
- Nắm vững sự khác biệt giữa Modin, Dask và Ray.
- Thực hiện các thao tác Pandas nhanh hơn với Modin.
- Triển khai toàn bộ API và các hàm Pandas.
Game Development with PyGame
7 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển muốn sử dụng PyGame để tạo và xây dựng trò chơi bằng cách lập trình Python.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết để bắt đầu tạo các ứng dụng trò chơi với PyGame và Python.
- Tìm hiểu cách tạo các ứng dụng PyGame tương tác tích hợp với hoạt ảnh và các tính năng đa phương tiện.
- Chạy và kiểm tra các chương trình trò chơi với bộ kiểm thử PyGame và chuyển chúng thành các tệp thực thi.
GUI Programming with Python and PyQt
21 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này tại Việt Nam (trực tuyến hoặc tại chỗ) dành cho những người muốn lập trình một ứng dụng phần mềm hấp dẫn về mặt hình ảnh bằng Python và khung giao diện người dùng Qt.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển bao gồm tất cả các thư viện, gói và khung cần thiết.
- Tạo một ứng dụng máy tính để bàn hoặc máy chủ có giao diện người dùng hoạt động trơn tru và hấp dẫn về mặt hình ảnh.
- Triển khai các phần tử và hiệu ứng giao diện người dùng khác nhau, bao gồm widget, biểu đồ, lớp, v.v. để đạt được hiệu quả tối đa về khả năng sử dụng.
- Triển khai thiết kế giao diện người dùng tốt và tổ chức mã trong giai đoạn thiết kế và phát triển.
- Kiểm tra và gỡ lỗi ứng dụng.
Build REST APIs with Python and Flask
14 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển backend muốn xây dựng REST API bằng Python và Flask.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Triển khai REST API để cho phép ứng dụng web Flask đọc và ghi vào cơ sở dữ liệu ở backend.
- Phát triển các tính năng xác thực nâng cao như refresh token.
- Xây dựng backend có thể tái sử dụng cho các dự án Python trong tương lai.
- Đơn giản hóa việc lưu trữ dữ liệu với SQLAlchemy.
- Triển khai REST API lên máy chủ dựa trên đám mây.
Scientific Computing with Python SciPy
7 HoursKhóa đào tạo trực tiếp, do giảng viên hướng dẫn này (trực tuyến hoặc tại chỗ) dành cho các nhà phát triển muốn sử dụng SciPy để tạo các chức năng tính toán khoa học nâng cao với Python.
Khi kết thúc khóa đào tạo này, người tham gia sẽ có thể:
- Thiết lập môi trường phát triển cần thiết để bắt đầu tạo các chức năng tính toán khoa học.
- Tận dụng tối đa các tính năng của SciPy bằng cách thực hiện các ví dụ thực tế về các thao tác phức tạp.
- Triển khai và tối ưu hóa các thuật toán và hàm toán học để giải quyết các vấn đề khoa học.
- Thiết kế các cấu trúc dữ liệu và phương pháp nội suy để trực quan hóa, xử lý và phân tích.
Web Development with Web2Py
28 HoursWeb2py là một framework full-stack, mã nguồn mở, miễn phí dựa trên Python để phát triển nhanh chóng các ứng dụng web dựa trên cơ sở dữ liệu, nhanh, có khả năng mở rộng, bảo mật và di động.
Đối tượng
Khóa học này dành cho các Kỹ sư và Nhà phát triển sử dụng web2py làm framework để phát triển web.