Hello Diu Túp, hôm nay chúng mình xin giới thiệu đến các bạn 1 video mới trong Series “Tự Học Data Science Cho Người Mới Bắt Đầu”. Và chủ đề của Video hôm này đó chính là “Hướng Dẫn Các Bước Tiền Xử Lý Dữ Liệu bằng Scikit-Learn” 🤩 !

Tiền xử lý dữ liệu (Data Pre-Processing) là một kỹ thuật được sử dụng để chuyển đổi dữ liệu thô thành một định dạng dễ hiểu. Dữ liệu trong thế giới thực (dữ liệu thô) luôn không đầy đủ và dữ liệu đó không thể được gửi qua các mô hình vì nó sẽ gây ra một số lỗi nhất định. Đó là lý do tại sao chúng ta cần xử lý trước dữ liệu trước khi gửi nó qua một mô hình.

⏱ Timestamps:

  • [0:00] Giới thiệu về Series “Tự Học Data Science Cho Người Mới Bắt Đầu”
  • [0:30] Giới thiệu về Nội Dung của Video
  • [5:00] Nhập các thư viện và Đọc tập dữ liệu
  • [8:00] Xử lý các giá trị bị thiếu (missing data replacement)
  • [20:30] Mã hoá các dữ liệu danh mục
  • [27:40] Cách tách dữ liệu (dataset) thành training và test sets
  • [40:00] Tiêu chuẩn hóa / Tỷ lệ tính năng (Feature Scaling)

#scikit-learn #data-science

Hướng Dẫn Các Bước Tiền Xử Lý Dữ Liệu bằng Scikit-Learn
15.35 GEEK