Bài F15. Khoa học dữ liệu

H24
Hướng dẫn giải Thảo luận (1)

Nhà trường thường thu thập, lưu trữ và xử lý những dữ liệu về học sinh như: họ tên, ngày tháng nắm sinh, giới tính, địa chỉ, thông tin gia đình…

Trả lời bởi Nguyễn Việt Dũng
H24
Hướng dẫn giải Thảo luận (1)

a) Sơ lược về (khái niệm) Khoa học dữ liệu

Khoa học dữ liệu nghiên cứu ứng dụng các phương pháp và kĩ thuật từ nhiều lĩnh vực khác nhau như Toán học, thống kê, khoa học máy tính, trí tuệ nhân tạo, học máy…để tạo ra thông tin từ dữ liệu.

b) Mục tiêu cụ thể của Khoa học dữ liệu

Mục tiêu chính của Khoa học dự liệu là phân tích, khám phá thông tin, trực quan hoá dữ liệu, tối ưu hoá quyết định nhằm tạo ra tri thức và hỗ trợ giải quyết các vấn đề.

Trả lời bởi Nguyễn Việt Dũng
H24
Hướng dẫn giải Thảo luận (1)

Một vài thành tựu chính của Khoa học dữ liệu:

a) Khám phá tri thức và nâng cao năng lực ra quyết định

Khoa học dữ liệu đã giúp tạo ra các phát hiện mới và tri thức từ dữ liệu, từ việc tìm ra các mẫu dữ liệu (data patterns) và mối liên hệ giữa chúng đến khám phá tri thức mới. Cùng với Học máy, Khoa học dữ liệu đã giúp tạo ra các mô hình mở ra khả năng khám phá tri thức từ nhiều nguồn dữ liệu, từ đó tăng hiệu quả quyết định dựa trên dữ liệu. Hơn nữa, khả năng dự đoán, dự báo xu hướng và sự kiện trong tương lai từ dữ liệu hiện tại đã nâng cao hiệu quả của quá trình ra quyết định. Ví dụ, các ứng dụng như SAS của SAS Institute, SPSS Modeler của IBM thường được các tổ chức tài chính và ngân hàng sử dụng để phân tích, khai phá dữ liệu về các giao dịch để xác định được xu hướng hay các bất thường nhằm đưa ra quyết định liên quan lãi suất hay phát hiện kịp thời các rủi ro,...

b) Tự động hoá

Khoa học dữ liệu cùng với các mô hình học máy đã giúp tự động hoá các tác vụ lặp đi lặp lại. Ví dụ, robot thông minh như Amazon Robotic Drive Units (RDU) được tích hợp các mô hình

học máy để phân tích dữ liệu camera, vận tốc, hướng di chuyển, cảm biến,... nhầm tự động hoà việc vận chuyển hàng hoá và sắp xếp các sản phẩm trong kho, giảm thời gian cần thiết để vận chuyển từ các khu vực lưu trữ đến khu vực đóng gói dùng trong các kho hàng của Amazon. Vi dụ khác vẽ tự động hoá dựa trên Khoa học dữ liệu là hệ thống kiểm soát môi trưởng sử dụng trong nông nghiệp nhằm phân tích dữ liệu về độ ẩm, nhiệt độ, ánh sáng, cảm biến.... để tối ưu hoá diễu kiện cho sự phát triển của cây trắng hay vật nuôi.

c) Cá nhân hoá dịch vụ

Khoa học dữ liệu đã đóng góp đáng kể vào việc phát triển và triển khai các phương pháp cá nhân hoá, từ việc hiểu biết rõ người dùng đến việc tạo ra trải nghiệm cá nhân hoá trong nhiều lĩnh vực khác nhau. Ví dụ, các ứng dụng truyền thông như Netflix, YouTube có thể để xuất nội dung phù hợp với sở thích và lịch sử xem của người dùng. Ví dụ khác là các trang thương mại điện tử như Amazon, Ebay,... sử dụng dữ liệu lịch sử mua sắm và đánh giá của người dùng để để xuất sản phẩm hay chương trình giảm giá phù hợp với từng khách hàng hay nhóm khách hàng. d) Dự đoán

Khoa học dữ liệu đóng vai trò quan trọng trong phát triển các mô hình học máy có dùng trong phân loại và dự đoán. Các mô hình học máy sử dụng dữ liệu y tế, hình ảnh y khoa để hỏ trợ chẩn đoán, phân tích xu hướng bệnh, dự đoán tình trạng sức khoẻ cá nhân. Một số thành lựu có thể kể đến như phần mềm IBV Watson for Oncology giúp góp phần nâng cao hiệu quả điều trị ung thư và đã được ứng dụng ở Việt Nam.

Trả lời bởi Nguyễn Việt Dũng
H24
Hướng dẫn giải Thảo luận (1)

Tự động hoá là thành tựu quan trọng của Khoa học dữ liệu vì:

Khoa học dữ liệu cùng với các mô hình học máy đã giúp tự động hoá các tác vụ lặp đi lặp lại. Ví dụ, robot thông minh như Amazon Robotic Drive Units (RDU) được tích hợp các mô hình

học máy để phân tích dữ liệu camera, vận tốc, hướng di chuyển, cảm biến,... nhầm tự động hoà việc vận chuyển hàng hoá và sắp xếp các sản phẩm trong kho, giảm thời gian cần thiết để vận chuyển từ các khu vực lưu trữ đến khu vực đóng gói dùng trong các kho hàng của Amazon. Vi dụ khác vẽ tự động hoá dựa trên Khoa học dữ liệu là hệ thống kiểm soát môi trưởng sử dụng trong nông nghiệp nhằm phân tích dữ liệu về độ ẩm, nhiệt độ, ánh sáng, cảm biến.... để tối ưu hoá diễu kiện cho sự phát triển của cây trắng hay vật nuôi.

Trả lời bởi Nguyễn Việt Dũng
H24
Hướng dẫn giải Thảo luận (1)

Khoa học dữ liệu giúp nâng cao năng lực ra quyết định của máy tính vì:

Khoa học dữ liệu đã giúp tạo ra các phát hiện mới và tri thức từ dữ liệu, từ việc tìm ra các mẫu dữ liệu (data patterns) và mối liên hệ giữa chúng đến khám phá tri thức mới. Cùng với Học máy, Khoa học dữ liệu đã giúp tạo ra các mô hình mở ra khả năng khám phá tri thức từ nhiều nguồn dữ liệu, từ đó tăng hiệu quả quyết định dựa trên dữ liệu. Hơn nữa, khả năng dự đoán, dự báo xu hướng và sự kiện trong tương lai từ dữ liệu hiện tại đã nâng cao hiệu quả của quá trình ra quyết định. Ví dụ, các ứng dụng như SAS của SAS Institute, SPSS Modeler của IBM thường được các tổ chức tài chính và ngân hàng sử dụng để phân tích, khai phá dữ liệu về các giao dịch để xác định được xu hướng hay các bất thường nhằm đưa ra quyết định liên quan lãi suất hay phát hiện kịp thời các rủi ro,...

Trả lời bởi Nguyễn Việt Dũng
H24
Hướng dẫn giải Thảo luận (1)

Khoa học dữ liệu góp phần vào sự phát triển của các lĩnh vực như y tế, giáo dục, giao thông:

Khoa học dữ liệu đóng vai trò quan trọng trong phát triển các mô hình học máy có dùng trong phân loại và dự đoán. Các mô hình học máy sử dụng dữ liệu y tế, hình ảnh y khoa để hỏ trợ chẩn đoán, phân tích xu hướng bệnh, dự đoán tình trạng sức khoẻ cá nhân. Một số thành lựu có thể kể đến như phần mềm IBV Watson for Oncology giúp góp phần nâng cao hiệu quả điều trị ung thư và đã được ứng dụng ở Việt Nam.

Trả lời bởi Nguyễn Việt Dũng
H24
Hướng dẫn giải Thảo luận (1)

- Khám phá tri thức trong Khoa học dữ liệu gồm những hoạt động: Khoa học dữ liệu đã giúp tạo ra các phát hiện mới và tri thức từ dữ liệu, từ việc tìm ra các mẫu dữ liệu (data patterns) và mối liên hệ giữa chúng đến khám phá tri thức mới.

- Khám phá tri thức thành tựu quan trọng của Khoa học dữ liệu vì: khoa học dữ liệu đã giúp tạo ra các mô hình mở ra khả năng khám phá tri thức từ nhiều nguồn dữ liệu, từ đó tăng hiệu quả quyết định dựa trên dữ liệu.

Trả lời bởi Nguyễn Việt Dũng