Có được thông tin đáng tin cậy là một thách thức: Thông tin từ nhiều nguồn có thể không nhất quán. Việc xác định thông tin chính xác và đáng tin cậy là một vấn đề quan trọng. Xử lý dữ liệu bằng máy tính để rút ra thông tin đáng tin cậy là một bài toán khó.
Thông tin phục vụ hoạt động hằng ngày của các cơ quan, doanh nghiệp:
Thông tin chính thống từ các cơ sở dữ liệu quốc gia như giấy tờ pháp lý (như CCCD, giấy chứng nhận quyền sử dụng đất,...) phục vụ cho quản lý và ra chính sách.
Nguồn thông tin đáng tin cậy thường là nguồn thông tin được công bố từ các cơ quan chính phủ, từ các cấp có thẩm quyền của nhà nước hoặc thông tin đã được kiểm chứng.
Cụm từ "Cơ sở dữ liệu" nói về tập hợp toàn bộ dữ liệu được tổ chức và lưu trữ có thể dùng máy tính khai thác nhằm phục vụ hoạt động hằng ngày của một tổ chức, cơ quan, doanh nghiệp.
Khai thác thông tin đáng tin cậy rất quan trọng đối với hoạt động của tổ chức, doanh nghiệp. Cần cung cấp chính xác đầy đủ thông tin về khách hàng (như họ tên, số điện thoại, địa chỉ), giá hàng,... để đảm bảo các hoạt động. Nếu thông tin không đáng tin cậy doanh nghiệp có thể bị thiệt hại.
2. Khai thác và sử dụng thông tin đáng tin cậy
Câu chuyện “Tã giấy và Bia”: Nghiên cứu từ dữ liệu bán hàng cho thấy khi mua tã giấy, nhiều khách hàng mua thêm bia. Walmart đã điều chỉnh vị trí trưng bày hàng hóa, làm tăng doanh số cả hai mặt hàng.
Google và dự đoán dịch cúm: Google phân tích từ khóa tìm kiếm kết hợp với dữ liệu từ Trung tâm kiểm soát dịch bệnh để dự đoán sự lây lan của dịch cúm, đạt kết quả chính xác.
Các quyết định quan trọng của cơ quan nhà nước và doanh nghiệp phụ thuộc vào thông tin có độ tin cậy cao, được khai thác từ dữ liệu lớn bằng các phương pháp và công cụ chuyên sâu.