Ẩn danh dữ liệu (Data Anonymization) là gì? Đặc điểm
Mục Lục
Ẩn danh dữ liệu
Ẩn danh dữ liệu tiếng Anh là Data Anonymization.
Ẩn danh dữ liệu là phương pháp bảo vệ dữ liệu riêng tư hoặc nhạy cảm bằng cách xóa hoặc mã hóa thông tin nhận dạng cá nhân khỏi cơ sở dữ liệu.
Việc ẩn danh dữ liệu được thực hiện nhằm mục đích bảo vệ các hoạt động riêng tư của một tập đoàn hoặc công ty trong khi duy trì tính toàn vẹn của dữ liệu được thu thập và chia sẻ. Ẩn danh dữ liệu còn được gọi là "ẩn dữ liệu", "che giấu dữ liệu" hoặc "nhận dạng dữ liệu".
Đặc điểm của Ẩn danh dữ liệu
Các tập đoàn tạo ra, lưu trữ và xử lí một lượng lớn dữ liệu nhạy cảm trong quá trình hoạt động kinh doanh thông thường. Sự tiến bộ trong công nghệ đã phát triển mạnh nhờ những thông tin liên quan được tìm thấy trong dữ liệu được tạo ra và chia sẻ trên nhiều lĩnh vực và quốc gia khác nhau.
Đổi mới tài chính trong công nghệ (fintech) đã đạt được tiến bộ vô hạn trong cách mà dịch vụ tài chính được tùy chỉnh cho khách hàng, nhờ dữ liệu được chia sẻ từ các lĩnh vực như phương tiện truyền thông xã hội và thương mại điện tử.
Dữ liệu được chia sẻ giữa các công ty truyền thông kĩ thuật số và thương mại điện tử đã giúp cả hai lĩnh vực quảng cáo sản phẩm tốt hơn trên trang web của họ tới một người dùng hoặc người tiêu dùng cụ thể. Tuy nhiên, để dữ liệu chia sẻ trở nên hữu ích mà không ảnh hưởng đến danh tính của khách hàng trong cơ sở dữ liệu, cần phải sử dụng ẩn danh dữ liệu.
Việc ẩn danh dữ liệu được thực hiện bởi hầu hết các ngành công nghiệp xử lí thông tin nhạy cảm như ngành y tế, tài chính và phương tiện truyền thông kĩ thuật số, đồng thời thúc đẩy tính toàn vẹn của việc chia sẻ dữ liệu.
Ẩn danh dữ liệu làm giảm nguy cơ tiết lộ ngoài ý muốn khi chia sẻ dữ liệu giữa các quốc gia, ngành công nghiệp và thậm chí các phòng ban trong cùng một công ty. Ví dụ, một bệnh viện chia sẻ dữ liệu bí mật về bệnh nhân của mình cho phòng thí nghiệm nghiên cứu y tế hoặc công ty dược phẩm có thể làm điều đó một cách đạo đức nếu họ ẩn danh tính của bệnh nhân. Điều này có thể được thực hiện bằng cách xóa tên, số an sinh xã hội, ngày sinh và địa chỉ của bệnh nhân khỏi dữ liệu, chỉ để lại các thông tin quan trọng cần thiết cho nghiên cứu y tế như tuổi, bệnh, chiều cao, cân nặng, giới tính, chủng tộc, v.v.
Việc ẩn danh dữ liệu được thực hiện theo nhiều cách khác nhau, bao gồm xóa, mã hóa, khái quát hóa,... Một công ty có thể xóa thông tin nhận dạng cá nhân (PII) khỏi dữ liệu được thu thập hoặc mã hóa thông tin này bằng một cụm mật khẩu mạnh. Một doanh nghiệp cũng có thể quyết định tổng quát hóa thông tin được thu thập trong cơ sở dữ liệu của mình.
(Theo Investopedia)