Bài 1. Đặc thù dữ liệu y tế và dữ liệu cá nhân

1. Đặt vấn đề

Dữ liệu y tế là một trong những nhóm dữ liệu nhạy cảm nhất trong xã hội. Một dòng thông tin trong hồ sơ bệnh án không chỉ là dữ liệu kỹ thuật, mà có thể phản ánh tình trạng sức khỏe, bệnh tật, điều trị, thuốc, xét nghiệm, hình ảnh y tế, thông tin gia đình, hoàn cảnh xã hội và nhiều yếu tố riêng tư của người bệnh. Nếu dữ liệu này bị lộ, bị dùng sai hoặc bị diễn giải sai, hậu quả có thể rất lớn.

Khi triển khai AI local trong bệnh viện, cần hiểu rõ đặc thù của dữ liệu y tế và dữ liệu cá nhân. Không thể xử lý dữ liệu y tế như xử lý dữ liệu văn bản thông thường. Một chatbot nội bộ có thể vô tình trở thành nơi người dùng copy bệnh án, kết quả xét nghiệm, phản ánh người bệnh hoặc báo cáo sự cố vào để nhờ AI phân tích. Nếu không có quy định và kiểm soát, rủi ro sẽ phát sinh ngay cả khi AI chạy trong nội bộ bệnh viện.

2. Dữ liệu y tế là gì?

Dữ liệu y tế có thể gồm:

Thông tin hành chính người bệnh.
Lý do vào viện.
Bệnh sử.
Tiền sử bệnh.
Kết quả khám lâm sàng.
Chẩn đoán.
Y lệnh.
Đơn thuốc.
Kết quả xét nghiệm.
Kết quả chẩn đoán hình ảnh.
Hồ sơ phẫu thuật, thủ thuật.
Phiếu chăm sóc.
Phiếu theo dõi.
Tóm tắt ra viện.
Thông tin tư vấn.
Thông tin bảo hiểm y tế.
Thông tin thanh toán viện phí.
Dữ liệu phản ánh, khiếu nại, sự cố.

Đây là nhóm dữ liệu cần bảo vệ nghiêm ngặt.

3. Dữ liệu cá nhân trong bệnh viện

Dữ liệu cá nhân có thể gồm:

Họ tên.
Ngày sinh.
Giới tính.
Địa chỉ.
Số điện thoại.
Email.
CCCD/hộ chiếu.
Số thẻ BHYT.
Mã người bệnh.
Mã hồ sơ bệnh án.
Thông tin người nhà.
Hình ảnh nhận diện.
Giọng nói nếu có ghi âm.
Dữ liệu định vị hoặc lịch sử sử dụng dịch vụ.

Dữ liệu cá nhân khi kết hợp với dữ liệu y tế sẽ trở nên đặc biệt nhạy cảm.

4. Dữ liệu định danh và dữ liệu có thể tái định danh

Một dữ liệu đã bỏ tên người bệnh nhưng vẫn có thể bị tái định danh nếu còn nhiều chi tiết đặc thù. Ví dụ:

Một bệnh hiếm gặp.
Một ngày nhập viện cụ thể.
Một khoa điều trị cụ thể.
Một địa chỉ xã/phường nhỏ.
Một sự cố được nhiều người biết.
Một mô tả quá chi tiết về hoàn cảnh người bệnh.

Vì vậy, ẩn danh không chỉ là xóa họ tên. Cần đánh giá nguy cơ tái định danh.

5. Dữ liệu chuyên môn khác dữ liệu hành chính

Dữ liệu hành chính như lịch họp, thông báo nội bộ, quy trình chung thường ít nhạy cảm hơn. Dữ liệu chuyên môn như chẩn đoán, xét nghiệm, thuốc, hình ảnh y tế, bệnh án có mức rủi ro cao hơn. Không nên dùng cùng một chính sách cho mọi loại dữ liệu.

Cần phân loại dữ liệu theo mức độ nhạy cảm:

Dữ liệu công khai.
Dữ liệu nội bộ.
Dữ liệu hạn chế.
Dữ liệu nhạy cảm.
Dữ liệu đặc biệt nhạy cảm.

6. Dữ liệu y tế có tính ngữ cảnh cao

Một thông tin y tế không thể diễn giải tách rời. Ví dụ, một chỉ số xét nghiệm có thể có ý nghĩa khác nhau tùy tuổi, giới, bệnh nền, thuốc đang dùng, tình trạng cấp cứu, thời điểm lấy mẫu và bối cảnh lâm sàng. Nếu AI diễn giải dữ liệu y tế mà không đủ ngữ cảnh, câu trả lời có thể sai.

Đây là lý do AI không nên tự diễn giải kết quả cá nhân hoặc tự ra quyết định chuyên môn.

7. Dữ liệu y tế gắn với trách nhiệm chuyên môn

Khi dữ liệu y tế được sử dụng để ra quyết định, trách nhiệm thuộc nhân viên y tế có thẩm quyền. AI không chịu trách nhiệm pháp lý như bác sĩ, điều dưỡng, dược sĩ hoặc kỹ thuật viên. Vì vậy, AI chỉ có thể hỗ trợ tra cứu, tóm tắt, gợi ý; quyết định chuyên môn phải do con người kiểm tra và chịu trách nhiệm.

8. Rủi ro khi đưa dữ liệu y tế vào AI

Các rủi ro gồm:

Lộ thông tin người bệnh.
Người không có quyền truy cập dữ liệu.
AI tóm tắt sai.
AI bỏ sót thông tin quan trọng.
AI diễn giải sai kết quả.
AI đưa khuyến cáo vượt thẩm quyền.
Prompt và response trở thành bản sao dữ liệu y tế.
Log chứa thông tin nhạy cảm.
Dữ liệu được dùng sai mục đích.

9. Nguyên tắc cơ bản khi xử lý dữ liệu y tế bằng AI

Cần tuân thủ:

Có mục đích rõ.
Có phân quyền.
Có dữ liệu tối thiểu.
Có ẩn danh nếu có thể.
Có log phù hợp.
Có kiểm soát đầu ra.
Có cảnh báo giới hạn.
Không tự động ra quyết định chuyên môn.
Không dùng dữ liệu thật để thử nghiệm tùy tiện.
Không đưa dữ liệu nhạy cảm vào chatbot chung.

10. Kết luận

Dữ liệu y tế và dữ liệu cá nhân trong bệnh viện có đặc thù nhạy cảm, ngữ cảnh cao và gắn với trách nhiệm chuyên môn. AI local không làm mất đi các yêu cầu bảo vệ dữ liệu. Ngược lại, vì AI có khả năng đọc, tổng hợp và sinh nội dung rất mạnh, bệnh viện càng phải quản lý dữ liệu chặt chẽ hơn. Mọi triển khai AI local phải bắt đầu từ nhận thức đúng về giá trị và rủi ro của dữ liệu y tế.

Đăng nhập để gửi ý kiến