Bài 10. Nguyên tắc tích hợp dữ liệu an toàn

1. Đặt vấn đề

Tích hợp dữ liệu là điều kiện để AI local tạo ra giá trị thực tế, nhưng cũng là nguồn rủi ro lớn nhất. Một hệ thống AI có thể chạy hoàn toàn trong bệnh viện nhưng vẫn không an toàn nếu dữ liệu bị truy xuất vượt quyền, log chứa thông tin nhạy cảm, prompt đưa quá nhiều dữ liệu, model trả lời lộ thông tin hoặc API mở không kiểm soát.

Vì vậy, bệnh viện cần có bộ nguyên tắc tích hợp dữ liệu an toàn trước khi kết nối AI với các hệ thống nội bộ.

2. Nguyên tắc mục đích rõ ràng

Mỗi tích hợp phải trả lời:

Tích hợp để làm gì?
Ai sử dụng?
Dữ liệu nào cần?
Kết quả dùng vào việc gì?
Có cần dữ liệu định danh không?
Có lưu kết quả không?
Ai chịu trách nhiệm?

Không nên tích hợp chỉ vì “có thể làm được”.

3. Nguyên tắc dữ liệu tối thiểu

Chỉ lấy dữ liệu cần thiết cho tác vụ. Nếu phân tích thời gian chờ, không cần họ tên người bệnh. Nếu tạo báo cáo tổng hợp, không cần hồ sơ chi tiết. Nếu đào tạo, có thể dùng dữ liệu giả lập hoặc ẩn danh.

Dữ liệu càng ít, rủi ro càng thấp.

4. Nguyên tắc phân quyền trước khi truy xuất

Hệ thống phải kiểm tra quyền trước khi lấy dữ liệu và trước khi đưa dữ liệu vào prompt. Không được lấy dữ liệu vượt quyền rồi hy vọng model không tiết lộ.

Phân quyền phải nằm ở API trung gian hoặc lớp dữ liệu, không phải chỉ trong system prompt.

5. Nguyên tắc ẩn danh khi có thể

Nếu tác vụ không cần định danh, phải ẩn danh:

Người bệnh.
Nhân viên.
Số hồ sơ.
Số điện thoại.
Địa chỉ.
Mã định danh.
Chi tiết nhận diện.

Ẩn danh giúp giảm rủi ro khi xử lý, lưu log và phân tích.

6. Nguyên tắc không truy cập trực tiếp database nguồn

AI không nên truy cập trực tiếp database HIS, EMR, LIS, PACS, QMS. Cần có API hoặc báo cáo trung gian:

Kiểm quyền.
Lọc dữ liệu.
Ẩn danh.
Ghi log.
Giới hạn truy vấn.
Kiểm soát output.

Database nguồn là hệ thống nghiệp vụ, không phải kho tự do cho AI.

7. Nguyên tắc chỉ đọc trước, ghi sau nếu đủ điều kiện

Giai đoạn đầu, AI chỉ nên đọc và hỗ trợ phân tích. Không nên cho AI ghi ngược dữ liệu vào hệ thống nguồn. Nếu sau này cần ghi, phải có:

Xác nhận của người dùng.
Log.
Phân quyền.
Cơ chế rollback.
Kiểm duyệt.
Quy định rõ trường nào được ghi.

Không được để AI tự sửa bệnh án, kết quả xét nghiệm, viện phí, báo cáo sự cố hoặc hồ sơ nhân sự.

8. Nguyên tắc log và truy vết

Cần ghi log:

Ai gọi AI.
Gọi lúc nào.
Tác vụ gì.
Dữ liệu nguồn nào.
Model nào.
Kết quả trạng thái.
Có lỗi không.
Có truy xuất tài liệu nào.

Tùy mức nhạy cảm, có thể không lưu toàn bộ prompt/response hoặc phải lưu trong khu vực bảo mật.

9. Nguyên tắc nguồn và phiên bản

Khi AI trả lời dựa trên dữ liệu, cần biết:

Dữ liệu lấy từ đâu.
Phiên bản nào.
Thời gian nào.
Báo cáo nào.
Tài liệu nào.
Có còn hiệu lực không.

Không có nguồn thì không nên trình bày như kết luận chính thức.

10. Nguyên tắc kiểm soát đầu ra

AI có thể trả lời lộ thông tin hoặc vượt thẩm quyền. Cần kiểm soát:

Có chứa dữ liệu định danh không?
Có trả lời vượt quyền không?
Có bịa số liệu không?
Có kết luận chuyên môn không phù hợp không?
Có nguồn không?
Có cảnh báo khi thiếu căn cứ không?

Với tác vụ nhạy cảm, có thể cần kiểm duyệt trước khi hiển thị hoặc lưu.

11. Nguyên tắc đánh giá rủi ro trước tích hợp

Trước khi tích hợp nguồn dữ liệu mới, cần đánh giá:

Mức độ nhạy cảm.
Mục đích sử dụng.
Người dùng.
Tác động nếu lộ dữ liệu.
Tác động nếu AI trả lời sai.
Khả năng ẩn danh.
Khả năng phân quyền.
Khả năng log.
Khả năng rollback.

Dữ liệu rủi ro cao cần triển khai sau, không nên làm ngay.

12. Kết luận

Tích hợp dữ liệu an toàn là điều kiện bắt buộc để AI local được dùng trong bệnh viện. Các nguyên tắc quan trọng gồm: mục đích rõ, dữ liệu tối thiểu, phân quyền trước truy xuất, ẩn danh khi có thể, không truy cập trực tiếp database nguồn, chỉ đọc trước, ghi sau khi đủ điều kiện, log đầy đủ, có nguồn/phiên bản, kiểm soát đầu ra và đánh giá rủi ro trước tích hợp. AI local an toàn là AI được kiểm soát bằng kiến trúc dữ liệu, không chỉ bằng lời nhắc trong prompt.

Đăng nhập để gửi ý kiến