Bài 2. Nguyên tắc bảo mật khi triển khai AI local

1. Đặt vấn đề

AI local thường được xem là an toàn hơn AI cloud vì dữ liệu được xử lý trong hạ tầng nội bộ. Nhận định này chỉ đúng một phần. AI local giảm rủi ro gửi dữ liệu ra ngoài, nhưng không tự động bảo vệ khỏi rủi ro nội bộ: người dùng sai quyền, API mở không kiểm soát, log chứa dữ liệu nhạy cảm, chatbot lưu lịch sử không phân quyền, model trả lời vượt phạm vi, hoặc máy chủ AI bị truy cập trái phép.

Do đó, triển khai AI local trong bệnh viện phải dựa trên các nguyên tắc bảo mật rõ ràng, từ kiến trúc hạ tầng đến ứng dụng, dữ liệu, người dùng và quy trình vận hành.

2. Nguyên tắc bảo mật theo lớp

Không nên chỉ dựa vào một lớp bảo vệ. Cần có nhiều lớp:

Mạng nội bộ.
Firewall.
Reverse proxy.
Xác thực người dùng.
Phân quyền ứng dụng.
API trung gian.
Kiểm soát dữ liệu đầu vào.
Kiểm soát dữ liệu đầu ra.
Log và giám sát.
Sao lưu và khôi phục.
Quy chế sử dụng.
Đào tạo người dùng.

Nếu một lớp bị lỗi, các lớp khác vẫn giảm rủi ro.

3. Nguyên tắc không tin cậy mặc định

Không nên mặc định rằng “vì là mạng nội bộ nên an toàn”. Người dùng nội bộ vẫn có thể truy cập sai, copy dữ liệu nhạy cảm, chia sẻ link, hoặc vô tình làm lộ thông tin. API nội bộ nếu không xác thực vẫn có thể bị gọi bởi ứng dụng khác.

Nguyên tắc đúng là: mọi truy cập quan trọng đều phải xác thực, phân quyền và ghi log.

4. Nguyên tắc dữ liệu tối thiểu

AI chỉ nên nhận dữ liệu cần thiết cho tác vụ. Không đưa toàn bộ bệnh án nếu chỉ cần kiểm tra một biểu mẫu. Không đưa danh sách người bệnh nếu chỉ cần số liệu tổng hợp. Không đưa log có token nếu chỉ cần phân tích lỗi.

Dữ liệu ít hơn nghĩa là rủi ro thấp hơn.

5. Nguyên tắc phân quyền theo vai trò

Người dùng khác nhau có quyền khác nhau:

Nhân viên thường.
Điều dưỡng.
Bác sĩ.
Kỹ thuật viên.
Phòng chức năng.
Lãnh đạo khoa.
Lãnh đạo bệnh viện.
Quản trị hệ thống.
Quản trị AI.

AI phải tôn trọng vai trò này, đặc biệt trong RAG và dữ liệu nhạy cảm.

6. Nguyên tắc không mở dịch vụ lõi ra ngoài

Ollama, FAISS, database metadata, hệ thống embedding và các service nội bộ không nên mở trực tiếp ra Internet. Người dùng phải đi qua website, ứng dụng hoặc API trung gian có xác thực.

Đặc biệt, không nên mở cổng Ollama 11434 công khai.

7. Nguyên tắc kiểm soát API

Mọi API AI cần có:

Xác thực.
Phân quyền.
Rate limit.
Kiểm tra input.
Log.
Timeout.
Giới hạn kích thước request.
Giới hạn model được gọi.
Kiểm soát file upload.
Kiểm soát dữ liệu trả về.

Không nên viết API proxy đơn giản chuyển nguyên request người dùng sang Ollama.

8. Nguyên tắc quản lý log

Log cần đủ để truy vết nhưng không được trở thành kho lộ dữ liệu. Cần xác định:

Log gì?
Có lưu prompt không?
Có lưu response không?
Lưu bao lâu?
Ai xem được?
Có mã hóa không?
Có xóa được không?
Có đưa vào backup không?

Với dữ liệu nhạy cảm, có thể chỉ lưu metadata hoặc lưu nội dung đã ẩn danh.

9. Nguyên tắc cập nhật và vá lỗi

Máy chủ AI local cũng là máy chủ phần mềm. Cần:

Cập nhật hệ điều hành.
Cập nhật Docker/container nếu dùng.
Cập nhật Ollama khi cần.
Kiểm tra quyền file.
Theo dõi CVE/phần mềm liên quan.
Không cài gói không rõ nguồn.
Sao lưu cấu hình.
Kiểm tra log truy cập.

10. Nguyên tắc backup và khôi phục

AI local có thể có:

Model.
Modelfile.
FAISS index.
Metadata.
Tài liệu đã xử lý.
Log.
Cấu hình API.
Cấu hình Nginx.
Database ứng dụng.

Cần backup có kiểm soát. Backup cũng có thể chứa dữ liệu nhạy cảm, nên phải phân quyền và bảo vệ.

11. Nguyên tắc đào tạo người dùng

Bảo mật không chỉ là kỹ thuật. Người dùng cần biết:

Không nhập dữ liệu định danh vào chatbot chung.
Không copy bệnh án khi không được phép.
Không tin tuyệt đối câu trả lời AI.
Không chia sẻ response chứa dữ liệu nhạy cảm.
Kiểm tra nguồn trước khi sử dụng.
Báo lỗi khi AI trả lời sai hoặc lộ dữ liệu.

12. Kết luận

Bảo mật AI local trong bệnh viện phải được thiết kế theo nhiều lớp: mạng, API, xác thực, phân quyền, dữ liệu, log, backup, cập nhật và đào tạo người dùng. Local không đồng nghĩa với an toàn tuyệt đối. Một hệ thống AI local an toàn là hệ thống kiểm soát được ai dùng, dùng dữ liệu nào, gọi API nào, trả lời ra sao và có thể truy vết khi xảy ra sự cố.

Đăng nhập để gửi ý kiến