Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 7. Nhóm chỉ số về an toàn thông tin

1. Đặt vấn đề

Trong bệnh viện, hiệu quả AI local không thể tách khỏi an toàn thông tin. Một hệ thống giúp tiết kiệm nhiều thời gian nhưng làm lộ dữ liệu người bệnh, lưu bệnh án trong log, trả lời vượt quyền hoặc mở cổng Ollama ra Internet thì không thể xem là hiệu quả. Vì vậy, nhóm chỉ số về an toàn thông tin cần được đánh giá song song với chỉ số sử dụng và hiệu quả công việc.

An toàn thông tin là điều kiện để AI local được tin cậy và mở rộng.

2. Chỉ số truy cập hợp lệ

Cần theo dõi:

  • Số lượt đăng nhập thành công.
  • Số lượt đăng nhập thất bại.
  • Số request API hợp lệ.
  • Số request bị từ chối do không xác thực.
  • Số request bị từ chối do không đủ quyền.
  • Số lần truy cập từ IP lạ.
  • Số lần token/API key lỗi.

Nếu có nhiều request bị từ chối, cần xem có cấu hình sai hoặc truy cập bất thường không.

3. Chỉ số phân quyền

Cần kiểm tra:

  • Người dùng có truy cập đúng chatbot được phép không?
  • Có truy xuất tài liệu vượt quyền không?
  • RAG có lọc tài liệu theo role không?
  • Khoa/phòng có xem nhầm dữ liệu của nhau không?
  • Admin kỹ thuật có xem nội dung nhạy cảm không cần thiết không?
  • Quyền người dùng nghỉ việc có bị thu hồi không?

Có thể thực hiện kiểm thử phân quyền định kỳ.

4. Chỉ số dữ liệu nhạy cảm trong input

Cần theo dõi:

  • Số lần người dùng nhập thông tin định danh.
  • Số lần người dùng nhập bệnh án/kết quả xét nghiệm.
  • Số file upload chứa dữ liệu nhạy cảm.
  • Số request bị cảnh báo hoặc chặn.
  • Nhóm người dùng thường nhập sai dữ liệu.
  • Loại dữ liệu nhạy cảm thường gặp.

Chỉ số này giúp đào tạo lại người dùng và cải thiện bộ lọc input.

5. Chỉ số dữ liệu nhạy cảm trong output

Cần theo dõi:

  • Số câu trả lời chứa thông tin định danh.
  • Số câu trả lời bị chặn/che dữ liệu.
  • Số lỗi trả dữ liệu vượt quyền.
  • Số phản hồi của người dùng về lộ dữ liệu.
  • Số response cần xóa khỏi lịch sử.

Nếu xuất hiện lỗi lộ dữ liệu, cần xử lý như sự cố an toàn thông tin.

6. Chỉ số log an toàn

Cần kiểm tra:

  • Log có chứa prompt nhạy cảm không?
  • Log có chứa response nhạy cảm không?
  • Log có chứa token/private key không?
  • Quyền đọc log có đúng không?
  • Log có được xoay và xóa theo chính sách không?
  • Log có được backup an toàn không?
  • Có ai truy cập log bất thường không?

Log là nơi dễ bị bỏ quên nhưng có rủi ro cao.

7. Chỉ số bảo vệ API

Cần theo dõi:

  • Cổng Ollama có bị mở ra ngoài không?
  • API có xác thực không?
  • Có rate limit không?
  • Có request vượt giới hạn không?
  • Có request quá dài bị chặn không?
  • Có endpoint quản trị bị truy cập trái phép không?
  • Có lỗi 401/403/429 bất thường không?

Đây là nhóm chỉ số kỹ thuật quan trọng.

8. Chỉ số sự cố an toàn thông tin

Cần thống kê:

  • Số sự cố bảo mật liên quan AI.
  • Mức độ nghiêm trọng.
  • Thời gian phát hiện.
  • Thời gian khắc phục.
  • Nguyên nhân.
  • Biện pháp phòng ngừa tái diễn.
  • Số người bị ảnh hưởng nếu có.
  • Dữ liệu bị ảnh hưởng nếu có.

Không có sự cố là mục tiêu, nhưng cũng cần có khả năng phát hiện và xử lý.

9. Chỉ số đào tạo an toàn AI

Cần đo:

  • Số người đã được đào tạo.
  • Tỷ lệ hoàn thành đào tạo.
  • Điểm kiểm tra sau đào tạo.
  • Tỷ lệ người dùng hiểu không nhập dữ liệu nhạy cảm.
  • Tỷ lệ người dùng biết kiểm tra nguồn.
  • Tỷ lệ người dùng biết báo lỗi/lộ dữ liệu.

An toàn phụ thuộc rất nhiều vào hành vi người dùng.

10. Chỉ số kiểm tra định kỳ

Có thể thực hiện:

  • Kiểm tra port mở.
  • Kiểm tra phân quyền RAG.
  • Kiểm tra log.
  • Kiểm tra backup chứa dữ liệu nhạy cảm.
  • Kiểm tra tài khoản không còn sử dụng.
  • Kiểm tra API key.
  • Kiểm tra file upload tồn đọng.
  • Kiểm tra lịch sử hội thoại nhạy cảm.

Kết quả kiểm tra cần ghi nhận.

11. Kết luận

An toàn thông tin là nhóm chỉ số bắt buộc khi đánh giá AI local trong bệnh viện. Cần đo truy cập hợp lệ, phân quyền, dữ liệu nhạy cảm trong input/output, log, API, sự cố, đào tạo và kiểm tra định kỳ. AI local chỉ có thể mở rộng khi bệnh viện chứng minh được hệ thống không chỉ hữu ích mà còn an toàn, có kiểm soát và truy vết được.