Bài 5. Hạn chế của Ollama trong môi trường bệnh viện

1. Đặt vấn đề

Ollama là công cụ rất hữu ích để bắt đầu AI local, nhưng không phải giải pháp hoàn hảo cho mọi nhu cầu. Trong môi trường bệnh viện, nơi dữ liệu nhạy cảm, yêu cầu bảo mật cao, cần phân quyền phức tạp và có nhiều người dùng, cần hiểu rõ hạn chế của Ollama để triển khai đúng.

Một sai lầm thường gặp là sau khi cài Ollama và chạy model thành công, người triển khai nghĩ rằng hệ thống AI local đã hoàn chỉnh. Thực tế, Ollama chỉ giải quyết lớp vận hành model. Các vấn đề như dữ liệu nội bộ, RAG, phân quyền, bảo mật, ghi log, kiểm soát đầu ra, dashboard, tích hợp phần mềm và đánh giá chất lượng cần được xây dựng thêm.

Bài này phân tích các hạn chế quan trọng của Ollama trong bối cảnh bệnh viện.

2. Ollama không phải hệ thống quản lý người dùng

Ollama không cung cấp đầy đủ cơ chế quản lý người dùng theo kiểu hệ thống bệnh viện cần. Nó không tự phân quyền theo phòng ban, chức danh, nhóm tài liệu hoặc vai trò chuyên môn.

Trong bệnh viện, không thể để mọi người dùng có cùng quyền. Nhân viên hành chính, điều dưỡng, bác sĩ, phòng Quản lý chất lượng, phòng Tài chính, phòng Tổ chức cán bộ và lãnh đạo bệnh viện có phạm vi dữ liệu khác nhau.

Vì vậy, nếu dùng Ollama trực tiếp, bệnh viện thiếu lớp kiểm soát người dùng. Cần có API trung gian hoặc ứng dụng web để xác thực, phân quyền và ghi log.

3. Ollama không tự xây dựng RAG hoàn chỉnh

Ollama có thể chạy LLM và một số model embedding, nhưng không tự động tạo hệ thống RAG hoàn chỉnh cho tài liệu bệnh viện. Muốn hỏi đáp trên kho quy trình, quy định và biểu mẫu, bệnh viện cần xây dựng thêm:

Thu thập tài liệu.
Làm sạch dữ liệu.
Chia chunk.
Tạo embedding.
Lưu FAISS.
Truy xuất tài liệu.
Tạo prompt.
Hiển thị nguồn.
Cập nhật chỉ mục khi tài liệu thay đổi.
Phân quyền tài liệu.

Ollama là thành phần sinh câu trả lời, không phải toàn bộ hệ thống quản lý tri thức.

4. Ollama không tự kiểm soát dữ liệu nhạy cảm

Nếu người dùng gửi dữ liệu người bệnh hoặc tài liệu nhạy cảm vào prompt, Ollama vẫn xử lý như văn bản đầu vào. Nó không tự biết dữ liệu nào bị cấm, dữ liệu nào cần ẩn danh, dữ liệu nào vượt quyền.

Trong bệnh viện, đây là rủi ro lớn. Cần có lớp kiểm soát đầu vào:

Cảnh báo người dùng.
Phát hiện dữ liệu định danh.
Chặn một số loại thông tin.
Yêu cầu ẩn danh.
Ghi log có kiểm soát.
Phân quyền theo loại tác vụ.

Nếu không có lớp này, AI local vẫn có thể bị sử dụng sai dù dữ liệu không rời khỏi bệnh viện.

5. Ollama không tự bảo vệ API theo chuẩn bệnh viện

Nếu mở API Ollama trực tiếp cho mạng LAN hoặc Internet mà không có kiểm soát, hệ thống có thể bị lạm dụng. Người dùng không được xác thực có thể gửi request, dùng tài nguyên GPU hoặc thử khai thác hệ thống.

Ollama không nên được xem là lớp bảo mật cuối cùng. Trong triển khai bệnh viện, cần đặt Ollama sau:

Firewall.
Reverse proxy nếu cần.
API trung gian.
Xác thực.
Phân quyền.
Rate limit.
Log.
Giới hạn IP.

Đặc biệt, không nên mở trực tiếp Ollama ra Internet.

6. Khả năng phục vụ nhiều người dùng có giới hạn

Ollama phù hợp cho giai đoạn thử nghiệm và triển khai quy mô nhỏ đến vừa. Tuy nhiên, nếu bệnh viện có nhiều người dùng đồng thời, nhiều request dài, nhiều tác vụ RAG và model lớn, hệ thống có thể chậm.

Các vấn đề có thể gặp:

GPU quá tải.
VRAM đầy.
Request chờ lâu.
Model trả lời chậm.
Không có hàng đợi tối ưu.
Người dùng phàn nàn về tốc độ.
Tác vụ dài ảnh hưởng người dùng khác.

Khi quy mô lớn, bệnh viện cần thiết kế thêm hàng đợi request, giới hạn độ dài prompt, phân loại model theo tác vụ, tách service embedding, hoặc cân nhắc công cụ phục vụ hiệu năng cao hơn như vLLM trong một số trường hợp.

7. Ollama không tự đánh giá chất lượng câu trả lời

Ollama chỉ chạy model và trả kết quả. Nó không tự biết câu trả lời đúng hay sai, có phù hợp bệnh viện hay không, có trích đúng nguồn hay không. Việc đánh giá cần hệ thống bên ngoài.

Bệnh viện cần xây dựng:

Bộ câu hỏi kiểm thử.
Bộ tiêu chí chấm câu trả lời.
Cơ chế người dùng đánh giá.
Log lỗi.
Kiểm duyệt chuyên môn.
Dashboard chất lượng.
Quy trình cập nhật prompt/model/RAG.

Nếu không đánh giá, bệnh viện có thể bị cuốn theo cảm giác “AI trả lời hay” nhưng không biết mức độ đúng.

8. Ollama không thay thế giao diện người dùng

Dòng lệnh Ollama phù hợp cho người quản trị và thử nghiệm. Nhưng nhân viên bệnh viện cần giao diện web, chatbot, nút chọn tài liệu, hiển thị nguồn, nút sao chép, lịch sử hội thoại và hướng dẫn sử dụng.

Nếu chỉ có terminal, AI không thể triển khai rộng. Vì vậy, cần xây dựng hoặc tích hợp giao diện người dùng phía trên Ollama.

9. Ollama phụ thuộc vào chất lượng model

Ollama không làm cho model yếu trở thành model mạnh. Nếu model được chọn không phù hợp tiếng Việt, quá nhỏ, hallucination nhiều hoặc không phù hợp tác vụ, Ollama vẫn trả kết quả kém.

Do đó, bệnh viện cần đánh giá model độc lập. Không nên nghĩ rằng “cài Ollama” đồng nghĩa với “có AI tốt”. Chất lượng phụ thuộc vào model, prompt, RAG, dữ liệu và cấu hình.

10. Quản lý cập nhật cần thận trọng

Ollama và model có thể được cập nhật. Tuy nhiên, trong môi trường bệnh viện, cập nhật cần có kiểm soát. Một bản cập nhật có thể thay đổi hành vi model, gây lỗi tương thích hoặc ảnh hưởng tốc độ.

Cần có nguyên tắc:

Không cập nhật tùy tiện trên hệ thống chính thức.
Test trên môi trường thử nghiệm.
Ghi lại phiên bản trước và sau.
Có phương án rollback.
Kiểm tra lại bộ câu hỏi chuẩn sau cập nhật.

11. Kết luận

Ollama có nhiều ưu điểm nhưng cũng có hạn chế rõ ràng trong môi trường bệnh viện. Ollama không tự quản lý người dùng, không tự xây dựng RAG hoàn chỉnh, không tự bảo vệ dữ liệu nhạy cảm, không thay thế API bảo mật, không tự đánh giá chất lượng và không phải giao diện người dùng hoàn chỉnh.

Vì vậy, bệnh viện nên dùng Ollama như lớp vận hành model, không xem Ollama là toàn bộ hệ thống AI. Muốn triển khai an toàn và hiệu quả, cần bổ sung API trung gian, phân quyền, log, RAG, giao diện, giám sát, quy chế sử dụng và đánh giá chất lượng.

Đăng nhập để gửi ý kiến