Bài 9. Thiết lập model mặc định cho từng nhóm người dùng

1. Đặt vấn đề

Khi hệ thống AI local phát triển, bệnh viện có thể có nhiều model phục vụ nhiều mục đích khác nhau. Một model dùng cho soạn thảo văn bản hành chính, một model dùng cho quản lý chất lượng, một model dùng cho CNTT, một model dùng cho RAG, một model dùng cho embedding, một model dùng cho thử nghiệm. Nếu để người dùng tự chọn model, họ có thể chọn sai, làm câu trả lời kém, chậm hoặc vượt phạm vi.

Vì vậy, cần thiết lập model mặc định cho từng nhóm người dùng hoặc từng ứng dụng. Đây là bước quan trọng để đưa AI local vào vận hành ổn định.

2. Vì sao cần model mặc định?

Model mặc định giúp:

Người dùng không phải hiểu kỹ thuật model.
Tránh chọn sai model.
Đảm bảo chất lượng ổn định.
Tối ưu tài nguyên.
Phân quyền theo mục đích.
Giảm rủi ro dùng model thử nghiệm.
Dễ kiểm soát log và đánh giá.
Dễ đào tạo người dùng.

Trong bệnh viện, nhân viên cần công cụ dễ dùng, không cần biết model nào là 7B, 14B, embedding hay reranker. Hệ thống nên chọn model phù hợp phía sau.

3. Model mặc định theo nhóm người dùng

Có thể thiết lập theo nhóm:

3.1. Lãnh đạo bệnh viện

Model ưu tiên tóm tắt, phân tích quản trị, trình bày ngắn gọn, cấu trúc rõ, hỗ trợ quyết định ở mức tham khảo.

3.2. Phòng Quản lý chất lượng

Model ưu tiên bảng kiểm, kế hoạch cải tiến, phân tích nguyên nhân, tiêu chí chất lượng, RAG tài liệu QLCL.

3.3. Phòng Kế hoạch tổng hợp

Model ưu tiên báo cáo, kế hoạch, tổng hợp biên bản, văn bản điều hành.

3.4. Phòng Điều dưỡng

Model ưu tiên quy trình chăm sóc, bảng kiểm điều dưỡng, đào tạo, hướng dẫn thực hành.

3.5. Phòng Công nghệ thông tin

Model ưu tiên hướng dẫn kỹ thuật, script, xử lý lỗi, tài liệu người dùng.

3.6. Nhân viên chung

Model ưu tiên chatbot tra cứu quy trình, biểu mẫu và hướng dẫn nội bộ.

3.7. Nhóm thử nghiệm

Có thể được quyền chọn model thử nghiệm, nhưng không ảnh hưởng hệ thống chính thức.

4. Model mặc định theo ứng dụng

Ngoài nhóm người dùng, có thể thiết lập theo ứng dụng:

Chatbot nội bộ: model nhanh, ổn định.
Trợ lý QLCL: model tùy biến QLCL.
Công cụ viết văn bản dài: model chất lượng cao hơn.
Công cụ phân loại phản ánh: model nhanh, temperature thấp.
RAG văn bản pháp luật: model bám nguồn, thận trọng.
Embedding service: embedding model riêng.
Reranking service: reranker riêng.

Cách này thực tế hơn vì cùng một người dùng có thể dùng nhiều ứng dụng khác nhau.

5. Không để người dùng phổ thông chọn model kỹ thuật

Người dùng phổ thông không nên phải chọn giữa qwen2.5:7b, gemma3:4b, llama3.1:8b. Họ nên chọn mục đích:

Viết văn bản.
Tra cứu quy trình.
Tạo bảng kiểm.
Tóm tắt tài liệu.
Hỏi QLCL.
Hỏi CNTT.

Hệ thống sẽ gọi model phù hợp phía sau.

6. Thiết lập ở đâu?

Ollama không tự quản lý người dùng theo nhóm. Việc thiết lập model mặc định thường nằm ở lớp ứng dụng hoặc API trung gian.

Ví dụ:

Trong file cấu hình API.
Trong database người dùng.
Trong Drupal role.
Trong module chatbot.
Trong route API theo tác vụ.
Trong cấu hình từng trợ lý.

Ví dụ logic:

Nếu user role là qlcl, dùng model qlcl-assistant.
Nếu tác vụ là embedding, dùng model embedding.
Nếu tác vụ là legal_rag, dùng model pháp luật.
Nếu tác vụ là drafting, dùng model viết văn bản.

7. Kết hợp với Modelfile

Chương sau sẽ nói kỹ về Modelfile. Nhưng về nguyên tắc, có thể tạo model tùy biến cho từng nhóm:

assistant-hanhchinh
assistant-qlcl
assistant-dieuduong
assistant-cntt
assistant-phapluat

Sau đó ứng dụng chọn model tương ứng làm mặc định.

8. Quản lý model thử nghiệm và model chính thức

Cần phân biệt:

Model chính thức: dùng cho người dùng thật.
Model thử nghiệm: chỉ nhóm kỹ thuật hoặc nhóm đánh giá dùng.
Model cũ: giữ để rollback.
Model không dùng: xóa.

Không nên để model thử nghiệm xuất hiện trong giao diện người dùng chung.

9. Theo dõi hiệu quả từng model mặc định

Sau khi thiết lập, cần theo dõi:

Nhóm nào dùng nhiều nhất.
Model nào chậm.
Model nào bị phản hồi kém.
Tác vụ nào hay lỗi.
Model nào cần thay.
Model nào tiêu tốn nhiều tài nguyên.

Dữ liệu này giúp cải tiến lựa chọn model.

10. Quy trình thay đổi model mặc định

Khi muốn đổi model mặc định cho nhóm người dùng, cần:

Test model mới.
So sánh với model cũ.
Thông báo nhóm liên quan nếu thay đổi lớn.
Cập nhật cấu hình API/ứng dụng.
Theo dõi lỗi sau khi đổi.
Có phương án rollback.
Ghi nhật ký thay đổi.

Không nên đổi model mặc định tùy tiện vì sẽ làm trải nghiệm người dùng không ổn định.

11. Kết luận

Thiết lập model mặc định cho từng nhóm người dùng hoặc từng ứng dụng giúp hệ thống AI local bệnh viện ổn định, dễ dùng và an toàn hơn. Người dùng không cần hiểu kỹ thuật model; hệ thống tự chọn model phù hợp theo vai trò và tác vụ. Việc này nên được thực hiện ở lớp API trung gian hoặc ứng dụng, kết hợp với phân quyền, Modelfile, log và quy trình quản trị thay đổi.

Đăng nhập để gửi ý kiến