1. Đặt vấn đề
Khi bệnh viện bắt đầu dùng Modelfile, số lượng model tùy biến có thể tăng nhanh. Ban đầu chỉ có một trợ lý chung. Sau đó có trợ lý hành chính, trợ lý quản lý chất lượng, trợ lý điều dưỡng, trợ lý CNTT, trợ lý pháp luật, trợ lý truyền thông, trợ lý nghiên cứu khoa học, trợ lý đào tạo, trợ lý theo từng khoa phòng. Nếu không có cách quản lý, hệ thống sẽ rối: không biết model nào dùng cho ai, model nào còn thử nghiệm, model nào dựa trên model nền nào, version nào mới nhất, model nào cần xóa, model nào đang được chatbot gọi.
Vì vậy, quản lý nhiều model tùy biến là một phần quan trọng của vận hành AI local trong bệnh viện.
2. Vì sao cần quản lý model tùy biến?
Cần quản lý để:
- Tránh nhầm model.
- Tránh dùng model thử nghiệm cho người dùng thật.
- Tránh xóa nhầm model đang dùng.
- Kiểm soát dung lượng ổ cứng.
- Biết model nào dựa trên model nền nào.
- Theo dõi thay đổi system prompt.
- Đánh giá chất lượng theo từng vai trò.
- Dễ rollback khi model mới lỗi.
- Dễ bàn giao cho nhân sự khác.
- Hỗ trợ audit và truy vết.
Model tùy biến là tài sản cấu hình của bệnh viện, không nên quản lý tùy tiện.
3. Quy ước đặt tên model
Nên có quy ước rõ. Ví dụ:
assistant-hanhchinhassistant-qlclassistant-khthassistant-dieuduongassistant-cnttassistant-phapluatassistant-truyenthongassistant-nckh
Nếu cần version:
assistant-qlcl:v1assistant-qlcl:v2
Tùy Ollama hỗ trợ cách đặt tag/model, bệnh viện nên chọn quy ước nhất quán.
Không nên dùng tên:
testnewabcmodel1qlcl-final-finalqwen-copy
Tên kém rõ sẽ gây lỗi vận hành.
4. Quản lý file Modelfile
Nên lưu Modelfile trong thư mục có cấu trúc:
/opt/ai-modelfiles/README.mdhanhchinh/Modelfilechangelog.mdqlcl/Modelfilechangelog.mdkhth/Modelfilechangelog.mddieuduong/Modelfilechangelog.mdcntt/Modelfilechangelog.mdphapluat/Modelfilechangelog.md
Mỗi Modelfile nên có tài liệu đi kèm:
- Mục đích.
- Người phụ trách.
- Model nền.
- Ngày tạo.
- Ngày cập nhật.
- Thay đổi chính.
- Bộ câu hỏi test.
- Trạng thái: thử nghiệm/chính thức/ngưng dùng.
5. Dùng quản lý phiên bản
Nếu có thể, nên dùng Git nội bộ để quản lý Modelfile. Điều này giúp:
- Theo dõi thay đổi system prompt.
- Biết ai sửa.
- Khôi phục phiên bản cũ.
- So sánh prompt trước và sau.
- Quản lý nhiều nhánh thử nghiệm.
Không nên chỉnh Modelfile trực tiếp trên máy chủ mà không lưu lịch sử.
6. Danh mục model tùy biến
Bệnh viện nên có bảng danh mục:
| Model tùy biến | Model nền | Phòng ban | Trạng thái | Version | Người phụ trách |
|---|---|---|---|---|---|
| assistant-qlcl | qwen2.5:7b | QLCL | Chính thức | v1.0 | Phòng QLCL + CNTT |
| assistant-khth | qwen2.5:7b | KHTH | Thử nghiệm | v0.3 | KHTH |
| assistant-cntt | qwen2.5:7b | CNTT | Chính thức | v1.0 | CNTT |
Danh mục này cần cập nhật khi tạo, sửa, xóa hoặc thay model.
7. Phân biệt model nền và model tùy biến
Nhiều model tùy biến có thể dùng chung một model nền. Ví dụ:
assistant-qlcldùngqwen2.5:7bassistant-khthdùngqwen2.5:7bassistant-dieuduongdùngqwen2.5:7b
Nếu thay model nền, cần test lại tất cả model tùy biến liên quan. Không nên nghĩ rằng chỉ đổi FROM là xong. Hành vi có thể thay đổi rất nhiều.
8. Phân loại trạng thái model
Nên có trạng thái:
8.1. Thử nghiệm
Chỉ nhóm nhỏ dùng, chưa chính thức.
8.2. Ứng viên
Đã test tốt, đang chờ phê duyệt hoặc dùng thử.
8.3. Chính thức
Đang dùng trong ứng dụng nội bộ.
8.4. Tạm ngưng
Không dùng hiện tại nhưng giữ để rollback.
8.5. Loại bỏ
Không còn dùng, có thể xóa sau khi backup cấu hình.
9. Quy trình tạo model tùy biến mới
Quy trình nên gồm:
- Xác định nhu cầu phòng ban.
- Chọn model nền.
- Viết Modelfile.
- Tạo model thử nghiệm.
- Test bằng bộ câu hỏi chuẩn.
- Điều chỉnh system prompt và tham số.
- Cho nhóm nhỏ dùng thử.
- Đánh giá phản hồi.
- Phê duyệt đưa vào chính thức.
- Cập nhật danh mục model.
Không nên tạo model mới rồi mở cho toàn bộ người dùng ngay.
10. Quy trình chỉnh sửa model tùy biến
Khi chỉnh system prompt hoặc tham số:
- Sao lưu Modelfile cũ.
- Ghi lý do chỉnh.
- Tạo version mới.
- Test lại.
- So sánh với version cũ.
- Cập nhật ứng dụng nếu dùng model mới.
- Theo dõi lỗi.
- Có rollback.
Đây là quản trị thay đổi.
11. Phân quyền sử dụng model
Không phải ai cũng cần dùng mọi trợ lý. Ví dụ:
- Trợ lý CNTT chỉ dành cho phòng CNTT.
- Trợ lý pháp luật dành cho nhóm được phân quyền.
- Trợ lý QLCL dành cho phòng QLCL và khoa phòng liên quan.
- Trợ lý chung dành cho nhân viên.
Phân quyền thường thực hiện ở lớp ứng dụng hoặc API trung gian, không phải trực tiếp trong Ollama.
12. Theo dõi hiệu quả từng model
Cần theo dõi:
- Số lượt dùng.
- Nhóm người dùng.
- Tỷ lệ phản hồi tốt/xấu.
- Lỗi thường gặp.
- Thời gian phản hồi.
- Tác vụ hay dùng.
- Câu hỏi không trả lời được.
- Phản hồi chuyên môn.
Dựa vào đó, bệnh viện cải tiến Modelfile hoặc thay model nền.
13. Dọn dẹp model cũ
Theo định kỳ, cần xem:
ollama listvà đối chiếu danh mục. Model cũ không dùng nên xóa sau khi chắc chắn không ảnh hưởng ứng dụng.
Trước khi xóa, giữ lại:
- Modelfile.
- Changelog.
- Kết quả test.
- Ghi chú lý do ngưng dùng.
14. Kết luận
Khi bệnh viện dùng nhiều model tùy biến, quản lý model trở thành một phần của vận hành hệ thống AI local. Cần có quy ước đặt tên, thư mục lưu Modelfile, danh mục model, trạng thái sử dụng, quy trình tạo mới, quy trình chỉnh sửa, phân quyền, đánh giá và dọn dẹp. Làm tốt nội dung này giúp hệ thống AI local không bị rối, dễ mở rộng và an toàn hơn khi phục vụ nhiều phòng ban trong bệnh viện.
- Đăng nhập để gửi ý kiến