Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 11. Quản lý nhiều model tùy biến trong cùng một bệnh viện

1. Đặt vấn đề

Khi bệnh viện bắt đầu dùng Modelfile, số lượng model tùy biến có thể tăng nhanh. Ban đầu chỉ có một trợ lý chung. Sau đó có trợ lý hành chính, trợ lý quản lý chất lượng, trợ lý điều dưỡng, trợ lý CNTT, trợ lý pháp luật, trợ lý truyền thông, trợ lý nghiên cứu khoa học, trợ lý đào tạo, trợ lý theo từng khoa phòng. Nếu không có cách quản lý, hệ thống sẽ rối: không biết model nào dùng cho ai, model nào còn thử nghiệm, model nào dựa trên model nền nào, version nào mới nhất, model nào cần xóa, model nào đang được chatbot gọi.

Vì vậy, quản lý nhiều model tùy biến là một phần quan trọng của vận hành AI local trong bệnh viện.

2. Vì sao cần quản lý model tùy biến?

Cần quản lý để:

  • Tránh nhầm model.
  • Tránh dùng model thử nghiệm cho người dùng thật.
  • Tránh xóa nhầm model đang dùng.
  • Kiểm soát dung lượng ổ cứng.
  • Biết model nào dựa trên model nền nào.
  • Theo dõi thay đổi system prompt.
  • Đánh giá chất lượng theo từng vai trò.
  • Dễ rollback khi model mới lỗi.
  • Dễ bàn giao cho nhân sự khác.
  • Hỗ trợ audit và truy vết.

Model tùy biến là tài sản cấu hình của bệnh viện, không nên quản lý tùy tiện.

3. Quy ước đặt tên model

Nên có quy ước rõ. Ví dụ:

 
assistant-hanhchinh
assistant-qlcl
assistant-khth
assistant-dieuduong
assistant-cntt
assistant-phapluat
assistant-truyenthong
assistant-nckh
 

Nếu cần version:

 
assistant-qlcl:v1
assistant-qlcl:v2
 

Tùy Ollama hỗ trợ cách đặt tag/model, bệnh viện nên chọn quy ước nhất quán.

Không nên dùng tên:

  • test
  • new
  • abc
  • model1
  • qlcl-final-final
  • qwen-copy

Tên kém rõ sẽ gây lỗi vận hành.

4. Quản lý file Modelfile

Nên lưu Modelfile trong thư mục có cấu trúc:

 
/opt/ai-modelfiles/
README.md
hanhchinh/
Modelfile
changelog.md
qlcl/
Modelfile
changelog.md
khth/
Modelfile
changelog.md
dieuduong/
Modelfile
changelog.md
cntt/
Modelfile
changelog.md
phapluat/
Modelfile
changelog.md
 

Mỗi Modelfile nên có tài liệu đi kèm:

  • Mục đích.
  • Người phụ trách.
  • Model nền.
  • Ngày tạo.
  • Ngày cập nhật.
  • Thay đổi chính.
  • Bộ câu hỏi test.
  • Trạng thái: thử nghiệm/chính thức/ngưng dùng.

5. Dùng quản lý phiên bản

Nếu có thể, nên dùng Git nội bộ để quản lý Modelfile. Điều này giúp:

  • Theo dõi thay đổi system prompt.
  • Biết ai sửa.
  • Khôi phục phiên bản cũ.
  • So sánh prompt trước và sau.
  • Quản lý nhiều nhánh thử nghiệm.

Không nên chỉnh Modelfile trực tiếp trên máy chủ mà không lưu lịch sử.

6. Danh mục model tùy biến

Bệnh viện nên có bảng danh mục:

Model tùy biếnModel nềnPhòng banTrạng tháiVersionNgười phụ trách
assistant-qlclqwen2.5:7bQLCLChính thứcv1.0Phòng QLCL + CNTT
assistant-khthqwen2.5:7bKHTHThử nghiệmv0.3KHTH
assistant-cnttqwen2.5:7bCNTTChính thứcv1.0CNTT

Danh mục này cần cập nhật khi tạo, sửa, xóa hoặc thay model.

7. Phân biệt model nền và model tùy biến

Nhiều model tùy biến có thể dùng chung một model nền. Ví dụ:

  • assistant-qlcl dùng qwen2.5:7b
  • assistant-khth dùng qwen2.5:7b
  • assistant-dieuduong dùng qwen2.5:7b

Nếu thay model nền, cần test lại tất cả model tùy biến liên quan. Không nên nghĩ rằng chỉ đổi FROM là xong. Hành vi có thể thay đổi rất nhiều.

8. Phân loại trạng thái model

Nên có trạng thái:

8.1. Thử nghiệm

Chỉ nhóm nhỏ dùng, chưa chính thức.

8.2. Ứng viên

Đã test tốt, đang chờ phê duyệt hoặc dùng thử.

8.3. Chính thức

Đang dùng trong ứng dụng nội bộ.

8.4. Tạm ngưng

Không dùng hiện tại nhưng giữ để rollback.

8.5. Loại bỏ

Không còn dùng, có thể xóa sau khi backup cấu hình.

9. Quy trình tạo model tùy biến mới

Quy trình nên gồm:

  1. Xác định nhu cầu phòng ban.
  2. Chọn model nền.
  3. Viết Modelfile.
  4. Tạo model thử nghiệm.
  5. Test bằng bộ câu hỏi chuẩn.
  6. Điều chỉnh system prompt và tham số.
  7. Cho nhóm nhỏ dùng thử.
  8. Đánh giá phản hồi.
  9. Phê duyệt đưa vào chính thức.
  10. Cập nhật danh mục model.

Không nên tạo model mới rồi mở cho toàn bộ người dùng ngay.

10. Quy trình chỉnh sửa model tùy biến

Khi chỉnh system prompt hoặc tham số:

  1. Sao lưu Modelfile cũ.
  2. Ghi lý do chỉnh.
  3. Tạo version mới.
  4. Test lại.
  5. So sánh với version cũ.
  6. Cập nhật ứng dụng nếu dùng model mới.
  7. Theo dõi lỗi.
  8. Có rollback.

Đây là quản trị thay đổi.

11. Phân quyền sử dụng model

Không phải ai cũng cần dùng mọi trợ lý. Ví dụ:

  • Trợ lý CNTT chỉ dành cho phòng CNTT.
  • Trợ lý pháp luật dành cho nhóm được phân quyền.
  • Trợ lý QLCL dành cho phòng QLCL và khoa phòng liên quan.
  • Trợ lý chung dành cho nhân viên.

Phân quyền thường thực hiện ở lớp ứng dụng hoặc API trung gian, không phải trực tiếp trong Ollama.

12. Theo dõi hiệu quả từng model

Cần theo dõi:

  • Số lượt dùng.
  • Nhóm người dùng.
  • Tỷ lệ phản hồi tốt/xấu.
  • Lỗi thường gặp.
  • Thời gian phản hồi.
  • Tác vụ hay dùng.
  • Câu hỏi không trả lời được.
  • Phản hồi chuyên môn.

Dựa vào đó, bệnh viện cải tiến Modelfile hoặc thay model nền.

13. Dọn dẹp model cũ

Theo định kỳ, cần xem:

 
ollama list
 

và đối chiếu danh mục. Model cũ không dùng nên xóa sau khi chắc chắn không ảnh hưởng ứng dụng.

Trước khi xóa, giữ lại:

  • Modelfile.
  • Changelog.
  • Kết quả test.
  • Ghi chú lý do ngưng dùng.

14. Kết luận

Khi bệnh viện dùng nhiều model tùy biến, quản lý model trở thành một phần của vận hành hệ thống AI local. Cần có quy ước đặt tên, thư mục lưu Modelfile, danh mục model, trạng thái sử dụng, quy trình tạo mới, quy trình chỉnh sửa, phân quyền, đánh giá và dọn dẹp. Làm tốt nội dung này giúp hệ thống AI local không bị rối, dễ mở rộng và an toàn hơn khi phục vụ nhiều phòng ban trong bệnh viện.