1. Đặt vấn đề
Model AI không phải thành phần bất biến. Theo thời gian, nhà phát triển có thể phát hành phiên bản mới, cải thiện chất lượng, sửa lỗi, tối ưu tốc độ hoặc thay đổi cách đóng gói. Người quản trị có thể muốn cập nhật model để có kết quả tốt hơn. Tuy nhiên, trong môi trường bệnh viện, cập nhật model không nên làm tùy tiện.
Một model mới có thể tốt hơn ở một số tác vụ nhưng kém hơn ở tác vụ khác. Nó có thể thay đổi văn phong, thay đổi cách trả lời, tăng hoặc giảm mức hallucination, thay đổi tốc độ, yêu cầu thêm dung lượng hoặc tài nguyên. Nếu bệnh viện cập nhật model đang dùng chính thức mà không kiểm tra, chatbot hoặc hệ thống RAG có thể trả lời khác trước, làm người dùng mất tin cậy.
2. Cập nhật model trong Ollama là gì?
Trong thực hành, cập nhật model thường là tải lại phiên bản mới của cùng model/tag hoặc tải một tag mới. Có thể dùng:
ollama pull ten_model:tagNếu model/tag đã có và nguồn có phiên bản mới, lệnh có thể tải bản cập nhật. Tuy nhiên, cách hoạt động cụ thể phụ thuộc hệ thống model và tag.
Trong môi trường bệnh viện, tốt hơn là quản lý cập nhật theo tag rõ ràng thay vì dùng latest.
3. Vì sao không nên cập nhật tùy tiện?
Cập nhật model có thể gây:
- Câu trả lời khác trước.
- Tốc độ thay đổi.
- Tăng VRAM/RAM sử dụng.
- RAG trả lời khác.
- Prompt cũ không còn tối ưu.
- Model mới dùng từ ngữ khác.
- Model mới kém tiếng Việt hơn trong một số tác vụ.
- Ứng dụng phụ thuộc model cũ bị lỗi.
Với bệnh viện, thay đổi không kiểm soát có thể ảnh hưởng đến quy trình làm việc và niềm tin của người dùng.
4. Quy trình cập nhật model an toàn
Quy trình đề xuất:
- Xác định lý do cập nhật.
- Ghi lại phiên bản/model hiện tại.
- Tải model mới dưới tag rõ ràng nếu có thể.
- Không thay ngay model chính thức.
- Test bằng bộ câu hỏi chuẩn.
- So sánh chất lượng và tốc độ.
- Test với RAG nếu model dùng cho RAG.
- Cho nhóm nhỏ dùng thử nếu cần.
- Quyết định chuyển chính thức hoặc giữ bản cũ.
- Ghi nhật ký thay đổi.
- Có phương án rollback.
5. Tạo môi trường thử nghiệm
Nếu hệ thống đang phục vụ người dùng, không nên cập nhật trực tiếp trên model chính. Có thể:
- Dùng máy chủ thử nghiệm.
- Dùng model tag khác.
- Dùng endpoint thử nghiệm.
- Dùng chatbot nội bộ thử nghiệm.
- Chỉ cho nhóm CNTT/QLCL test.
Sau khi đạt mới chuyển model chính thức.
6. Kiểm tra sau cập nhật
Cần kiểm tra:
ollama list.- Model chạy được không.
- Model có dùng GPU không.
- VRAM/RAM có tăng không.
- Tốc độ phản hồi.
- Chất lượng tiếng Việt.
- Chất lượng văn bản hành chính.
- Chất lượng RAG.
- Khả năng nói không đủ căn cứ.
- Log có lỗi không.
Không nên chỉ kiểm tra một câu hỏi đơn giản.
7. Cập nhật model embedding
Cập nhật embedding model phức tạp hơn LLM. Nếu đổi embedding model, vector cũ trong FAISS có thể không còn phù hợp. Thường cần tạo lại embedding cho toàn bộ tài liệu và xây lại chỉ mục FAISS.
Vì vậy, không nên đổi embedding model tùy tiện trên hệ thống RAG chính thức. Cần test riêng và có kế hoạch rebuild index.
8. Cập nhật model nền của model tùy biến
Nếu có model tùy biến bằng Modelfile, cần chú ý model nền. Nếu thay model nền, hành vi trợ lý tùy biến có thể thay đổi. Cần test lại toàn bộ prompt và tác vụ.
Ví dụ, trợ lý quản lý chất lượng dựa trên model A có thể trả lời tốt, nhưng khi chuyển sang model B với cùng system prompt, kết quả có thể khác.
9. Ghi nhật ký cập nhật
Mỗi lần cập nhật cần ghi:
- Ngày cập nhật.
- Người thực hiện.
- Model cũ.
- Model mới.
- Lý do cập nhật.
- Kết quả test.
- Ảnh hưởng đến ứng dụng.
- Quyết định triển khai.
- Phương án rollback.
Đây là một phần của quản trị thay đổi.
10. Khi nào nên cập nhật?
Nên cập nhật khi:
- Model mới cải thiện rõ chất lượng.
- Model cũ có lỗi nghiêm trọng.
- Model mới chạy nhanh hơn.
- Model mới hỗ trợ tiếng Việt tốt hơn.
- Model mới phù hợp hơn với RAG.
- Có yêu cầu bảo mật hoặc giấy phép.
- Có nhu cầu tác vụ mới.
Không nên cập nhật chỉ vì có phiên bản mới.
11. Kết luận
Cập nhật model là cần thiết nhưng phải có kiểm soát. Trong bệnh viện, model đang dùng chính thức không nên bị thay đổi tùy tiện. Mỗi bản cập nhật cần được test bằng bộ câu hỏi thực tế, đánh giá tốc độ, chất lượng, RAG và tài nguyên. Cần ghi nhật ký thay đổi và có phương án rollback. Cập nhật model là một hoạt động quản trị thay đổi, không chỉ là thao tác kỹ thuật.
- Đăng nhập để gửi ý kiến