Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 5. Cập nhật model

1. Đặt vấn đề

Model AI không phải thành phần bất biến. Theo thời gian, nhà phát triển có thể phát hành phiên bản mới, cải thiện chất lượng, sửa lỗi, tối ưu tốc độ hoặc thay đổi cách đóng gói. Người quản trị có thể muốn cập nhật model để có kết quả tốt hơn. Tuy nhiên, trong môi trường bệnh viện, cập nhật model không nên làm tùy tiện.

Một model mới có thể tốt hơn ở một số tác vụ nhưng kém hơn ở tác vụ khác. Nó có thể thay đổi văn phong, thay đổi cách trả lời, tăng hoặc giảm mức hallucination, thay đổi tốc độ, yêu cầu thêm dung lượng hoặc tài nguyên. Nếu bệnh viện cập nhật model đang dùng chính thức mà không kiểm tra, chatbot hoặc hệ thống RAG có thể trả lời khác trước, làm người dùng mất tin cậy.

2. Cập nhật model trong Ollama là gì?

Trong thực hành, cập nhật model thường là tải lại phiên bản mới của cùng model/tag hoặc tải một tag mới. Có thể dùng:

 
ollama pull ten_model:tag
 

Nếu model/tag đã có và nguồn có phiên bản mới, lệnh có thể tải bản cập nhật. Tuy nhiên, cách hoạt động cụ thể phụ thuộc hệ thống model và tag.

Trong môi trường bệnh viện, tốt hơn là quản lý cập nhật theo tag rõ ràng thay vì dùng latest.

3. Vì sao không nên cập nhật tùy tiện?

Cập nhật model có thể gây:

  • Câu trả lời khác trước.
  • Tốc độ thay đổi.
  • Tăng VRAM/RAM sử dụng.
  • RAG trả lời khác.
  • Prompt cũ không còn tối ưu.
  • Model mới dùng từ ngữ khác.
  • Model mới kém tiếng Việt hơn trong một số tác vụ.
  • Ứng dụng phụ thuộc model cũ bị lỗi.

Với bệnh viện, thay đổi không kiểm soát có thể ảnh hưởng đến quy trình làm việc và niềm tin của người dùng.

4. Quy trình cập nhật model an toàn

Quy trình đề xuất:

  1. Xác định lý do cập nhật.
  2. Ghi lại phiên bản/model hiện tại.
  3. Tải model mới dưới tag rõ ràng nếu có thể.
  4. Không thay ngay model chính thức.
  5. Test bằng bộ câu hỏi chuẩn.
  6. So sánh chất lượng và tốc độ.
  7. Test với RAG nếu model dùng cho RAG.
  8. Cho nhóm nhỏ dùng thử nếu cần.
  9. Quyết định chuyển chính thức hoặc giữ bản cũ.
  10. Ghi nhật ký thay đổi.
  11. Có phương án rollback.

5. Tạo môi trường thử nghiệm

Nếu hệ thống đang phục vụ người dùng, không nên cập nhật trực tiếp trên model chính. Có thể:

  • Dùng máy chủ thử nghiệm.
  • Dùng model tag khác.
  • Dùng endpoint thử nghiệm.
  • Dùng chatbot nội bộ thử nghiệm.
  • Chỉ cho nhóm CNTT/QLCL test.

Sau khi đạt mới chuyển model chính thức.

6. Kiểm tra sau cập nhật

Cần kiểm tra:

  • ollama list.
  • Model chạy được không.
  • Model có dùng GPU không.
  • VRAM/RAM có tăng không.
  • Tốc độ phản hồi.
  • Chất lượng tiếng Việt.
  • Chất lượng văn bản hành chính.
  • Chất lượng RAG.
  • Khả năng nói không đủ căn cứ.
  • Log có lỗi không.

Không nên chỉ kiểm tra một câu hỏi đơn giản.

7. Cập nhật model embedding

Cập nhật embedding model phức tạp hơn LLM. Nếu đổi embedding model, vector cũ trong FAISS có thể không còn phù hợp. Thường cần tạo lại embedding cho toàn bộ tài liệu và xây lại chỉ mục FAISS.

Vì vậy, không nên đổi embedding model tùy tiện trên hệ thống RAG chính thức. Cần test riêng và có kế hoạch rebuild index.

8. Cập nhật model nền của model tùy biến

Nếu có model tùy biến bằng Modelfile, cần chú ý model nền. Nếu thay model nền, hành vi trợ lý tùy biến có thể thay đổi. Cần test lại toàn bộ prompt và tác vụ.

Ví dụ, trợ lý quản lý chất lượng dựa trên model A có thể trả lời tốt, nhưng khi chuyển sang model B với cùng system prompt, kết quả có thể khác.

9. Ghi nhật ký cập nhật

Mỗi lần cập nhật cần ghi:

  • Ngày cập nhật.
  • Người thực hiện.
  • Model cũ.
  • Model mới.
  • Lý do cập nhật.
  • Kết quả test.
  • Ảnh hưởng đến ứng dụng.
  • Quyết định triển khai.
  • Phương án rollback.

Đây là một phần của quản trị thay đổi.

10. Khi nào nên cập nhật?

Nên cập nhật khi:

  • Model mới cải thiện rõ chất lượng.
  • Model cũ có lỗi nghiêm trọng.
  • Model mới chạy nhanh hơn.
  • Model mới hỗ trợ tiếng Việt tốt hơn.
  • Model mới phù hợp hơn với RAG.
  • Có yêu cầu bảo mật hoặc giấy phép.
  • Có nhu cầu tác vụ mới.

Không nên cập nhật chỉ vì có phiên bản mới.

11. Kết luận

Cập nhật model là cần thiết nhưng phải có kiểm soát. Trong bệnh viện, model đang dùng chính thức không nên bị thay đổi tùy tiện. Mỗi bản cập nhật cần được test bằng bộ câu hỏi thực tế, đánh giá tốc độ, chất lượng, RAG và tài nguyên. Cần ghi nhật ký thay đổi và có phương án rollback. Cập nhật model là một hoạt động quản trị thay đổi, không chỉ là thao tác kỹ thuật.