Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 6. Cập nhật Ollama an toàn

1. Đặt vấn đề

Ollama và các thành phần liên quan có thể được cập nhật để sửa lỗi, cải thiện hiệu năng, hỗ trợ model mới hoặc vá bảo mật. Tuy nhiên, cập nhật trên hệ thống đang phục vụ người dùng luôn có rủi ro: service không khởi động lại, model không tương thích, API thay đổi, hiệu năng giảm, cấu hình bị mất hoặc chatbot hoạt động khác trước.

Vì vậy, cập nhật Ollama trong bệnh viện cần có quy trình an toàn, không nên cập nhật tùy tiện trong giờ cao điểm.

2. Khi nào cần cập nhật?

Có thể cập nhật khi:

  • Có lỗi cần sửa.
  • Có bản vá bảo mật.
  • Cần hỗ trợ model mới.
  • Cải thiện hiệu năng rõ ràng.
  • Phiên bản hiện tại có lỗi ổn định.
  • Có yêu cầu từ hệ thống tích hợp.

Không nhất thiết cập nhật ngay mọi phiên bản mới nếu hệ thống đang ổn định.

3. Nguyên tắc trước khi cập nhật

Trước khi cập nhật cần:

  • Ghi lại phiên bản hiện tại.
  • Backup cấu hình.
  • Backup Modelfile.
  • Backup danh sách model.
  • Backup RAG nếu liên quan.
  • Kiểm tra dung lượng ổ cứng.
  • Thông báo người dùng nếu có gián đoạn.
  • Chọn thời điểm ít sử dụng.
  • Có phương án rollback.

4. Kiểm tra phiên bản hiện tại

Tùy cách cài, có thể kiểm tra:

 
ollama --version
 

Hoặc ghi nhận thông tin package/service. Cần lưu vào nhật ký vận hành.

5. Backup trước cập nhật

Nên lưu:

 
ollama list > /mnt/backup/ollama_models_before_update.txt
 

Backup Modelfile và cấu hình API. Nếu hệ thống RAG phụ thuộc model embedding hoặc model chat, cần ghi rõ model/digest.

6. Cập nhật trên môi trường test trước

Nếu có máy test hoặc môi trường staging, nên cập nhật trước trên đó:

  • Cài phiên bản mới.
  • Load model.
  • Chạy câu hỏi mẫu.
  • Test RAG.
  • Test API trung gian.
  • Test đồng thời.
  • Kiểm tra GPU.

Nếu không có staging, cần càng thận trọng trên production.

7. Cập nhật trong thời gian bảo trì

Không nên cập nhật khi:

  • Giờ hành chính cao điểm.
  • Đang tự đánh giá chất lượng.
  • Đang có đợt đào tạo sử dụng AI.
  • Đang chạy batch quan trọng.
  • Đang rebuild index.

Nên chọn giờ ít người dùng và có người trực kiểm tra.

8. Kiểm tra sau cập nhật

Sau cập nhật:

 
systemctl status ollama
ollama --version
ollama list
ollama ps
nvidia-smi
curl http://127.0.0.1:11434/api/tags
 

Sau đó test:

  • Chat thường.
  • Chat RAG.
  • Model tùy biến.
  • Embedding nếu có.
  • API trung gian.
  • Giao diện web.
  • Một vài prompt chuẩn.

9. So sánh chất lượng sau cập nhật

Cập nhật có thể làm thay đổi hành vi. Cần chạy bộ câu hỏi smoke test:

  • Tra cứu quy trình.
  • Tạo bảng kiểm.
  • Viết báo cáo.
  • Từ chối câu hỏi chuyên môn vượt quyền.
  • RAG có nguồn.

Nếu chất lượng giảm, cần rollback hoặc điều chỉnh prompt/config.

10. Rollback

Phải có phương án rollback:

  • Cài lại phiên bản cũ nếu có package.
  • Khôi phục cấu hình.
  • Khôi phục model/custom model nếu lỗi.
  • Khôi phục service.
  • Tạm chuyển về model khác nếu model lỗi.

Không nên cập nhật nếu chưa biết cách quay lại trạng thái cũ.

11. Ghi nhật ký cập nhật

Cần ghi:

  • Ngày giờ.
  • Người thực hiện.
  • Phiên bản trước.
  • Phiên bản sau.
  • Lý do cập nhật.
  • Backup đã thực hiện.
  • Kết quả test.
  • Lỗi phát sinh.
  • Quyết định tiếp tục/rollback.

Đây là tài liệu vận hành quan trọng.

12. Kết luận

Cập nhật Ollama cần được quản trị như cập nhật một dịch vụ sản xuất. Cần backup, test, chọn thời điểm phù hợp, kiểm tra sau cập nhật, có phương án rollback và ghi nhật ký. Trong bệnh viện, ổn định và an toàn quan trọng hơn việc luôn chạy phiên bản mới nhất.