1. Đặt vấn đề
Ollama là thành phần trung tâm để chạy model AI local. Nếu dịch vụ Ollama không chạy, chatbot, API sinh văn bản, RAG generation và các ứng dụng phụ thuộc model sẽ không hoạt động. Vì vậy, người quản trị hệ thống cần biết cách kiểm tra trạng thái, khởi động, dừng, khởi động lại và xem log dịch vụ Ollama.
Trong môi trường bệnh viện, các thao tác này không nên thực hiện tùy tiện. Nếu khởi động lại Ollama trong giờ cao điểm, người dùng có thể bị gián đoạn. Nếu dừng service khi đang có request dài, kết quả có thể mất. Vì vậy, cần thao tác có kế hoạch, thông báo khi cần và ghi nhận sự cố.
2. Kiểm tra Ollama có đang chạy không
Nếu Ollama được cài như systemd service, có thể kiểm tra:
systemctl status ollamaKết quả cần xem:
- Service đang
activehayinactive. - Có lỗi khi khởi động không.
- Thời gian chạy gần nhất.
- PID tiến trình.
- Dòng log gần nhất.
- Có restart liên tục không.
Nếu service không chạy, chatbot sẽ không gọi được model.
3. Khởi động dịch vụ Ollama
Dùng lệnh:
sudo systemctl start ollamaSau đó kiểm tra lại:
systemctl status ollamaNếu service khởi động lỗi, cần xem log bằng journalctl.
4. Dừng dịch vụ Ollama
Dùng lệnh:
sudo systemctl stop ollamaChỉ nên dừng khi:
- Bảo trì.
- Cập nhật.
- Thay đổi cấu hình.
- Xử lý lỗi.
- Cần giải phóng tài nguyên.
- Có yêu cầu an toàn.
Không nên dừng đột ngột khi nhiều người dùng đang sử dụng nếu không có thông báo.
5. Khởi động lại dịch vụ Ollama
Dùng lệnh:
sudo systemctl restart ollamaKhởi động lại thường dùng khi:
- Ollama treo.
- Model không phản hồi.
- Cập nhật cấu hình.
- Sau khi cập nhật phần mềm.
- Cần giải phóng trạng thái lỗi.
Sau restart, kiểm tra:
systemctl status ollamaollama ps
6. Bật tự khởi động cùng hệ thống
Để Ollama tự chạy sau khi reboot:
sudo systemctl enable ollamaKiểm tra:
systemctl is-enabled ollamaNếu máy chủ mất điện và khởi động lại, service cần tự lên để hệ thống AI hoạt động.
7. Tắt tự khởi động nếu cần
Trong một số trường hợp bảo trì, có thể tắt tự khởi động:
sudo systemctl disable ollamaTuy nhiên, trên máy chủ sản xuất, thường nên để Ollama tự khởi động.
8. Xem log dịch vụ
Dùng:
journalctl -u ollama -fLệnh này theo dõi log realtime. Có thể xem log gần đây:
journalctl -u ollama -n 100Cần chú ý:
- Lỗi load model.
- Lỗi GPU.
- Lỗi out of memory.
- Service restart.
- Request lỗi.
- Thông báo port.
- Cảnh báo quyền hoặc file.
9. Kiểm tra model đang loaded
Dùng:
ollama psLệnh này giúp biết:
- Model nào đang chạy.
- Kích thước model.
- Processor CPU/GPU.
- Context.
- Thời gian còn giữ model trong bộ nhớ.
Nếu không có model nào loaded, request đầu tiên có thể chậm hơn vì phải load model.
10. Kiểm tra danh sách model đã tải
Dùng:
ollama listLệnh này cho biết model nào đã tải về máy chủ. Đây là bước cơ bản để kiểm tra hệ thống có đủ model cần dùng hay không.
11. Kiểm tra API Ollama nội bộ
Có thể kiểm tra endpoint nội bộ:
curl http://127.0.0.1:11434/api/tagsNếu trả về danh sách model, Ollama API đang hoạt động trên localhost.
Lưu ý: cổng này không nên mở trực tiếp ra Internet.
12. Quy trình kiểm tra nhanh sau reboot
Sau khi máy chủ khởi động lại, nên kiểm tra:
systemctl status ollamaollama listollama psnvidia-smicurl http://127.0.0.1:11434/api/tags
Nếu có API trung gian, cần kiểm tra thêm API và chatbot.
13. Kết luận
Quản trị dịch vụ Ollama là kỹ năng vận hành cơ bản của hệ thống AI local. Người quản trị cần biết kiểm tra trạng thái, start, stop, restart, enable, xem log, kiểm tra model loaded và kiểm tra API nội bộ. Trong bệnh viện, các thao tác này phải đi kèm quy trình bảo trì, thông báo người dùng khi cần và ghi nhận sự cố để hệ thống AI hoạt động ổn định.
- Đăng nhập để gửi ý kiến