Bài 1. Khởi động, dừng và kiểm tra dịch vụ Ollama

1. Đặt vấn đề

Ollama là thành phần trung tâm để chạy model AI local. Nếu dịch vụ Ollama không chạy, chatbot, API sinh văn bản, RAG generation và các ứng dụng phụ thuộc model sẽ không hoạt động. Vì vậy, người quản trị hệ thống cần biết cách kiểm tra trạng thái, khởi động, dừng, khởi động lại và xem log dịch vụ Ollama.

Trong môi trường bệnh viện, các thao tác này không nên thực hiện tùy tiện. Nếu khởi động lại Ollama trong giờ cao điểm, người dùng có thể bị gián đoạn. Nếu dừng service khi đang có request dài, kết quả có thể mất. Vì vậy, cần thao tác có kế hoạch, thông báo khi cần và ghi nhận sự cố.

2. Kiểm tra Ollama có đang chạy không

Nếu Ollama được cài như systemd service, có thể kiểm tra:

systemctl status ollama

Kết quả cần xem:

Service đang active hay inactive.
Có lỗi khi khởi động không.
Thời gian chạy gần nhất.
PID tiến trình.
Dòng log gần nhất.
Có restart liên tục không.

Nếu service không chạy, chatbot sẽ không gọi được model.

3. Khởi động dịch vụ Ollama

Dùng lệnh:

sudo systemctl start ollama

Sau đó kiểm tra lại:

systemctl status ollama

Nếu service khởi động lỗi, cần xem log bằng journalctl.

4. Dừng dịch vụ Ollama

Dùng lệnh:

sudo systemctl stop ollama

Chỉ nên dừng khi:

Bảo trì.
Cập nhật.
Thay đổi cấu hình.
Xử lý lỗi.
Cần giải phóng tài nguyên.
Có yêu cầu an toàn.

Không nên dừng đột ngột khi nhiều người dùng đang sử dụng nếu không có thông báo.

5. Khởi động lại dịch vụ Ollama

Dùng lệnh:

sudo systemctl restart ollama

Khởi động lại thường dùng khi:

Ollama treo.
Model không phản hồi.
Cập nhật cấu hình.
Sau khi cập nhật phần mềm.
Cần giải phóng trạng thái lỗi.

Sau restart, kiểm tra:

systemctl status ollama
ollama ps

6. Bật tự khởi động cùng hệ thống

Để Ollama tự chạy sau khi reboot:

sudo systemctl enable ollama

Kiểm tra:

systemctl is-enabled ollama

Nếu máy chủ mất điện và khởi động lại, service cần tự lên để hệ thống AI hoạt động.

7. Tắt tự khởi động nếu cần

Trong một số trường hợp bảo trì, có thể tắt tự khởi động:

sudo systemctl disable ollama

Tuy nhiên, trên máy chủ sản xuất, thường nên để Ollama tự khởi động.

8. Xem log dịch vụ

Dùng:

journalctl -u ollama -f

Lệnh này theo dõi log realtime. Có thể xem log gần đây:

journalctl -u ollama -n 100

Cần chú ý:

Lỗi load model.
Lỗi GPU.
Lỗi out of memory.
Service restart.
Request lỗi.
Thông báo port.
Cảnh báo quyền hoặc file.

9. Kiểm tra model đang loaded

Dùng:

ollama ps

Lệnh này giúp biết:

Model nào đang chạy.
Kích thước model.
Processor CPU/GPU.
Context.
Thời gian còn giữ model trong bộ nhớ.

Nếu không có model nào loaded, request đầu tiên có thể chậm hơn vì phải load model.

10. Kiểm tra danh sách model đã tải

Dùng:

ollama list

Lệnh này cho biết model nào đã tải về máy chủ. Đây là bước cơ bản để kiểm tra hệ thống có đủ model cần dùng hay không.

11. Kiểm tra API Ollama nội bộ

Có thể kiểm tra endpoint nội bộ:

curl http://127.0.0.1:11434/api/tags

Nếu trả về danh sách model, Ollama API đang hoạt động trên localhost.

Lưu ý: cổng này không nên mở trực tiếp ra Internet.

12. Quy trình kiểm tra nhanh sau reboot

Sau khi máy chủ khởi động lại, nên kiểm tra:

systemctl status ollama
ollama list
ollama ps
nvidia-smi
curl http://127.0.0.1:11434/api/tags

Nếu có API trung gian, cần kiểm tra thêm API và chatbot.

13. Kết luận

Quản trị dịch vụ Ollama là kỹ năng vận hành cơ bản của hệ thống AI local. Người quản trị cần biết kiểm tra trạng thái, start, stop, restart, enable, xem log, kiểm tra model loaded và kiểm tra API nội bộ. Trong bệnh viện, các thao tác này phải đi kèm quy trình bảo trì, thông báo người dùng khi cần và ghi nhận sự cố để hệ thống AI hoạt động ổn định.

Đăng nhập để gửi ý kiến

Bài 1. Khởi động, dừng và kiểm tra dịch vụ Ollama

1. Đặt vấn đề

2. Kiểm tra Ollama có đang chạy không

3. Khởi động dịch vụ Ollama

4. Dừng dịch vụ Ollama

5. Khởi động lại dịch vụ Ollama

6. Bật tự khởi động cùng hệ thống

7. Tắt tự khởi động nếu cần

8. Xem log dịch vụ

9. Kiểm tra model đang loaded

10. Kiểm tra danh sách model đã tải

11. Kiểm tra API Ollama nội bộ

12. Quy trình kiểm tra nhanh sau reboot

13. Kết luận

Vì Sao Tôi Không Tin Các AI Agent Hoạt Động Độc Lập Nếu Không Có Giám Sát Nghiêm Ngặt

Thúy Hường

Câu hỏi, thảo luận