Bài 2. Ollama không khởi động

1. Đặt vấn đề

Ollama là dịch vụ chạy model. Khi Ollama không khởi động, các chatbot, API sinh văn bản, RAG generation và tác vụ liên quan AI sẽ không hoạt động. Đây là lỗi nghiêm trọng nhưng thường có thể xử lý nếu kiểm tra đúng log và trạng thái service.

Không nên chỉ reboot máy chủ ngay khi Ollama lỗi. Cần kiểm tra service, port, quyền thư mục, dung lượng ổ, log và các thay đổi gần nhất.

2. Dấu hiệu nhận biết

Chatbot báo không kết nối được model.
API trả lỗi connection refused.
curl http://127.0.0.1:11434/api/tags không phản hồi.
systemctl status ollama báo failed.
Ollama restart liên tục.
Log báo lỗi permission, port, model path hoặc out of memory.

3. Lệnh kiểm tra cơ bản

Kiểm tra trạng thái:

systemctl status ollama

Xem log:

journalctl -u ollama -n 100

Theo dõi log realtime:

journalctl -u ollama -f

Kiểm tra port:

ss -lntp | grep 11434

Kiểm tra API:

curl http://127.0.0.1:11434/api/tags

4. Nguyên nhân thường gặp

4.1. Service bị dừng

Có thể do reboot, cập nhật, lỗi runtime hoặc thao tác thủ công.

4.2. Port bị chiếm

Cổng 11434 có thể bị tiến trình khác chiếm.

4.3. Quyền thư mục sai

User chạy Ollama không đọc/ghi được thư mục model.

4.4. Ổ cứng đầy

Ollama không thể ghi file, log hoặc trạng thái.

4.5. Cập nhật lỗi

Sau cập nhật Ollama, service không khởi động do cấu hình hoặc binary lỗi.

4.6. Driver GPU lỗi

Một số lỗi GPU/driver có thể làm backend model gặp lỗi.

4.7. File model lỗi

Model tải chưa hoàn chỉnh hoặc thư mục model bị hỏng.

5. Cách xử lý từng bước

Trước hết thử start service:

sudo systemctl start ollama

Nếu vẫn lỗi, xem log:

journalctl -u ollama -n 200

Kiểm tra dung lượng:

df -h

Kiểm tra port:

ss -lntp | grep 11434

Nếu port bị chiếm, xác định tiến trình đang giữ port. Nếu quyền thư mục sai, kiểm tra owner và permission thư mục model. Nếu ổ đầy, dọn log/model/file tạm theo quy trình. Nếu lỗi sau cập nhật, cân nhắc rollback.

6. Restart Ollama

Nếu service đang treo:

sudo systemctl restart ollama

Sau đó kiểm tra:

systemctl status ollama
curl http://127.0.0.1:11434/api/tags

Nếu vẫn không chạy, không nên restart lặp lại nhiều lần mà cần đọc log.

7. Kiểm tra tự khởi động

Đảm bảo Ollama tự chạy sau reboot:

systemctl is-enabled ollama

Nếu chưa enable:

sudo systemctl enable ollama

8. Khi nào cần reboot máy chủ?

Reboot chỉ nên làm khi:

Driver GPU lỗi và cần reload kernel module.
Service/systemd trạng thái bất thường.
Sau cập nhật driver/kernel.
Đã ghi nhận log cần thiết.
Không còn request người dùng quan trọng.
Có thông báo hoặc thời điểm bảo trì nếu hệ thống chính thức.

Không nên reboot như bước đầu tiên.

9. Phòng ngừa

Cần:

Theo dõi service định kỳ.
Có cảnh báo khi Ollama failed.
Không để ổ hệ thống đầy.
Ghi nhật ký cập nhật.
Backup cấu hình và model list.
Test sau reboot.
Dùng systemd enable.
Có tài liệu xử lý sự cố.

10. Kết luận

Ollama không khởi động thường liên quan service, port, permission, dung lượng ổ, cập nhật hoặc GPU driver. Cần kiểm tra bằng systemctl, journalctl, curl, ss, df. Xử lý đúng giúp khôi phục nhanh và tránh thao tác nguy hiểm. Trong bệnh viện, lỗi Ollama phải được đưa vào quy trình vận hành chính thức vì nó ảnh hưởng trực tiếp đến dịch vụ AI nội bộ.

Đăng nhập để gửi ý kiến