Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 8. Cấu hình Ollama chạy như service

1. Đặt vấn đề

Một hệ thống AI local bệnh viện không thể phụ thuộc vào việc người quản trị mở terminal rồi chạy lệnh thủ công. Nếu máy chủ reboot, mất điện, cập nhật hoặc service bị dừng, hệ thống cần tự khởi động lại. Vì vậy, Ollama nên được chạy như một service bằng systemd.

Chạy như service giúp Ollama hoạt động ổn định hơn, có log, có trạng thái rõ ràng, có thể restart, enable tự khởi động và tích hợp vào quy trình vận hành máy chủ.

2. Kiểm tra service Ollama

Sau khi cài Ollama, kiểm tra:

 
systemctl status ollama
 

Nếu service tồn tại và đang chạy, hệ thống đã có cấu hình service cơ bản.

Xem nội dung service:

 
systemctl cat ollama
 

Lệnh này giúp biết service chạy bằng user nào, lệnh khởi động là gì và biến môi trường nào đang được dùng.

3. Bật tự khởi động

Để Ollama tự chạy sau reboot:

 
sudo systemctl enable ollama
 

Khởi động service:

 
sudo systemctl start ollama
 

Restart khi cần:

 
sudo systemctl restart ollama
 

Dừng service:

 
sudo systemctl stop ollama
 

Kiểm tra trạng thái:

 
sudo systemctl status ollama
 

4. Không nên sửa trực tiếp file service gốc

Nếu cần chỉnh cấu hình service, nên dùng override:

 
sudo systemctl edit ollama
 

Cách này tạo file override riêng, tránh mất thay đổi khi package cập nhật.

Sau khi chỉnh:

 
sudo systemctl daemon-reload
sudo systemctl restart ollama
 

Kiểm tra lại:

 
systemctl cat ollama
 

5. Cấu hình biến môi trường

Một số biến môi trường thường được quan tâm:

  • OLLAMA_HOST: cấu hình địa chỉ listen.
  • OLLAMA_MODELS: cấu hình thư mục lưu model.
  • Các biến khác tùy phiên bản và nhu cầu.

Ví dụ, nếu muốn Ollama chỉ listen localhost:

 
[Service]
Environment="OLLAMA_HOST=127.0.0.1:11434"
 

Nếu muốn lưu model ở thư mục khác:

 
[Service]
Environment="OLLAMA_MODELS=/mnt/data/ai/models"
 

Sau khi cấu hình, restart service và kiểm tra log.

6. Cấu hình thư mục lưu model qua service

Nếu muốn chuyển thư mục model sang ổ dữ liệu lớn, cần:

  1. Tạo thư mục.
  2. Gán quyền cho user chạy Ollama.
  3. Cấu hình OLLAMA_MODELS.
  4. Restart service.
  5. Kiểm tra model được tải vào đúng vị trí.

Ví dụ:

 
sudo mkdir -p /mnt/data/ai/models
 

Cần biết service chạy user nào để chown đúng. Kiểm tra bằng:

 
systemctl cat ollama
 

Sau đó cấu hình override và restart.

7. Cấu hình listen trong mạng LAN

Nếu cần cho máy khác trong LAN gọi API, có thể cấu hình:

 
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
 

Tuy nhiên, trong bệnh viện, không nên làm bước này nếu chưa có firewall và chính sách truy cập. Tốt hơn là để Ollama listen localhost, sau đó xây API trung gian hoặc reverse proxy có xác thực.

Nếu vẫn mở LAN, cần giới hạn bằng firewall chỉ cho IP được phép.

8. Kiểm tra sau cấu hình

Sau khi restart:

 
sudo systemctl restart ollama
 

Kiểm tra:

 
systemctl status ollama
 
 
journalctl -u ollama -n 100 --no-pager
 
 
ss -tulpn | grep 11434
 
 
curl http://127.0.0.1:11434/api/tags
 

Nếu đổi thư mục model, tải thử model nhỏ và kiểm tra file xuất hiện đúng vị trí.

9. Restart policy

Service systemd thường có chính sách restart. Cần xem file service hiện có. Nếu cần, có thể cấu hình restart khi lỗi, nhưng cần thận trọng để tránh vòng restart liên tục khi cấu hình sai.

Giám sát log giúp phát hiện service có restart bất thường.

10. Tài liệu hóa service

Cần ghi lại:

  • File override đã cấu hình.
  • OLLAMA_HOST.
  • OLLAMA_MODELS.
  • User chạy service.
  • Port.
  • Ngày chỉnh sửa.
  • Người chỉnh sửa.
  • Lý do chỉnh sửa.

Trong bệnh viện, tài liệu hóa giúp bàn giao và xử lý lỗi nhanh.

11. Kết luận

Cấu hình Ollama chạy như service là bước cần thiết để vận hành AI local ổn định. Dùng systemd giúp Ollama tự khởi động, dễ kiểm tra trạng thái, dễ xem log và dễ quản lý. Khi chỉnh cấu hình, nên dùng systemctl edit, không sửa trực tiếp file gốc. Đặc biệt, cần kiểm soát OLLAMA_HOSTOLLAMA_MODELS vì chúng ảnh hưởng đến bảo mật truy cập và dung lượng lưu trữ model.