Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 2. Cấu trúc cơ bản của Modelfile

1. Đặt vấn đề

Sau khi hiểu Modelfile là gì, bước tiếp theo là nắm cấu trúc cơ bản của một Modelfile. Nếu chỉ nhìn một file cấu hình, người mới có thể thấy các dòng như FROM, SYSTEM, PARAMETER, TEMPLATE, MESSAGE và chưa hiểu mỗi dòng có vai trò gì. Trong triển khai bệnh viện, không nhất thiết phải dùng tất cả các thành phần nâng cao ngay từ đầu, nhưng cần hiểu các thành phần cơ bản để tạo được model tùy biến an toàn và dễ bảo trì.

Một Modelfile tốt không chỉ đúng cú pháp, mà còn phải rõ mục đích, dễ đọc, dễ chỉnh sửa, dễ bàn giao và phù hợp với vai trò của trợ lý AI trong bệnh viện.

2. Thành phần FROM

FROM là dòng khai báo model nền. Đây là thành phần gần như bắt buộc. Nó cho Ollama biết model tùy biến sẽ dựa trên model nào.

Ví dụ:

 
FROM qwen2.5:7b
 

Hoặc:

 
FROM llama3.1:8b
 

Trong bệnh viện, nên ghi rõ tag model nền, không nên dùng mơ hồ nếu cần ổn định. Nếu model nền thay đổi, hành vi model tùy biến có thể thay đổi theo.

3. Thành phần SYSTEM

SYSTEM dùng để thiết lập system prompt. Đây là phần quan trọng nhất khi tùy biến model cho bệnh viện.

System prompt quy định:

  • AI đang đóng vai trò gì.
  • Trả lời bằng ngôn ngữ nào.
  • Văn phong ra sao.
  • Phạm vi hỗ trợ.
  • Những điều không được làm.
  • Cách xử lý khi thiếu thông tin.
  • Cách trình bày câu trả lời.
  • Mức độ thận trọng trong y tế.

Ví dụ:

 
SYSTEM """
Bạn là trợ lý AI nội bộ của bệnh viện.
Bạn hỗ trợ soạn thảo, tóm tắt và phân tích tài liệu quản trị bệnh viện.
Luôn trả lời bằng tiếng Việt, văn phong chuyên nghiệp, rõ ràng, có cấu trúc.
Không tự bịa số liệu, căn cứ pháp lý hoặc quy định nội bộ.
Nếu thiếu thông tin, hãy nói rõ chưa đủ căn cứ.
"""
 

Trong bệnh viện, system prompt cần viết kỹ, vì nó là nền tảng hành vi của trợ lý.

4. Thành phần PARAMETER

PARAMETER dùng để thiết lập các tham số sinh văn bản. Một số tham số thường gặp:

  • temperature
  • top_p
  • num_ctx
  • các tham số khác tùy model và phiên bản Ollama hỗ trợ.

Ví dụ:

 
PARAMETER temperature 0.2
PARAMETER top_p 0.9
PARAMETER num_ctx 4096
 

Trong bệnh viện, temperature thường nên thấp hoặc vừa để câu trả lời ổn định, ít sáng tạo quá mức. Với văn bản hành chính, pháp luật, quy trình và RAG, nên ưu tiên tính nhất quán.

5. Thành phần TEMPLATE

TEMPLATE dùng để tùy chỉnh cách prompt được đóng gói trước khi gửi vào model. Đây là phần nâng cao hơn. Người mới có thể chưa cần dùng ngay.

Trong bệnh viện, nếu chỉ cần tạo trợ lý theo vai trò, thường FROM, SYSTEMPARAMETER đã đủ cho giai đoạn đầu. Chỉ nên chỉnh template khi có nhu cầu rõ và hiểu định dạng chat của model.

Nếu chỉnh template sai, model có thể trả lời kém hoặc không tuân thủ hướng dẫn.

6. Thành phần MESSAGE

Một số cấu hình có thể dùng MESSAGE để thêm ví dụ hội thoại hoặc thiết lập thông điệp mẫu. Đây cũng là phần nâng cao, có thể hữu ích khi muốn model học theo một số kiểu phản hồi mẫu.

Ví dụ, với trợ lý quản lý chất lượng, có thể thêm ví dụ người dùng yêu cầu tạo bảng kiểm và trợ lý trả lời bằng bảng câu hỏi cụ thể. Tuy nhiên, cần cẩn thận để không làm Modelfile quá dài hoặc quá cứng.

7. Cấu trúc tối thiểu nên dùng trong bệnh viện

Một Modelfile tối thiểu cho bệnh viện có thể gồm:

 
FROM qwen2.5:7b

SYSTEM """
Bạn là trợ lý AI nội bộ của bệnh viện.
Trả lời bằng tiếng Việt, văn phong chuyên nghiệp, rõ ràng, thận trọng.
Chỉ hỗ trợ soạn thảo, tóm tắt, phân tích và tra cứu thông tin ở mức tham khảo.
Không tự đưa ra chẩn đoán, điều trị hoặc chỉ định chuyên môn cho người bệnh.
Không tự bịa căn cứ pháp lý, số liệu hoặc quy định nội bộ.
Nếu thiếu thông tin, hãy nói rõ chưa đủ căn cứ.
"""

PARAMETER temperature 0.2
PARAMETER top_p 0.9
 

Đây là cấu trúc dễ hiểu, phù hợp để bắt đầu.

8. Cách tạo model từ Modelfile

Sau khi viết Modelfile, dùng lệnh:

 
ollama create ten_model_tuy_bien -f Modelfile
 

Ví dụ:

 
ollama create assistant-qlcl -f Modelfile.qlcl
 

Sau đó chạy:

 
ollama run assistant-qlcl
 

Và kiểm tra:

 
ollama list
 

9. Đặt tên file và tên model

Trong bệnh viện, nên đặt tên rõ ràng:

  • Modelfile.qlcl
  • Modelfile.khth
  • Modelfile.dieuduong
  • Modelfile.cntt
  • Modelfile.phapluat

Tên model tùy biến cũng nên rõ:

  • assistant-qlcl
  • assistant-khth
  • assistant-dieuduong
  • assistant-cntt
  • assistant-phapluat

Không nên đặt tên chung chung như test1, model2, newmodel trên hệ thống chính thức.

10. Ghi chú trong Modelfile

Nếu Ollama hỗ trợ hoặc trong file quản lý riêng, nên có ghi chú về:

  • Ngày tạo.
  • Người tạo.
  • Model nền.
  • Mục đích.
  • Phiên bản.
  • Ghi chú thay đổi.
  • Phòng ban sử dụng.

Nếu không ghi trực tiếp trong Modelfile, có thể lưu ở file README đi kèm.

11. Kiểm tra sau khi tạo model

Sau khi tạo model tùy biến, cần kiểm tra:

  • Model có chạy không?
  • Có tuân thủ system prompt không?
  • Có trả lời tiếng Việt không?
  • Có dùng đúng văn phong không?
  • Có từ chối tác vụ vượt phạm vi không?
  • Có nói thiếu căn cứ khi cần không?
  • Tốc độ có chấp nhận được không?
  • Có dùng GPU không?

Không nên tạo model xong rồi đưa ngay vào ứng dụng mà chưa kiểm tra.

12. Kết luận

Cấu trúc cơ bản của Modelfile thường gồm FROM, SYSTEMPARAMETER. Với bệnh viện, phần quan trọng nhất là SYSTEM, vì nó định hướng vai trò, văn phong và giới hạn an toàn của trợ lý AI. Các tham số như temperature, top_p và num_ctx giúp điều chỉnh cách model trả lời. Khi xây dựng Modelfile, cần đặt tên rõ, quản lý phiên bản, kiểm tra kỹ sau khi tạo và không chỉnh các thành phần nâng cao nếu chưa có nhu cầu rõ.