Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 1. Modelfile là gì?

1. Đặt vấn đề

Khi tải một model về Ollama, model đó thường ở trạng thái tổng quát. Người dùng có thể hỏi nhiều nội dung khác nhau, nhưng model chưa được định hướng rõ rằng nó đang làm việc trong bệnh viện, đang hỗ trợ phòng ban nào, cần dùng văn phong nào, không được trả lời những nội dung nào, khi thiếu căn cứ phải xử lý ra sao và có cần ưu tiên an toàn người bệnh hay không.

Trong môi trường bệnh viện, sự định hướng này rất quan trọng. Một trợ lý AI dùng cho hành chính bệnh viện không nên trả lời giống một chatbot giải trí. Một trợ lý AI dùng cho quản lý chất lượng không nên trả lời chung chung. Một trợ lý AI dùng cho văn bản pháp luật y tế không được bịa số hiệu văn bản. Một trợ lý AI dùng cho điều dưỡng không được tự đưa ra chỉ định điều trị. Vì vậy, cần một cách để tùy biến hành vi model.

Modelfile là công cụ phục vụ mục đích đó trong Ollama.

2. Khái niệm Modelfile

Modelfile là một file cấu hình dùng để tạo model tùy biến trong Ollama. File này cho Ollama biết model nền là gì, system prompt là gì, tham số sinh văn bản ra sao và một số thiết lập hành vi khác.

Có thể hiểu đơn giản:

Modelfile là bản thiết kế cấu hình cho một trợ lý AI local dựa trên một model nền.

Ví dụ, bệnh viện có thể dùng một model nền như qwen2.5:7b, sau đó tạo Modelfile để biến model này thành “trợ lý quản lý chất lượng bệnh viện”. Khi đó, model tùy biến sẽ luôn được định hướng trả lời theo vai trò quản lý chất lượng, ưu tiên an toàn người bệnh, viết bảng kiểm cụ thể, không tự bịa căn cứ và yêu cầu kiểm tra trước khi dùng nội dung chính thức.

3. Modelfile khác gì model nền?

Model nền là mô hình AI gốc đã được huấn luyện sẵn. Nó chứa năng lực ngôn ngữ, khả năng lập luận và tri thức tổng quát.

Modelfile không huấn luyện lại model. Modelfile chỉ cấu hình cách sử dụng model nền. Nó giống như một lớp hướng dẫn cố định đặt trước model.

Ví dụ:

  • Model nền: qwen2.5:7b
  • Model tùy biến: qlcl-assistant
  • Modelfile: file quy định qlcl-assistant dựa trên qwen2.5:7b, có system prompt cho quản lý chất lượng bệnh viện, temperature thấp và context phù hợp.

Như vậy, Modelfile không làm model có tri thức mới theo nghĩa huấn luyện. Nếu muốn model trả lời theo tài liệu nội bộ, vẫn phải cung cấp tài liệu trong prompt hoặc dùng RAG.

4. Vì sao bệnh viện cần Modelfile?

Bệnh viện cần Modelfile vì nhiều lý do.

Thứ nhất, để chuẩn hóa vai trò AI. Nếu không có system prompt cố định, mỗi người dùng có thể hướng dẫn model theo cách khác nhau, dẫn đến kết quả không ổn định.

Thứ hai, để thiết lập văn phong phù hợp. Văn bản bệnh viện cần chuyên nghiệp, rõ ràng, thận trọng, không quảng cáo, không cảm tính.

Thứ ba, để giới hạn phạm vi trả lời. AI không được tự chẩn đoán, không tự điều trị, không thay thế phê duyệt văn bản, không bịa căn cứ.

Thứ tư, để tạo trợ lý riêng cho từng phòng ban. Mỗi phòng ban có ngôn ngữ, tài liệu và tác vụ riêng.

Thứ năm, để quản lý model dễ hơn. Thay vì nhớ một model nền dùng cho mọi việc, bệnh viện có thể tạo các model tùy biến có tên rõ ràng: assistant-qlcl, assistant-khth, assistant-dieuduong, assistant-cntt, assistant-phapluat.

5. Modelfile có thay thế RAG không?

Không. Đây là điểm rất quan trọng.

Modelfile không thay thế RAG. Modelfile chỉ định hướng hành vi model. RAG mới là cơ chế đưa tài liệu nội bộ vào câu trả lời.

Ví dụ, nếu tạo Modelfile cho trợ lý quản lý chất lượng và viết trong system prompt rằng “hãy trả lời theo Bộ tiêu chí chất lượng bệnh viện”, model vẫn không tự có đầy đủ nội dung Bộ tiêu chí mới nhất nếu không được cung cấp. Muốn trả lời chính xác, hệ thống cần truy xuất tài liệu từ kho tri thức, FAISS hoặc nguồn dữ liệu nội bộ.

Có thể hình dung:

  • Modelfile trả lời câu hỏi: “AI nên hành xử như thế nào?”
  • RAG trả lời câu hỏi: “AI nên dựa trên tài liệu nào?”
  • Model nền trả lời câu hỏi: “AI có năng lực ngôn ngữ và lập luận ra sao?”

Ba thành phần này bổ sung cho nhau.

6. Modelfile có thay thế fine-tuning không?

Modelfile cũng không phải fine-tuning. Fine-tuning là huấn luyện bổ sung làm thay đổi trọng số model. Modelfile không thay đổi trọng số. Nó chỉ tạo một cấu hình sử dụng model.

Ưu điểm của Modelfile là đơn giản, nhanh, ít rủi ro và dễ thay đổi. Nếu system prompt chưa tốt, có thể chỉnh Modelfile rồi tạo lại model. Fine-tuning phức tạp hơn nhiều, cần dữ liệu huấn luyện, hạ tầng, đánh giá và kiểm soát rủi ro.

Với bệnh viện, trong giai đoạn đầu, Modelfile kết hợp RAG thường thực tế hơn fine-tuning.

7. Ví dụ ý tưởng về Modelfile

Một Modelfile đơn giản có thể có các thành phần như:

 
FROM qwen2.5:7b

SYSTEM """
Bạn là trợ lý AI nội bộ của bệnh viện, hỗ trợ soạn thảo văn bản hành chính và quản lý chất lượng.
Trả lời bằng tiếng Việt, văn phong chuyên nghiệp, rõ ràng, thận trọng.
Không tự bịa căn cứ pháp lý, số liệu hoặc quy định nội bộ.
Khi thiếu thông tin, hãy nói rõ chưa đủ căn cứ.
"""

PARAMETER temperature 0.2
PARAMETER top_p 0.9
 

Đây chỉ là ví dụ khái niệm. Khi triển khai thật, bệnh viện cần viết system prompt kỹ hơn theo từng vai trò.

8. Khi nào nên dùng Modelfile?

Nên dùng Modelfile khi:

  • Muốn tạo trợ lý có vai trò cố định.
  • Muốn chuẩn hóa system prompt.
  • Muốn model luôn trả lời bằng tiếng Việt chuyên nghiệp.
  • Muốn đặt giới hạn an toàn cho môi trường bệnh viện.
  • Muốn tạo nhiều trợ lý theo phòng ban.
  • Muốn tránh phải nhập system prompt dài trong mỗi request.
  • Muốn tích hợp model vào API hoặc chatbot với tên riêng.

9. Khi nào chưa cần Modelfile?

Ở giai đoạn rất sớm, khi chỉ thử model bằng ollama run, có thể chưa cần Modelfile. Người quản trị có thể hỏi trực tiếp model để kiểm tra tốc độ và chất lượng. Nhưng khi bắt đầu dùng cho tác vụ thật hoặc tích hợp ứng dụng, nên tạo Modelfile để chuẩn hóa hành vi.

10. Kết luận

Modelfile là công cụ quan trọng trong Ollama để tạo model tùy biến dựa trên model nền. Trong bệnh viện, Modelfile giúp chuẩn hóa vai trò, văn phong, giới hạn an toàn và tham số sinh văn bản cho từng nhóm trợ lý AI. Tuy nhiên, Modelfile không thay thế RAG, không thay thế fine-tuning và không tự làm model biết tài liệu nội bộ. Giá trị lớn nhất của Modelfile là giúp bệnh viện tổ chức AI local thành các trợ lý có vai trò rõ ràng, dễ quản lý và phù hợp hơn với môi trường y tế.