Bài 2. API sinh văn bản

1. Đặt vấn đề

API sinh văn bản là một trong những API cơ bản nhất của Ollama. Nó cho phép ứng dụng gửi một prompt đến model và nhận lại văn bản do model sinh ra. Đây là dạng API phù hợp cho các tác vụ đơn lượt như: viết bản nháp kế hoạch, tóm tắt một đoạn tài liệu, tạo bảng kiểm, viết thông báo, giải thích một khái niệm hoặc chuyển ý gạch đầu dòng thành văn bản hoàn chỉnh.

Trong bệnh viện, API sinh văn bản có thể là nền tảng cho nhiều công cụ hỗ trợ công việc hằng ngày. Tuy nhiên, cần thiết kế prompt và kiểm soát đầu vào/đầu ra cẩn thận để tránh model bịa số liệu, căn cứ hoặc trả lời vượt phạm vi.

2. API sinh văn bản là gì?

API sinh văn bản thường nhận các thông tin chính:

Tên model.
Prompt.
Tham số tùy chọn.
Chế độ streaming hoặc không streaming.

Ví dụ request dạng khái niệm:

{
  "model": "assistant-hanhchinh",
  "prompt": "Hãy viết thông báo nội bộ về việc triển khai khảo sát hài lòng người bệnh.",
  "stream": false
}

Response sẽ chứa nội dung model sinh ra.

3. Khi nào dùng API sinh văn bản?

API sinh văn bản phù hợp với các tác vụ một lượt, không cần quản lý lịch sử hội thoại phức tạp:

Viết kế hoạch.
Viết báo cáo.
Tóm tắt văn bản.
Tạo bảng kiểm.
Viết nội dung đào tạo.
Viết công văn/thông báo.
Phân loại ngắn.
Trích xuất thông tin từ một đoạn văn.
Chuyển bullet thành văn bản.

Nếu cần hội thoại nhiều lượt, nên dùng API chat.

4. Ví dụ tác vụ trong bệnh viện

Một form nội bộ có thể có các trường:

Loại văn bản: kế hoạch.
Chủ đề: triển khai 5S tại khoa Khám bệnh.
Đối tượng: các khoa lâm sàng.
Yêu cầu: có mục tiêu, nội dung, phân công, tiến độ.
Model: assistant-qlcl.

API trung gian sẽ tạo prompt chuẩn:

Hãy viết bản nháp kế hoạch triển khai 5S tại khoa Khám bệnh.
Yêu cầu:
- Văn phong hành chính bệnh viện.
- Có mục tiêu, yêu cầu, nội dung hoạt động, phân công, tiến độ, theo dõi đánh giá.
- Không tự bịa số liệu.
- Nếu thiếu thông tin, để vị trí cần bổ sung bằng dấu ...

Sau đó gửi đến Ollama.

5. Thiết kế prompt cho API sinh văn bản

Prompt tốt cần có:

Vai trò hoặc ngữ cảnh.
Tác vụ cụ thể.
Đầu vào rõ.
Định dạng đầu ra.
Giới hạn không được bịa.
Yêu cầu văn phong.
Độ dài mong muốn.
Điều kiện xử lý khi thiếu thông tin.

Ví dụ:

Bạn hãy viết bản nháp báo cáo sơ kết 6 tháng công tác quản lý chất lượng bệnh viện.
Không tự bịa số liệu. Những vị trí thiếu số liệu hãy để dạng [cần bổ sung].
Bố cục gồm: tình hình chung, kết quả đạt được, tồn tại, nguyên nhân, giải pháp, kiến nghị.
Văn phong hành chính, rõ ràng, chuyên nghiệp.

6. Kiểm soát đầu vào

API trung gian nên kiểm tra:

Prompt có quá dài không?
Có chứa dữ liệu người bệnh định danh không?
Người dùng có quyền dùng model này không?
Tác vụ có phù hợp không?
Có file/tài liệu kèm theo không?
Có yêu cầu nguy hiểm không?

Ví dụ, nếu người dùng nhập: “Dựa vào bệnh án này hãy chẩn đoán và kê đơn”, API trung gian nên chặn hoặc cảnh báo nếu hệ thống không được phép làm tác vụ đó.

7. Kiểm soát đầu ra

Sau khi nhận response, API trung gian có thể:

Gắn cảnh báo “nội dung AI tạo ra cần được kiểm tra”.
Kiểm tra response quá dài/quá ngắn.
Lọc thông tin nhạy cảm nếu có.
Ghi log.
Lưu bản nháp nếu người dùng yêu cầu.
Cho phép người dùng đánh giá kết quả.
Không tự động ban hành văn bản.

Đối với văn bản chính thức, AI chỉ tạo bản nháp.

8. Không nên dùng API sinh văn bản để ra quyết định chuyên môn

API sinh văn bản không phù hợp để tự động:

Chẩn đoán.
Kê đơn.
Chỉ định xét nghiệm.
Ra quyết định điều trị.
Kết luận pháp lý chính thức.
Phê duyệt văn bản.

Trong bệnh viện, AI sinh văn bản phải đặt trong cơ chế kiểm tra của con người.

9. Ghi log request và response

Nên ghi:

User.
Thời gian.
Tác vụ.
Model.
Độ dài prompt.
Thời gian phản hồi.
Trạng thái lỗi.
Đánh giá người dùng.

Cần cân nhắc có ghi toàn bộ prompt/response hay không, vì có thể chứa dữ liệu nhạy cảm. Nếu ghi, phải phân quyền log chặt chẽ.

10. Kết luận

API sinh văn bản là API cơ bản và rất hữu ích để tích hợp Ollama vào các công cụ bệnh viện. Nó phù hợp với soạn thảo, tóm tắt, tạo bảng kiểm, báo cáo và phân tích văn bản một lượt. Tuy nhiên, cần có API trung gian để chuẩn hóa prompt, kiểm soát dữ liệu, ghi log, chọn model và đảm bảo AI chỉ đóng vai trò hỗ trợ, không thay thế con người trong quyết định chuyên môn hoặc văn bản chính thức.

Đăng nhập để gửi ý kiến