Bài 4. Chọn model theo tác vụ: hỏi đáp, tóm tắt, viết văn bản, phân loại, trích xuất thông tin

1. Đặt vấn đề

Một trong những sai lầm phổ biến khi chọn model AI local là dùng một tiêu chí chung cho mọi tác vụ. Trong thực tế, mỗi tác vụ đòi hỏi năng lực khác nhau. Hỏi đáp cần hiểu câu hỏi và trả lời đúng trọng tâm. Tóm tắt cần giữ ý chính và không bịa thêm. Viết văn bản cần văn phong tốt và cấu trúc mạch lạc. Phân loại cần nhất quán. Trích xuất thông tin cần chính xác và đúng định dạng.

Trong bệnh viện, các tác vụ này xuất hiện rất thường xuyên. Vì vậy, chọn model theo tác vụ giúp hệ thống AI local hiệu quả hơn và ít rủi ro hơn.

2. Model cho hỏi đáp

Hỏi đáp là tác vụ phổ biến nhất của chatbot. Có hai loại hỏi đáp:

Hỏi đáp chung dựa trên kiến thức model.
Hỏi đáp dựa trên tài liệu nội bộ qua RAG.

Trong bệnh viện, nên ưu tiên hỏi đáp có RAG đối với quy trình, quy định, biểu mẫu và tài liệu nội bộ.

Model cho hỏi đáp cần:

Hiểu câu hỏi tiếng Việt.
Trả lời đúng trọng tâm.
Không lan man.
Biết nói không đủ căn cứ.
Bám tài liệu được cung cấp.
Có thể trình bày theo gạch đầu dòng.
Có giọng văn thận trọng.

Cần test bằng các câu hỏi thực tế như: “Khi người bệnh té ngã thì khoa cần báo cáo thế nào?”, “Biểu mẫu nào dùng cho khảo sát hài lòng?”, “Quy trình xử lý phản ánh gồm mấy bước?”.

3. Model cho tóm tắt

Tóm tắt là tác vụ rất hữu ích trong bệnh viện. Model cần rút ý chính từ văn bản dài mà không làm sai nghĩa.

Yêu cầu:

Giữ đúng nội dung gốc.
Không thêm thông tin không có trong tài liệu.
Phân biệt ý chính và chi tiết phụ.
Tóm tắt theo cấu trúc.
Có thể tạo bản tóm tắt ngắn hoặc dài theo yêu cầu.
Có thể tóm tắt cho từng đối tượng: lãnh đạo, nhân viên, người bệnh.

Tác vụ test:

Tóm tắt quy trình 5 trang.
Tóm tắt biên bản họp.
Tóm tắt báo cáo phản ánh.
Tóm tắt văn bản pháp luật.
Tóm tắt tài liệu chuyên môn.

Với tài liệu nhạy cảm, cần kiểm soát dữ liệu đầu vào.

4. Model cho viết văn bản

Viết văn bản là nhu cầu lớn trong bệnh viện. Model cần có văn phong phù hợp, logic và chuyên nghiệp.

Các loại văn bản:

Kế hoạch.
Báo cáo.
Công văn.
Tờ trình.
Quy trình.
Quy định.
Biên bản.
Thông báo.
Tài liệu đào tạo.
Nội dung truyền thông.

Yêu cầu:

Bố cục rõ.
Văn phong hành chính.
Không dùng từ quá hoa mỹ.
Không bịa số liệu.
Không bịa căn cứ pháp lý.
Biết phát triển ý từ gạch đầu dòng.
Biết giữ thuật ngữ bệnh viện.
Có thể viết dài và sâu.

Model viết văn bản nên được test bằng các bài thực tế. Ví dụ: viết kế hoạch cải tiến chất lượng giảm thời gian chờ khám; viết báo cáo tổng kết hoạt động quản lý chất lượng; viết quy trình tiếp nhận phản ánh.

5. Model cho phân loại

Phân loại là tác vụ gán nhãn cho dữ liệu. Trong bệnh viện, có thể phân loại:

Phản ánh người bệnh.
Sự cố y khoa đã ẩn danh.
Văn bản đến.
Tài liệu theo lĩnh vực.
Câu hỏi người dùng.
Mức độ ưu tiên xử lý.
Nhóm nguyên nhân.
Loại yêu cầu hỗ trợ CNTT.

Model phân loại cần nhất quán hơn là sáng tạo. Nên dùng temperature thấp. Có thể dùng model nhỏ hơn nếu nhãn rõ và prompt tốt.

Yêu cầu:

Trả về đúng danh sách nhãn.
Không tự tạo nhãn ngoài danh mục nếu không cho phép.
Có thể giải thích ngắn lý do.
Xử lý được dữ liệu tiếng Việt ngắn.
Ổn định khi chạy hàng loạt.

Với phân loại quy mô lớn, có thể cân nhắc fine-tuning hoặc model chuyên biệt sau khi có dữ liệu đủ tốt.

6. Model cho trích xuất thông tin

Trích xuất thông tin là lấy các trường cụ thể từ văn bản. Ví dụ:

Tên văn bản.
Số văn bản.
Ngày ban hành.
Đơn vị ban hành.
Mục tiêu kế hoạch.
Chỉ tiêu.
Người phụ trách.
Thời hạn.
Biểu mẫu liên quan.
Nhóm vấn đề trong phản ánh.

Model trích xuất cần chính xác và tuân thủ định dạng. Nên yêu cầu output dạng JSON hoặc bảng, nhưng phải kiểm tra vì LLM có thể tạo JSON lỗi nếu prompt không tốt.

Yêu cầu:

Không bịa trường thiếu.
Trả về null hoặc “không tìm thấy” khi thiếu.
Giữ nguyên nội dung trích nếu cần.
Không tự sửa sai quá mức.
Có thể xử lý nhiều định dạng văn bản.

Trong bệnh viện, trích xuất rất hữu ích để tự động hóa phân loại tài liệu, nhập metadata hoặc chuẩn hóa kho văn bản.

7. Model cho phân tích

Một số tác vụ cần phân tích sâu:

Phân tích nguyên nhân gốc rễ.
Phân tích khoảng cách so với tiêu chí chất lượng.
Phân tích rủi ro.
Phân tích quy trình.
Phân tích phản ánh người bệnh.
Phân tích điểm yếu trong kế hoạch.

Model cần khả năng lập luận và tổ chức ý tốt. Thường model lớn hơn hoặc chất lượng cao hơn sẽ tốt hơn. Tuy nhiên, phân tích trong bệnh viện cần có dữ liệu đúng. Nếu dữ liệu đầu vào thiếu, model có thể suy diễn.

8. Có nên dùng một model cho tất cả tác vụ?

Giai đoạn đầu có thể dùng một model chính để đơn giản vận hành. Nhưng khi hệ thống phát triển, nên tách theo tác vụ:

Model nhanh cho phân loại.
Model tốt cho viết văn bản.
Model chính cho chatbot RAG.
Embedding model riêng.
Reranker riêng.
Model thử nghiệm riêng.

Tách model giúp tối ưu chi phí tài nguyên và chất lượng.

9. Cách đánh giá theo tác vụ

Bệnh viện nên tạo bộ test riêng cho từng tác vụ. Không nên dùng một câu hỏi chung để đánh giá tất cả.

Ví dụ:

Hỏi đáp: 30 câu hỏi có đáp án nguồn.
Tóm tắt: 10 tài liệu dài.
Viết văn bản: 10 đề bài thực tế.
Phân loại: 100 phản ánh đã gán nhãn chuẩn.
Trích xuất: 50 văn bản có metadata chuẩn.

Kết quả đánh giá cần ghi lại thành bảng để so sánh model.

10. Kết luận

Chọn model theo tác vụ giúp bệnh viện sử dụng AI local hiệu quả hơn. Hỏi đáp, tóm tắt, viết văn bản, phân loại và trích xuất thông tin có yêu cầu khác nhau. Không nên kỳ vọng một model tốt ở mọi mặt. Giai đoạn đầu có thể dùng một model chính, nhưng về lâu dài nên đánh giá và phân nhóm model theo chức năng.

Đăng nhập để gửi ý kiến

1. Đặt vấn đề

2. Model cho hỏi đáp

3. Model cho tóm tắt

4. Model cho viết văn bản

5. Model cho phân loại

6. Model cho trích xuất thông tin

7. Model cho phân tích

8. Có nên dùng một model cho tất cả tác vụ?

9. Cách đánh giá theo tác vụ

10. Kết luận

Vì Sao Tôi Không Tin Các AI Agent Hoạt Động Độc Lập Nếu Không Có Giám Sát Nghiêm Ngặt

Thúy Hường

Câu hỏi, thảo luận