Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 8. Câu trả lời tiếng Việt chưa tốt

1. Đặt vấn đề

Bệnh viện Việt Nam sử dụng tiếng Việt trong hầu hết văn bản quản trị, quy trình, báo cáo, biểu mẫu, tài liệu đào tạo và giao tiếp nội bộ. Nếu model trả lời tiếng Việt chưa tốt, câu văn lủng củng, thuật ngữ sai, văn phong không phù hợp, người dùng sẽ khó chấp nhận hệ thống dù kỹ thuật chạy ổn.

Lỗi tiếng Việt chưa tốt có thể do model chưa mạnh về tiếng Việt, prompt chưa rõ, dữ liệu RAG kém, temperature chưa phù hợp, hoặc yêu cầu đầu ra chưa được định nghĩa.

2. Biểu hiện thường gặp

  • Câu tiếng Việt không tự nhiên.
  • Dùng từ sai ngữ cảnh bệnh viện.
  • Lẫn tiếng Anh không cần thiết.
  • Văn phong quá chung chung.
  • Dịch máy cứng.
  • Sai thuật ngữ chuyên môn.
  • Không giữ được văn phong hành chính.
  • Bảng kiểm viết câu hỏi mơ hồ.
  • Nội dung dài nhưng rỗng.
  • Dùng từ quá quảng cáo hoặc quá cảm tính.

3. Nguyên nhân do model

Không phải model nào cũng tốt tiếng Việt. Một số model mạnh tiếng Anh nhưng tiếng Việt yếu. Một số model viết được tiếng Việt nhưng không tốt trong văn bản hành chính bệnh viện. Một số model nhỏ trả lời nhanh nhưng lập luận và văn phong hạn chế.

Cần benchmark model bằng tác vụ tiếng Việt thực tế của bệnh viện, không chỉ hỏi câu đơn giản.

4. Nguyên nhân do prompt

Prompt quá chung sẽ cho câu trả lời chung. Ví dụ:

 
Viết bảng kiểm về vệ sinh tay.
 

sẽ kém hơn:

 
Hãy viết bảng kiểm giám sát tuân thủ vệ sinh tay trong bệnh viện. Mỗi câu hỏi phải cụ thể, quan sát được, trả lời Có/Không, tránh dùng từ chung chung như “đảm bảo”, “đầy đủ”. Chia theo các nhóm: trước chăm sóc người bệnh, trong chăm sóc, sau chăm sóc, điều kiện phương tiện.
 

Prompt rõ giúp tiếng Việt và cấu trúc tốt hơn.

5. Nguyên nhân do dữ liệu nguồn

Nếu tài liệu nguồn lỗi chính tả, OCR sai, định dạng hỏng, câu văn cũ hoặc quá rối, AI có thể trả lời kém. RAG tốt cần tài liệu sạch.

6. Cách cải thiện bằng model

Có thể:

  • Thử model khác mạnh tiếng Việt hơn.
  • Dùng model lớn hơn cho tác vụ viết dài.
  • Dùng model nhỏ cho tác vụ đơn giản.
  • Benchmark trên bộ câu hỏi bệnh viện.
  • Chọn model theo tác vụ, không dùng một model cho mọi việc.

7. Cách cải thiện bằng prompt

Cần yêu cầu rõ:

  • Viết bằng tiếng Việt.
  • Văn phong chuyên nghiệp, phù hợp bệnh viện.
  • Tránh từ chung chung.
  • Không lẫn tiếng Anh nếu không cần.
  • Dùng thuật ngữ thống nhất.
  • Viết theo cấu trúc.
  • Không bịa số liệu.
  • Câu ngắn, rõ, hành động được.

8. Chuẩn hóa thuật ngữ

Nên có bảng thuật ngữ nội bộ:

  • Quản lý chất lượng.
  • An toàn người bệnh.
  • Kiểm soát nhiễm khuẩn.
  • Điều dưỡng.
  • HIS, EMR, LIS, PACS.
  • RAG, FAISS, embedding.
  • Quy trình, quy định, biểu mẫu.

Prompt hoặc RAG có thể đưa thuật ngữ chuẩn vào khi cần.

9. Tạo template đầu ra

Với các tác vụ lặp lại, dùng template:

  • Kế hoạch.
  • Báo cáo.
  • Bảng kiểm.
  • Biên bản.
  • Tờ trình.
  • Phiếu hướng dẫn người bệnh.
  • FAQ.
  • SOP.

Template giúp model viết nhất quán hơn.

10. Giảm temperature

Nếu câu trả lời quá bay bổng hoặc thiếu ổn định, có thể giảm temperature. Với văn bản bệnh viện, thường nên ưu tiên ổn định, rõ ràng hơn sáng tạo.

11. Kết luận

Câu trả lời tiếng Việt chưa tốt là lỗi thường gặp nhưng có thể cải thiện bằng chọn model phù hợp, prompt rõ, dữ liệu sạch, thuật ngữ chuẩn, template đầu ra và cấu hình ổn định. Trong bệnh viện, tiếng Việt tốt không chỉ là đúng ngữ pháp, mà còn phải đúng văn phong hành chính, đúng thuật ngữ chuyên môn và dùng được trong công việc thật.