Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "HI.AI Members" các nội dung bạn quan tâm.

Bài 10. Chatbot có dữ liệu riêng bằng RAG

1. Đặt vấn đề

Chatbot có dữ liệu riêng bằng RAG là hướng triển khai quan trọng nhất nếu bệnh viện muốn chatbot trả lời theo tài liệu nội bộ. RAG giúp chatbot không chỉ dựa vào kiến thức tổng quát của model, mà truy xuất quy trình, quy định, biểu mẫu, văn bản, tiêu chí, SOP và tài liệu bệnh viện để tạo câu trả lời có căn cứ.

Đây là bước chuyển từ chatbot “hỏi gì cũng trả lời chung chung” sang chatbot “trợ lý tri thức nội bộ”.

2. RAG trong chatbot là gì?

RAG gồm hai phần:

  • Retrieval: tìm tài liệu liên quan.
  • Generation: dùng model sinh câu trả lời dựa trên tài liệu tìm được.

Luồng:

  1. Người dùng hỏi.
  2. Hệ thống tạo embedding cho câu hỏi.
  3. FAISS tìm các chunk liên quan.
  4. Hệ thống lọc quyền và hiệu lực tài liệu.
  5. Các chunk được đưa vào prompt.
  6. Model trả lời dựa trên nguồn.
  7. Chatbot hiển thị câu trả lời và nguồn.

3. Dữ liệu riêng gồm những gì?

Có thể gồm:

  • Quy trình.
  • Quy định.
  • Quy chế.
  • Biểu mẫu.
  • SOP.
  • Hướng dẫn chuyên môn đã duyệt.
  • Văn bản pháp luật.
  • Bộ tiêu chí chất lượng.
  • Tài liệu đào tạo.
  • FAQ nội bộ.
  • Hướng dẫn sử dụng phần mềm.
  • Kế hoạch và báo cáo được phép dùng.

Không nên đưa dữ liệu nhạy cảm vào kho chung.

4. Lợi ích của chatbot RAG

  • Trả lời theo tài liệu bệnh viện.
  • Có nguồn.
  • Giảm hallucination.
  • Dễ cập nhật tài liệu.
  • Không cần fine-tuning.
  • Hỗ trợ tra cứu tự nhiên.
  • Giúp nhân viên tìm đúng quy trình.
  • Có thể phân quyền theo tài liệu.

5. Yêu cầu chuẩn bị dữ liệu

Trước khi RAG, cần:

  • Thu thập tài liệu.
  • Loại bỏ bản cũ.
  • Xác định bản hiệu lực.
  • Làm sạch text.
  • Chia chunk.
  • Gắn metadata.
  • Phân quyền tài liệu.
  • Tạo embedding.
  • Lưu FAISS.
  • Kiểm tra truy xuất.

Dữ liệu càng sạch, chatbot càng tốt.

6. Prompt RAG

Prompt cần yêu cầu model:

  • Chỉ trả lời dựa trên tài liệu được cung cấp.
  • Không tự bịa nếu thiếu nguồn.
  • Nêu rõ khi không tìm thấy căn cứ.
  • Trích nguồn hoặc liệt kê tài liệu.
  • Trả lời ngắn gọn, có cấu trúc.

7. Hiển thị nguồn

Chatbot RAG phải hiển thị nguồn. Nguồn nên gồm:

  • Tên tài liệu.
  • Mã tài liệu nếu có.
  • Phiên bản.
  • Ngày ban hành.
  • Mục/trang/chunk.
  • Link tài liệu nếu có quyền.

Nguồn giúp người dùng kiểm tra và tăng tin cậy.

8. Xử lý tài liệu hết hiệu lực

RAG phải lọc:

  • Chỉ dùng tài liệu còn hiệu lực.
  • Hoặc nếu dùng tài liệu cũ, phải ghi rõ.
  • Ưu tiên phiên bản mới nhất.
  • Không trộn bản cũ và mới nếu mâu thuẫn.

Metadata hiệu lực rất quan trọng.

9. Đánh giá chatbot RAG

Cần đánh giá:

  • Tìm đúng tài liệu không?
  • Câu trả lời có đúng nguồn không?
  • Có bỏ sót ý không?
  • Có bịa ngoài nguồn không?
  • Có nói thiếu căn cứ không?
  • Có hiển thị nguồn rõ không?
  • Có tôn trọng phân quyền không?

10. Kết luận

Chatbot có dữ liệu riêng bằng RAG là hướng cốt lõi để xây dựng trợ lý tri thức bệnh viện. Nó giúp AI trả lời dựa trên quy trình, quy định và tài liệu nội bộ thay vì suy diễn. Tuy nhiên, RAG chỉ tốt khi dữ liệu sạch, metadata đầy đủ, phân quyền đúng và có cơ chế đánh giá chất lượng truy xuất.