Bài 4. Giai đoạn 4: Xây dựng RAG với tài liệu bệnh viện

1. Đặt vấn đề

Chatbot cơ bản có thể hỗ trợ soạn thảo và tóm tắt, nhưng nếu không có RAG, nó không thể trả lời chính xác theo tài liệu nội bộ của bệnh viện. Để AI trở thành trợ lý tri thức thật sự, cần xây dựng RAG với tài liệu bệnh viện. Đây là giai đoạn quan trọng nhất để chuyển từ “AI sinh văn bản” sang “AI trả lời có căn cứ”.

RAG giúp chatbot truy xuất quy trình, quy định, biểu mẫu, hướng dẫn, Bộ tiêu chí chất lượng, tài liệu đào tạo và văn bản pháp luật y tế trước khi trả lời. Nhờ đó, câu trả lời giảm bịa, có nguồn và phù hợp thực tế bệnh viện hơn.

2. Mục tiêu của giai đoạn 4

Mục tiêu gồm:

Chọn nhóm tài liệu ban đầu.
Làm sạch và chuẩn hóa tài liệu.
Gắn metadata.
Chia chunk.
Tạo embedding.
Lưu FAISS index.
Xây API truy xuất.
Kết nối RAG với chatbot.
Hiển thị nguồn.
Kiểm tra câu trả lời.
Cập nhật quy trình backup index.

3. Chọn tài liệu ban đầu

Không nên đưa tất cả tài liệu vào ngay. Nên chọn:

Quy trình còn hiệu lực.
Biểu mẫu dùng nhiều.
Quy định nội bộ chung.
Bộ tiêu chí chất lượng.
Hướng dẫn đánh giá.
FAQ nhân viên.
Tài liệu đào tạo cơ bản.
Văn bản pháp luật y tế quan trọng.
Mẫu kế hoạch/báo cáo.

Không đưa bản nháp, bản cũ, tài liệu trùng hoặc tài liệu nhạy cảm chưa phân quyền.

4. Làm sạch tài liệu

Cần xử lý:

Tách text từ Word/PDF.
Loại header/footer lặp.
Chuẩn hóa mã tài liệu.
Chuẩn hóa tiêu đề.
Loại trang trắng.
Loại nội dung lỗi mã hóa.
Tách bảng nếu cần.
Kiểm tra tiếng Việt.
Loại bản trùng.
Đánh dấu tài liệu hết hiệu lực.

Dữ liệu sạch giúp RAG chính xác hơn.

5. Metadata

Mỗi tài liệu cần có:

Tên tài liệu.
Mã tài liệu.
Loại tài liệu.
Đơn vị ban hành.
Ngày ban hành.
Ngày hiệu lực.
Phiên bản.
Tình trạng hiệu lực.
Phạm vi áp dụng.
Quyền truy cập.
Link file gốc.
Từ khóa.

Metadata giúp lọc quyền, lọc hiệu lực và hiển thị nguồn.

6. Chunking

Tài liệu cần chia nhỏ thành chunk. Cần chú ý:

Không chia đứt ý.
Giữ tiêu đề mục.
Giữ mã tài liệu.
Giữ vị trí trong tài liệu.
Chunk vừa đủ dài.
Có overlap hợp lý nếu cần.
Tách biểu mẫu và phụ lục phù hợp.

Chunk tốt quyết định khả năng truy xuất đúng.

7. Embedding và FAISS

Sau khi có chunk, tạo embedding và lưu vào FAISS. Cần lưu kèm mapping:

Vector ID.
Chunk ID.
Text chunk.
Metadata.
Source document.
Version.

Không được chỉ lưu vector mà mất metadata.

8. API RAG

API RAG cần thực hiện:

Nhận câu hỏi.
Xác thực người dùng.
Tạo embedding câu hỏi.
Tìm top-k chunk trong FAISS.
Lọc theo quyền và hiệu lực.
Có thể rerank.
Tạo prompt có nguồn.
Gọi Ollama.
Trả câu trả lời và nguồn.

Đây là lõi của chatbot tri thức bệnh viện.

9. Hiển thị nguồn

Câu trả lời cần hiển thị:

Tên tài liệu.
Mã tài liệu.
Phiên bản.
Ngày ban hành.
Đoạn liên quan.
Link mở file gốc.
Mức độ phù hợp nếu cần.

Nguồn giúp người dùng kiểm tra và tăng độ tin cậy.

10. Kiểm thử RAG

Cần có bộ câu hỏi:

Hỏi đúng quy trình.
Hỏi biểu mẫu.
Hỏi tiêu chí chất lượng.
Hỏi văn bản không có trong kho.
Hỏi tài liệu hết hiệu lực.
Hỏi tài liệu hạn chế quyền.
Hỏi câu cần trả lời “chưa đủ căn cứ”.

Kiểm thử giúp phát hiện lỗi truy xuất và lỗi prompt.

11. Cập nhật index

Cần quy trình:

Khi thêm tài liệu mới.
Khi sửa tài liệu.
Khi tài liệu hết hiệu lực.
Khi đổi quyền truy cập.
Khi đổi embedding model.
Khi rebuild toàn bộ index.

Không nên để index lỗi thời.

12. Đầu ra của giai đoạn 4

Cần có:

Kho tài liệu RAG ban đầu.
FAISS index.
Metadata.
API RAG.
Chatbot trả lời có nguồn.
Bộ câu hỏi kiểm thử.
Quy trình cập nhật index.
Backup FAISS và metadata.
Danh sách tài liệu còn thiếu.

13. Kết luận

Giai đoạn xây dựng RAG là bước biến AI local thành trợ lý tri thức bệnh viện. Thành công của RAG phụ thuộc nhiều vào chất lượng tài liệu, metadata, chunking, embedding, phân quyền và hiển thị nguồn. Giai đoạn này cần làm kỹ, vì nếu RAG sai, chatbot sẽ trả lời sai dù model mạnh. RAG tốt giúp AI local đáng tin và có giá trị thực tế trong bệnh viện.

Đăng nhập để gửi ý kiến