1. Đặt vấn đề
Dữ liệu là phần quyết định giá trị thực tế của AI local trong bệnh viện. Một model mạnh nhưng không có dữ liệu bệnh viện sẽ chỉ trả lời theo kiến thức chung. Một model vừa phải nhưng được kết nối với kho tài liệu nội bộ sạch, đúng phiên bản và có cấu trúc tốt có thể tạo ra giá trị lớn hơn nhiều.
Trong bệnh viện, dữ liệu không chỉ là hồ sơ bệnh án. Dữ liệu còn bao gồm quy trình, quy định, quy chế, biểu mẫu, hướng dẫn chuyên môn, phác đồ, văn bản pháp luật, kế hoạch, báo cáo, biên bản, tài liệu đào tạo, câu hỏi thường gặp và nhiều loại tài liệu quản trị. Đây là kho tri thức nội bộ mà AI local có thể khai thác để hỗ trợ nhân viên.
Tuy nhiên, không phải tài liệu nào cũng nên đưa ngay vào AI. Dữ liệu cần được phân loại, chuẩn hóa, kiểm tra hiệu lực, gắn metadata, phân quyền và cập nhật định kỳ.
2. Các nhóm dữ liệu phù hợp giai đoạn đầu
Trong giai đoạn đầu, bệnh viện nên ưu tiên các nhóm dữ liệu ít nhạy cảm nhưng có giá trị sử dụng cao:
- Quy trình nội bộ đã ban hành.
- Quy định, quy chế đang có hiệu lực.
- Biểu mẫu chuẩn.
- Hướng dẫn sử dụng phần mềm.
- Tài liệu đào tạo nhân viên.
- Bộ tiêu chí chất lượng.
- Văn bản pháp luật công khai.
- FAQ nội bộ.
- Tài liệu truyền thông giáo dục sức khỏe đã duyệt.
- SOP của các phòng ban.
Các tài liệu này thường không chứa dữ liệu người bệnh định danh, phù hợp để xây dựng chatbot tra cứu và RAG nội bộ.
3. Quy trình, quy định và quy chế
Đây là nhóm dữ liệu rất quan trọng. Bệnh viện vận hành dựa trên nhiều quy trình và quy định. Nếu nhân viên không tìm được hoặc hiểu sai quy trình, chất lượng thực hiện sẽ không đồng nhất.
AI local có thể giúp:
- Trả lời câu hỏi về quy trình.
- Tóm tắt các bước thực hiện.
- Xác định trách nhiệm từng bộ phận.
- Tìm biểu mẫu liên quan.
- So sánh phiên bản cũ và mới.
- Hỗ trợ đào tạo nhân viên mới.
- Gợi ý checklist giám sát tuân thủ.
Tuy nhiên, tài liệu phải có thông tin hiệu lực. Một quy trình cũ nếu chưa bị loại khỏi kho có thể làm AI trả lời sai.
4. Biểu mẫu
Biểu mẫu là nhóm tài liệu có giá trị thực tế cao. Nhiều nhân viên mất thời gian tìm đúng mẫu, điền đúng phần, biết mẫu dùng trong trường hợp nào. AI local có thể hỗ trợ:
- Tìm biểu mẫu theo tình huống.
- Giải thích mục đích biểu mẫu.
- Hướng dẫn cách điền.
- Liên kết biểu mẫu với quy trình tương ứng.
- Gợi ý danh sách biểu mẫu cần dùng trong một quy trình.
- Tạo bản nháp biểu mẫu nếu dữ liệu không nhạy cảm.
Cần quản lý phiên bản biểu mẫu chặt chẽ. Nếu có nhiều bản lưu rải rác, AI có thể truy xuất bản cũ.
5. Văn bản pháp luật và văn bản chỉ đạo
Bệnh viện thường phải tuân thủ nhiều văn bản pháp luật, thông tư, quyết định, công văn, hướng dẫn của Bộ Y tế, Sở Y tế, Bảo hiểm xã hội và các cơ quan liên quan. AI local có thể hỗ trợ tra cứu, tóm tắt và liên hệ văn bản với quy trình nội bộ.
Tuy nhiên, văn bản pháp luật cần cập nhật thường xuyên. Hệ thống phải ghi rõ nguồn, ngày ban hành, tình trạng hiệu lực nếu có. AI không được tự bịa căn cứ pháp lý. Khi thiếu nguồn, cần trả lời rằng chưa tìm thấy tài liệu phù hợp.
6. Hướng dẫn chuyên môn
Hướng dẫn chuyên môn, phác đồ, quy trình kỹ thuật và tài liệu đào tạo lâm sàng là nhóm dữ liệu có giá trị cao nhưng cũng rủi ro hơn. AI local có thể hỗ trợ tra cứu và tóm tắt, nhưng không được thay thế quyết định chuyên môn.
Với nhóm này, cần kiểm soát:
- Tài liệu có được phê duyệt không.
- Phiên bản còn hiệu lực không.
- Ai được quyền truy cập.
- Câu trả lời có cảnh báo giới hạn không.
- Có trích nguồn không.
- Có yêu cầu nhân viên y tế kiểm tra không.
Giai đoạn đầu, nên dùng AI để hỗ trợ nhân viên tra cứu tài liệu chuyên môn, không dùng để tư vấn trực tiếp cho người bệnh hoặc đưa ra quyết định điều trị.
7. Báo cáo, kế hoạch và biên bản
Nhóm này rất hữu ích cho quản trị và quản lý chất lượng. AI local có thể hỗ trợ tóm tắt, phân tích, rút ra vấn đề, gợi ý hành động và chuẩn hóa báo cáo.
Tuy nhiên, báo cáo và biên bản có thể chứa thông tin nhạy cảm: nhân sự, tài chính, sự cố, đánh giá khoa phòng, phản ánh. Vì vậy, cần phân quyền và ẩn danh khi cần.
Không nên đưa toàn bộ báo cáo nội bộ vào kho chung cho mọi người dùng.
8. Metadata dữ liệu
Mỗi tài liệu nên có metadata:
- Tên tài liệu.
- Mã tài liệu.
- Loại tài liệu.
- Đơn vị ban hành.
- Ngày ban hành.
- Ngày hiệu lực.
- Phiên bản.
- Tình trạng hiệu lực.
- Phạm vi áp dụng.
- Mức độ nhạy cảm.
- Nhóm người dùng được truy cập.
- Đường dẫn file gốc.
Metadata giúp hệ thống trả lời có nguồn, lọc theo quyền và tránh dùng tài liệu lỗi thời. Trong bệnh viện, metadata đôi khi quan trọng không kém nội dung tài liệu.
9. Làm sạch và chuẩn hóa dữ liệu
Trước khi đưa vào AI, tài liệu cần được làm sạch:
- Loại bỏ file trùng.
- Xác định bản mới nhất.
- Sửa lỗi OCR.
- Chuẩn hóa tiêu đề.
- Chuyển PDF scan sang text nếu cần.
- Kiểm tra lỗi font.
- Tách phụ lục, biểu mẫu.
- Loại bỏ dữ liệu không được phép.
- Gắn metadata.
- Phân loại thư mục.
Nếu dữ liệu đầu vào kém, hệ thống AI sẽ kém. Nguyên tắc là: dữ liệu rác tạo ra câu trả lời rác.
10. Phân quyền dữ liệu
Không phải mọi tài liệu đều dành cho mọi người. Cần phân quyền theo vai trò:
- Tài liệu công khai nội bộ.
- Tài liệu phòng ban.
- Tài liệu lãnh đạo.
- Tài liệu chuyên môn.
- Tài liệu sự cố.
- Tài liệu nhân sự.
- Tài liệu tài chính.
- Dữ liệu người bệnh.
Phân quyền phải được thực hiện ở lớp truy xuất. Nếu người dùng không có quyền xem tài liệu, hệ thống không được đưa tài liệu đó vào prompt. Không thể chỉ yêu cầu LLM “đừng tiết lộ” sau khi tài liệu đã được đưa vào ngữ cảnh.
11. Kết luận
Lớp dữ liệu bệnh viện là nguồn giá trị chính của AI local. Quy trình, quy định, biểu mẫu, văn bản pháp luật, hướng dẫn chuyên môn và tài liệu nội bộ nếu được tổ chức tốt sẽ biến AI local thành hệ thống trợ lý tri thức hữu ích.
Tuy nhiên, dữ liệu phải được quản trị nghiêm túc: phân loại, làm sạch, chuẩn hóa, gắn metadata, kiểm tra hiệu lực, phân quyền và cập nhật định kỳ. Một hệ thống AI local tốt bắt đầu từ một kho dữ liệu tốt.
- Đăng nhập để gửi ý kiến