Chương 3. Kiến trúc tổng thể hệ thống AI local cho bệnh viện

Giới thiệu chương

Sau khi đã hiểu tổng quan về AI local và các khái niệm kỹ thuật nền tảng, bệnh viện cần nhìn hệ thống AI local như một kiến trúc tổng thể, không phải như một phần mềm đơn lẻ. Đây là điểm rất quan trọng. Nhiều đơn vị khi bắt đầu triển khai AI thường chỉ tập trung vào việc “cài model”, “cài Ollama”, “chạy thử chatbot” hoặc “hỏi đáp được tiếng Việt”. Những việc này cần thiết, nhưng chưa đủ để tạo thành một hệ thống AI local có thể vận hành trong môi trường bệnh viện.

Bệnh viện là một môi trường phức tạp. Một hệ thống AI local nếu muốn sử dụng thực tế phải liên quan đến nhiều lớp: phần cứng, hệ điều hành, công cụ vận hành model, model AI, dữ liệu nội bộ, hệ thống truy xuất tri thức, API tích hợp, giao diện người dùng, bảo mật, phân quyền, ghi log, giám sát, đánh giá chất lượng và quy trình vận hành. Nếu thiếu một trong các lớp quan trọng này, hệ thống có thể vẫn chạy được về mặt kỹ thuật nhưng khó sử dụng an toàn, khó mở rộng và khó duy trì.

Chương 3 vì vậy tập trung vào kiến trúc tổng thể. Mục tiêu không phải là đi sâu ngay vào từng câu lệnh cài đặt, mà là giúp bệnh viện hình dung được toàn bộ hệ thống AI local cần có những thành phần nào, các thành phần này liên hệ với nhau ra sao, lớp nào giữ vai trò nền tảng, lớp nào xử lý dữ liệu, lớp nào cung cấp dịch vụ cho người dùng và lớp nào kiểm soát rủi ro.

Có thể hình dung hệ thống AI local bệnh viện như một kiến trúc nhiều tầng. Ở tầng thấp nhất là phần cứng: máy chủ AI, GPU, RAM, SSD, HDD, UPS và hạ tầng mạng. Trên đó là hệ điều hành, thường là Ubuntu Server hoặc môi trường Linux tương đương. Tiếp theo là lớp vận hành model như Ollama, llama.cpp, vLLM hoặc LM Studio. Bên trên là lớp model gồm LLM, embedding model, reranker và vision-language model nếu cần. Song song với model là lớp dữ liệu bệnh viện: quy trình, quy định, biểu mẫu, văn bản pháp luật, hướng dẫn chuyên môn, tài liệu đào tạo và các nguồn dữ liệu có kiểm soát. Để khai thác dữ liệu này, cần lớp truy xuất tri thức như RAG, FAISS và hybrid search. Để đưa AI vào công việc thật, cần lớp tích hợp qua API, Drupal, website nội bộ, dashboard, chatbot hoặc phần mềm quản lý chất lượng. Toàn bộ hệ thống phải được bảo vệ bởi lớp bảo mật gồm phân quyền, ghi log, kiểm soát truy cập và ẩn danh dữ liệu. Cuối cùng, cần lớp giám sát và đánh giá chất lượng câu trả lời để bảo đảm hệ thống không chỉ “trả lời được”, mà còn trả lời đúng, có căn cứ, hữu ích và an toàn.

Trong bệnh viện, kiến trúc AI local không thể chỉ được thiết kế bởi phòng Công nghệ thông tin theo logic kỹ thuật thuần túy. Nó cần sự tham gia của lãnh đạo bệnh viện, phòng Quản lý chất lượng, phòng Kế hoạch tổng hợp, phòng Điều dưỡng, các khoa lâm sàng, cận lâm sàng và các đơn vị sử dụng. Lý do là AI local không chỉ xử lý máy chủ, model và API; nó xử lý tri thức bệnh viện. Muốn hệ thống trả lời đúng quy trình, phải có người kiểm tra quy trình. Muốn hệ thống hỗ trợ quản lý chất lượng, phải có người hiểu tiêu chí và minh chứng. Muốn hệ thống bảo mật, phải có người xác định dữ liệu nào nhạy cảm, ai được quyền xem, ai không được quyền xem.

Một kiến trúc tốt không nhất thiết phải phức tạp ngay từ đầu. Bệnh viện có thể bắt đầu bằng kiến trúc tối thiểu: một máy chủ AI local, Ubuntu Server, Ollama, một hoặc hai model phù hợp, một chatbot nội bộ đơn giản và một kho tài liệu thử nghiệm. Sau đó, khi nhu cầu tăng lên, bệnh viện có thể bổ sung FAISS, RAG, API trung gian, phân quyền người dùng, log, dashboard, tích hợp Drupal, tích hợp hệ thống QMS và cơ chế đánh giá chất lượng. Điều quan trọng là ngay từ đầu phải thiết kế theo hướng có thể mở rộng, không làm theo kiểu thử nghiệm rời rạc rồi sau đó khó nâng cấp.

Chương này sẽ giúp người đọc hình dung toàn bộ bức tranh kiến trúc. Sau chương này, bệnh viện cần có khả năng trả lời các câu hỏi căn bản: một hệ thống AI local cần những lớp nào, máy chủ AI đóng vai trò gì, GPU và RAM ảnh hưởng ra sao, Ollama nằm ở đâu trong kiến trúc, model nào phục vụ nhiệm vụ nào, tài liệu bệnh viện được đưa vào hệ thống như thế nào, RAG và FAISS nằm ở đâu, API kết nối với Drupal hoặc chatbot ra sao, bảo mật cần kiểm soát ở những điểm nào, và làm thế nào để đánh giá chất lượng câu trả lời.

Đăng nhập để gửi ý kiến

Chương 3. Kiến trúc tổng thể hệ thống AI local cho bệnh viện

Giới thiệu chương

Vì Sao Tôi Không Tin Các AI Agent Hoạt Động Độc Lập Nếu Không Có Giám Sát Nghiêm Ngặt

Thúy Hường

Câu hỏi, thảo luận