AI Local với Ollama trong bệnh viện: Triển khai model AI nội bộ phục vụ quản trị, chuyên môn và cải tiến chất lượng

Trí tuệ nhân tạo đang bước vào giai đoạn phát triển rất nhanh, không chỉ trong lĩnh vực công nghệ mà còn lan rộng sang y tế, giáo dục, hành chính, quản trị và dịch vụ công. Trong bệnh viện, AI có thể hỗ trợ nhiều công việc thiết thực như tra cứu quy trình, tóm tắt văn bản, soạn thảo báo cáo, hỗ trợ quản lý chất lượng, phân tích sự cố, xây dựng bảng kiểm, hỗ trợ đào tạo nhân viên, khai thác kho tài liệu nội bộ và từng bước kết nối với các hệ thống phần mềm bệnh viện.

Tuy nhiên, khi nói đến AI trong bệnh viện, vấn đề quan trọng nhất không chỉ là “AI có thông minh hay không”, mà là AI được triển khai ở đâu, dữ liệu có an toàn không, ai kiểm soát hệ thống, ai chịu trách nhiệm về kết quả đầu ra và bệnh viện có chủ động được công nghệ hay không.

Chính từ yêu cầu đó, khái niệm AI local ngày càng có ý nghĩa thực tiễn đối với bệnh viện.

1. AI local là gì và vì sao bệnh viện cần quan tâm?

AI local có thể hiểu đơn giản là mô hình trí tuệ nhân tạo được triển khai và vận hành trên hạ tầng máy chủ riêng của đơn vị, thay vì phụ thuộc hoàn toàn vào các dịch vụ AI trực tuyến trên nền tảng đám mây. Với AI local, bệnh viện có thể cài đặt model, lưu trữ dữ liệu, xây dựng kho tri thức, thiết lập phân quyền và tích hợp với các phần mềm nội bộ ngay trong hệ thống của mình.

Điều này đặc biệt quan trọng với bệnh viện vì dữ liệu y tế là loại dữ liệu nhạy cảm. Bệnh viện có rất nhiều nhóm dữ liệu cần được bảo vệ nghiêm ngặt như hồ sơ bệnh án, thông tin người bệnh, kết quả xét nghiệm, chẩn đoán hình ảnh, báo cáo sự cố y khoa, quy trình chuyên môn, văn bản nội bộ và các dữ liệu quản trị. Nếu triển khai AI không kiểm soát tốt, bệnh viện có thể đối mặt với nguy cơ rò rỉ thông tin, sử dụng sai mục đích, trả lời sai căn cứ hoặc lệ thuộc vào nền tảng bên ngoài.

AI local không có nghĩa là phủ nhận AI cloud. Ngược lại, trong tương lai, bệnh viện có thể cần cả ba mô hình: AI cloud, AI local và AI hybrid. Tuy nhiên, đối với các bài toán liên quan đến dữ liệu nội bộ, tài liệu quản lý, quy trình bệnh viện, văn bản chuyên môn và thông tin nhạy cảm, AI local là hướng đi đáng được ưu tiên nghiên cứu, thử nghiệm và triển khai từng bước.

2. Vì sao chọn Ollama làm điểm khởi đầu?

Trong chuyên đề này, trọng tâm trước mắt là Ollama – một công cụ giúp cài đặt, quản lý và chạy các model AI local tương đối thuận tiện. Ollama phù hợp cho giai đoạn khởi đầu vì cách sử dụng đơn giản, dễ cài đặt trên Linux, có thể chạy nhiều model phổ biến, hỗ trợ API và dễ tích hợp với các ứng dụng nội bộ.

Với Ollama, bệnh viện có thể từng bước thực hiện các nhiệm vụ như:

Chạy thử các model ngôn ngữ lớn trên máy chủ riêng.
Tạo trợ lý AI nội bộ cho từng nhóm công việc.
Tích hợp AI vào website, Drupal, hệ thống quản lý chất lượng hoặc các ứng dụng nội bộ.
Xây dựng chatbot tra cứu quy trình, quy định, văn bản pháp luật, hướng dẫn chuyên môn.
Kết hợp với RAG và FAISS để tạo hệ thống hỏi đáp dựa trên tài liệu thật của bệnh viện.

Tạo nền tảng ban đầu trước khi mở rộng sang các công nghệ mạnh hơn như llama.cpp, vLLM, vector database chuyên dụng, mô hình đa phương thức hoặc hệ thống AI nhiều tác nhân.

Điểm quan trọng là Ollama giúp bệnh viện bắt đầu được ngay, không cần chờ một hệ thống quá phức tạp. Từ một máy chủ AI local, bệnh viện có thể thử nghiệm mô hình, đánh giá hiệu năng, kiểm tra chất lượng câu trả lời, xây dựng quy chế sử dụng và dần dần chuẩn hóa thành hệ thống phục vụ thực tế.

3. AI local trong bệnh viện không chỉ là chatbot

Khi nhắc đến AI, nhiều người thường nghĩ ngay đến chatbot. Tuy nhiên, trong môi trường bệnh viện, AI local không nên được hiểu quá hẹp như một công cụ hỏi đáp thông thường. Giá trị thực sự của AI local nằm ở khả năng trở thành một lớp trí tuệ hỗ trợ vận hành bệnh viện.

AI local có thể hỗ trợ nhiều nhóm nhiệm vụ:

Quản trị bệnh viện: hỗ trợ xây dựng kế hoạch, báo cáo, đề án, quy chế, phân tích văn bản, tổng hợp biên bản họp, chuẩn hóa biểu mẫu và hỗ trợ lãnh đạo bệnh viện tra cứu thông tin quản trị.

Quản lý chất lượng: hỗ trợ tra cứu Bộ tiêu chí chất lượng bệnh viện, lập kế hoạch cải tiến, xây dựng bảng kiểm giám sát, phân tích nguyên nhân gốc rễ, tổng hợp báo cáo sự cố, hỗ trợ triển khai 5S, Lean, Kaizen và quản lý trực quan.

Kế hoạch tổng hợp: hỗ trợ tổng hợp dữ liệu hoạt động, soạn thảo báo cáo chuyên môn, chuẩn hóa quy trình, phân tích văn bản chỉ đạo và xây dựng kế hoạch công tác.

Điều dưỡng: hỗ trợ xây dựng bảng kiểm chăm sóc, hướng dẫn quy trình kỹ thuật, tài liệu đào tạo, nội dung giám sát tuân thủ và chuẩn hóa biểu mẫu chuyên môn.

Kiểm soát nhiễm khuẩn: hỗ trợ tra cứu quy trình, xây dựng checklist, biên soạn tài liệu truyền thông, phân tích tuân thủ vệ sinh tay, quản lý chất thải và phòng ngừa nhiễm khuẩn bệnh viện.

Công nghệ thông tin: hỗ trợ tài liệu hóa cấu hình hệ thống, viết hướng dẫn sử dụng, hỗ trợ xử lý lỗi, tạo script, phân tích log và tích hợp API.

Công tác xã hội, chăm sóc khách hàng và truyền thông giáo dục sức khỏe: hỗ trợ soạn nội dung tư vấn, kịch bản truyền thông, câu hỏi thường gặp, hướng dẫn người bệnh và tài liệu phổ biến kiến thức sức khỏe.

Như vậy, AI local không chỉ là “một con bot trả lời câu hỏi”, mà có thể trở thành nền tảng hỗ trợ tri thức nội bộ cho bệnh viện.

4. Vai trò của RAG và FAISS trong bệnh viện

Một trong những hạn chế lớn của các model AI là có thể trả lời sai, trả lời chung chung hoặc “bịa” thông tin nếu không được cung cấp tài liệu đáng tin cậy. Trong bệnh viện, điều này đặc biệt nguy hiểm vì thông tin sai có thể ảnh hưởng đến quy trình chuyên môn, quản lý chất lượng, an toàn người bệnh và trách nhiệm pháp lý.

Do đó, chuyên đề này không chỉ tập trung vào việc chạy model bằng Ollama, mà còn nhấn mạnh đến RAG – Retrieval-Augmented Generation, tức là phương pháp kết hợp AI với truy xuất tài liệu. Thay vì để model trả lời hoàn toàn dựa trên kiến thức đã học, hệ thống sẽ tìm kiếm các tài liệu liên quan trong kho tri thức của bệnh viện, sau đó đưa phần nội dung phù hợp vào prompt để model trả lời có căn cứ hơn.

Trong kiến trúc này, FAISS đóng vai trò quan trọng trong việc lưu trữ và tìm kiếm vector. Các tài liệu như quy trình, quy định, hướng dẫn chuyên môn, văn bản pháp luật, biểu mẫu, báo cáo, checklist và tài liệu đào tạo có thể được xử lý, chia nhỏ thành các đoạn, tạo embedding và đưa vào FAISS. Khi người dùng đặt câu hỏi, hệ thống sẽ tìm các đoạn tài liệu liên quan nhất rồi chuyển cho model AI sinh câu trả lời.

Đây là hướng tiếp cận rất phù hợp với bệnh viện, vì bệnh viện không chỉ cần AI “nói hay”, mà cần AI trả lời đúng theo tài liệu, đúng phạm vi, đúng thẩm quyền và có thể truy vết nguồn thông tin.

5. Hạ tầng AI local: từ máy chủ đến ứng dụng thực tế

Một hệ thống AI local trong bệnh viện cần có nền tảng hạ tầng phù hợp. Về phần cứng, máy chủ cần đủ CPU, RAM, GPU, ổ cứng và nguồn điện ổn định để chạy model, xử lý tài liệu, tạo embedding, lưu vector và phục vụ nhiều người dùng nội bộ. Ví dụ, một cấu hình máy chủ chuyên dụng có thể bao gồm case server SuperMicro GPU 7049GP-TR, mainboard X11DPG-QT, nguồn 2000W x 2, CPU Intel Xeon Platinum 8171M, RAM ECC Registered và SSD NVMe PCIe 2TB làm nền tảng ban đầu cho hệ thống AI local .

Tuy nhiên, phần cứng chỉ là một phần. Để triển khai AI local có hiệu quả, bệnh viện cần quan tâm đầy đủ đến các lớp sau:

Lớp hệ điều hành, thường là Ubuntu Server hoặc Linux server.
Lớp vận hành model, trước mắt là Ollama.
Lớp model, bao gồm LLM, embedding model, reranker và về sau có thể có vision-language model.
Lớp dữ liệu, gồm tài liệu nội bộ, văn bản pháp luật, quy trình, biểu mẫu, hướng dẫn chuyên môn.
Lớp truy xuất tri thức, gồm RAG, FAISS và các cơ chế tìm kiếm.
Lớp ứng dụng, gồm chatbot, API, Drupal, website nội bộ, hệ thống QMS hoặc dashboard.
Lớp bảo mật, gồm phân quyền, xác thực, log, giám sát và kiểm soát truy cập.
Lớp quản trị vận hành, gồm backup, cập nhật model, theo dõi hiệu năng, xử lý lỗi và đánh giá chất lượng.

Nếu thiếu một trong các lớp này, AI local dễ rơi vào tình trạng “chạy thử thì được, nhưng không vận hành bền vững được”.

6. Những nguyên tắc quan trọng khi đưa AI local vào bệnh viện

AI local trong bệnh viện cần được triển khai theo hướng thận trọng, có kiểm soát và có lộ trình. Không nên xem AI là công cụ thay thế nhân viên y tế hoặc thay thế quyết định chuyên môn. AI nên được xác định là công cụ hỗ trợ, giúp nhân viên bệnh viện làm việc nhanh hơn, tra cứu tốt hơn, chuẩn hóa văn bản tốt hơn và giảm tải các công việc lặp lại.

Một số nguyên tắc cần nhấn mạnh ngay từ đầu:

AI không thay thế trách nhiệm chuyên môn của bác sĩ, điều dưỡng, dược sĩ, kỹ thuật viên hoặc cán bộ quản lý.
Các câu trả lời liên quan đến chuyên môn y tế cần được kiểm tra bởi người có thẩm quyền.
Không đưa dữ liệu cá nhân, dữ liệu bệnh án hoặc dữ liệu nhạy cảm vào hệ thống nếu chưa có cơ chế kiểm soát phù hợp.
Không mở trực tiếp API Ollama ra Internet.
Cần có lớp xác thực, phân quyền và ghi log khi tích hợp với phần mềm bệnh viện.
Cần đánh giá chất lượng câu trả lời trước khi triển khai cho người dùng thật.
Cần xây dựng quy chế sử dụng AI trong bệnh viện.
Cần đào tạo người dùng để hiểu đúng: AI là công cụ hỗ trợ, không phải nguồn quyết định cuối cùng.

7. Mục tiêu của chuyên đề

Chuyên đề “AI Local với Ollama trong bệnh viện” được xây dựng nhằm giúp lãnh đạo bệnh viện, phòng công nghệ thông tin, phòng quản lý chất lượng, phòng kế hoạch tổng hợp và các đơn vị chuyên môn hiểu được cách tiếp cận thực tế để triển khai AI nội bộ.

Chuyên đề không đi theo hướng lý thuyết thuần túy, mà tập trung vào các câu hỏi thực hành:

AI local là gì và bệnh viện có nên triển khai không?
Ollama giúp bệnh viện bắt đầu như thế nào?
Cần chọn model nào cho từng nhóm công việc?
Cài đặt Ollama trên Ubuntu Server ra sao?
Làm thế nào để gọi Ollama qua API?
Làm sao xây dựng chatbot nội bộ cho bệnh viện?
Làm sao kết hợp Ollama với RAG và FAISS?
Làm sao đưa tài liệu bệnh viện vào hệ thống AI để hỏi đáp có căn cứ?
Làm sao bảo mật dữ liệu, phân quyền người dùng và kiểm soát rủi ro?
Làm sao đánh giá hiệu quả triển khai AI local trong bệnh viện?
Làm sao mở rộng từ một mô hình thử nghiệm thành hệ thống dùng thật?

8. Đối tượng phù hợp với chuyên đề

Chuyên đề này phù hợp với nhiều nhóm đối tượng trong bệnh viện:

Lãnh đạo bệnh viện muốn hiểu định hướng ứng dụng AI trong quản trị và vận hành.
Phòng Công nghệ thông tin cần triển khai máy chủ AI, model, API, bảo mật và tích hợp phần mềm.
Phòng Quản lý chất lượng cần ứng dụng AI vào tự đánh giá, cải tiến chất lượng, bảng kiểm, báo cáo sự cố và chuẩn hóa quy trình.
Phòng Kế hoạch tổng hợp cần hỗ trợ tổng hợp báo cáo, văn bản, kế hoạch và tài liệu chuyên môn.
Phòng Điều dưỡng, Kiểm soát nhiễm khuẩn, Dược, Dinh dưỡng, Hành chính quản trị, Tài chính kế toán, Vật tư thiết bị y tế và các khoa lâm sàng, cận lâm sàng muốn khai thác AI để hỗ trợ công việc thường ngày.
Các đơn vị đang xây dựng hệ sinh thái phần mềm nội bộ, website bệnh viện, hệ thống QMS hoặc kho tri thức số.

9. Lộ trình tiếp cận của chuyên đề

Chuyên đề sẽ đi từ nền tảng đến thực hành. Trước hết, người đọc sẽ được giới thiệu tổng quan về AI local, vai trò của model AI local trong bệnh viện và những khái niệm kỹ thuật cần biết. Tiếp theo là phần cài đặt Ollama, lựa chọn model, chạy thử model, tùy biến bằng Modelfile và gọi API.

Sau đó, chuyên đề đi vào phần quan trọng hơn: xây dựng hệ thống AI có dữ liệu riêng của bệnh viện bằng RAG và FAISS. Đây là nền tảng để chuyển từ một chatbot thông thường sang một trợ lý tri thức nội bộ có khả năng trả lời dựa trên tài liệu thật.

Các chương sau sẽ mở rộng sang ứng dụng theo từng lĩnh vực: quản trị bệnh viện, quản lý chất lượng, hoạt động chuyên môn, phòng chức năng, khoa lâm sàng, khoa cận lâm sàng, công tác xã hội, chăm sóc khách hàng và truyền thông giáo dục sức khỏe.

Cuối cùng, chuyên đề trình bày các nội dung về bảo mật, pháp lý, đạo đức, vận hành, tối ưu hiệu năng, xử lý lỗi, đánh giá hiệu quả và lộ trình triển khai AI local trong bệnh viện.

10. Kết luận

AI local là một hướng đi quan trọng đối với bệnh viện trong giai đoạn chuyển đổi số và ứng dụng trí tuệ nhân tạo. Nếu được triển khai đúng cách, AI local có thể giúp bệnh viện chủ động hơn về công nghệ, bảo vệ dữ liệu tốt hơn, khai thác hiệu quả kho tài liệu nội bộ, hỗ trợ nhân viên y tế và nâng cao năng lực quản trị.

Ollama là một điểm khởi đầu phù hợp vì dễ tiếp cận, dễ triển khai, có thể chạy nhiều model AI local và có khả năng tích hợp với các hệ thống nội bộ thông qua API. Khi kết hợp Ollama với RAG, FAISS, quy trình bảo mật và lộ trình triển khai phù hợp, bệnh viện có thể từng bước xây dựng một hệ thống AI nội bộ phục vụ thiết thực cho quản trị, chuyên môn và cải tiến chất lượng.

Chuyên đề này vì vậy không chỉ nhằm giới thiệu một công cụ kỹ thuật, mà hướng đến một mục tiêu rộng hơn: giúp bệnh viện làm chủ năng lực ứng dụng AI local một cách an toàn, thực tế, có kiểm soát và phù hợp với đặc thù ngành y tế.

MỤC LỤC

Lời nói đầu
1. Tổng quan về AI local trong bệnh viện
1.1. AI local là gì?
1.2. Vì sao bệnh viện cần quan tâm đến AI local?
1.3. Sự khác nhau giữa AI cloud và AI local trong môi trường bệnh viện
1.4. Các mô hình triển khai AI trong bệnh viện: cloud, local, hybrid
1.5. Lợi ích của AI local đối với bệnh viện
1.6. Những rủi ro khi bệnh viện phụ thuộc hoàn toàn vào AI cloud
1.7. AI local và yêu cầu bảo mật dữ liệu y tế
1.8. AI local có thay thế hệ thống HIS, EMR, LIS, PACS không?
1.9. Các nhóm ứng dụng phù hợp với AI local trong bệnh viện
2. Nền tảng kỹ thuật cần biết về AI local
2.1. Mô hình ngôn ngữ lớn là gì?
2.2. Model AI local là gì?
2.3. Các nhóm model thường dùng: LLM, embedding model, reranker, vision model
2.4. Tham số mô hình: 1B, 3B, 7B, 8B, 14B, 32B, 70B
2.5. Token, context window và giới hạn ngữ cảnh
2.6. Quantization: GGUF, Q4, Q5, Q8 và ý nghĩa khi triển khai tại bệnh viện
2.7. CPU, GPU, RAM, VRAM và tốc độ sinh token
2.8. Inference, fine-tuning và RAG
2.9. Embedding model và vai trò trong tra cứu tài liệu bệnh viện
2.10. Vector database và FAISS trong hệ thống AI local
3. Kiến trúc tổng thể hệ thống AI local cho bệnh viện
3.1. Các thành phần chính của hệ thống AI local bệnh viện
3.2. Lớp phần cứng: máy chủ AI, GPU, RAM, SSD, HDD, UPS
3.3. Lớp hệ điều hành: Ubuntu Server và môi trường Linux
3.4. Lớp vận hành model: Ollama, llama.cpp, vLLM, LM Studio
3.5. Lớp model: LLM, embedding model, reranker, vision-language model
3.6. Lớp dữ liệu bệnh viện: quy trình, quy định, biểu mẫu, văn bản, hướng dẫn chuyên môn
3.7. Lớp truy xuất tri thức: RAG, FAISS, hybrid search
3.8. Lớp tích hợp: API, Drupal, website nội bộ, dashboard, chatbot
3.9. Lớp bảo mật: phân quyền, ghi log, kiểm soát truy cập, ẩn danh dữ liệu
3.10. Lớp giám sát và đánh giá chất lượng câu trả lời
4. Giới thiệu Ollama trong triển khai AI local bệnh viện
4.1. Ollama là gì?
4.2. Vai trò của Ollama trong hệ sinh thái AI local
4.3. Vì sao Ollama phù hợp để bệnh viện bắt đầu triển khai AI local?
4.4. Ưu điểm của Ollama
4.5. Hạn chế của Ollama trong môi trường bệnh viện
4.6. Ollama phù hợp với những nhóm ứng dụng nào?
4.7. Ollama không phù hợp với những tác vụ nào?
4.8. So sánh Ollama với LM Studio, llama.cpp và vLLM
4.9. Các khái niệm cơ bản: model, tag, Modelfile, pull, run, serve
5. Cài đặt Ollama trên máy chủ bệnh viện
5.1. Chuẩn bị máy chủ AI local
5.2. Kiểm tra CPU, RAM, GPU, VRAM và ổ cứng
5.3. Cài đặt Ubuntu Server cho máy chủ AI
5.4. Cài đặt driver NVIDIA
5.5. Cài đặt CUDA khi cần thiết
5.6. Cài đặt Ollama
5.7. Kiểm tra dịch vụ Ollama
5.8. Cấu hình Ollama chạy như service
5.9. Cấu hình thư mục lưu model
5.10. Cấu hình truy cập Ollama trong mạng LAN bệnh viện
5.11. Một số lỗi thường gặp khi cài đặt
6. Lựa chọn model AI local cho bệnh viện
6.1. Nguyên tắc chọn model cho bệnh viện
6.2. Chọn model theo cấu hình phần cứng
6.3. Chọn model theo ngôn ngữ: tiếng Việt, tiếng Anh, song ngữ
6.4. Chọn model theo tác vụ: hỏi đáp, tóm tắt, viết văn bản, phân loại, trích xuất thông tin
6.5. Các nhóm model phổ biến: Llama, Qwen, Mistral, Gemma, Phi
6.6. Model dùng cho văn bản hành chính bệnh viện
6.7. Model dùng cho tài liệu chuyên môn y tế
6.8. Model dùng cho quản lý chất lượng bệnh viện
6.9. Model dùng cho tra cứu văn bản pháp luật y tế
6.10. Model dùng cho embedding và tìm kiếm ngữ nghĩa
6.11. Model dùng cho reranking kết quả truy xuất
6.12. Kinh nghiệm đánh giá model trước khi đưa vào sử dụng thật
7. Làm việc với model trong Ollama
7.1. Tải model bằng ollama pull
7.2. Chạy model bằng ollama run
7.3. Liệt kê model đã cài đặt
7.4. Xóa model không sử dụng
7.5. Cập nhật model
7.6. Kiểm tra tốc độ phản hồi của model
7.7. Kiểm tra mức sử dụng RAM, VRAM và CPU
7.8. So sánh kết quả giữa nhiều model
7.9. Thiết lập model mặc định cho từng nhóm người dùng
8. Tùy biến model bằng Modelfile cho bệnh viện
8.1. Modelfile là gì?
8.2. Cấu trúc cơ bản của Modelfile
8.3. Thiết lập system prompt cho môi trường bệnh viện
8.4. Thiết lập vai trò AI: trợ lý hành chính, trợ lý chất lượng, trợ lý điều dưỡng, trợ lý CNTT
8.5. Điều chỉnh temperature, top_p, num_ctx
8.6. Xây dựng model tùy biến cho phòng Quản lý chất lượng
8.7. Xây dựng model tùy biến cho phòng Kế hoạch tổng hợp
8.8. Xây dựng model tùy biến cho phòng Điều dưỡng
8.9. Xây dựng model tùy biến cho phòng Công nghệ thông tin
8.10. Xây dựng model tùy biến cho tra cứu văn bản pháp luật y tế
8.11. Quản lý nhiều model tùy biến trong cùng một bệnh viện
9. Sử dụng Ollama qua API trong hệ thống bệnh viện
9.1. Tổng quan Ollama API
9.2. API sinh văn bản
9.3. API hội thoại dạng chat
9.4. Streaming response
9.5. API tạo embedding
9.6. Tích hợp Ollama với Python
9.7. Tích hợp Ollama với PHP
9.8. Tích hợp Ollama với Drupal
9.9. Tích hợp Ollama với website nội bộ bệnh viện
9.10. Tích hợp Ollama với hệ thống QMS
9.11. Tích hợp Ollama với HIS, EMR, LIS, PACS: nguyên tắc và giới hạn
9.12. Thiết kế API trung gian để kiểm soát truy cập và ghi log
10. Xây dựng chatbot AI local cho bệnh viện
10.1. Chatbot AI local là gì?
10.2. Chatbot phục vụ nhân viên bệnh viện
10.3. Chatbot phục vụ lãnh đạo bệnh viện
10.4. Chatbot phục vụ phòng chức năng
10.5. Chatbot phục vụ khoa lâm sàng
10.6. Chatbot phục vụ khoa cận lâm sàng
10.7. Chatbot tra cứu quy trình, quy định nội bộ
10.8. Chatbot hỗ trợ người bệnh: nên và không nên
10.9. Chatbot không dùng dữ liệu riêng
10.10. Chatbot có dữ liệu riêng bằng RAG
10.11. Chatbot có lịch sử hội thoại
10.12. Chatbot có phân quyền người dùng
10.13. Kiểm soát câu trả lời sai, thiếu căn cứ hoặc vượt thẩm quyền
11. RAG với Ollama và FAISS cho tài liệu bệnh viện
11.1. RAG là gì?
11.2. Vì sao bệnh viện cần RAG?
11.3. Kiến trúc RAG cho tài liệu bệnh viện
11.4. Chuẩn bị tài liệu: quy trình, quy định, phác đồ, hướng dẫn, biểu mẫu
11.5. Làm sạch và chuẩn hóa dữ liệu
11.6. Chia nhỏ văn bản thành chunk
11.7. Tạo embedding cho tài liệu
11.8. Lưu vector bằng FAISS
11.9. Truy xuất tài liệu liên quan
11.10. Đưa tài liệu vào prompt cho Ollama
11.11. Sinh câu trả lời có căn cứ
11.12. Hiển thị nguồn trích dẫn cho người dùng
11.13. Kiểm soát hallucination trong hệ thống RAG
11.14. Đánh giá chất lượng câu trả lời RAG
11.15. Cập nhật chỉ mục khi tài liệu thay đổi
12. Ứng dụng AI local trong quản trị bệnh viện
12.1. Hỗ trợ lãnh đạo bệnh viện tra cứu thông tin quản trị
12.2. Hỗ trợ xây dựng kế hoạch, báo cáo, đề án
12.3. Hỗ trợ phân tích văn bản quản lý
12.4. Hỗ trợ tổng hợp biên bản họp
12.5. Hỗ trợ xây dựng quy chế, quy định, quy trình
12.6. Hỗ trợ chuẩn hóa biểu mẫu hành chính
12.7. Hỗ trợ phân loại và xử lý văn bản đến
12.8. Hỗ trợ giám sát tiến độ công việc
12.9. Hỗ trợ ra quyết định dựa trên dữ liệu: giới hạn và nguyên tắc sử dụng
13. Ứng dụng AI local trong quản lý chất lượng bệnh viện
13.1. Tra cứu Bộ tiêu chí chất lượng bệnh viện
13.2. Hỗ trợ tự đánh giá chất lượng bệnh viện
13.3. Hỗ trợ xây dựng kế hoạch cải tiến chất lượng
13.4. Hỗ trợ phân tích nguyên nhân gốc rễ
13.5. Hỗ trợ xây dựng bảng kiểm giám sát
13.6. Hỗ trợ phân tích báo cáo sự cố y khoa
13.7. Hỗ trợ theo dõi chỉ số chất lượng
13.8. Hỗ trợ chuẩn hóa quy trình và SOP
13.9. Hỗ trợ triển khai 5S, Lean, Kaizen, quản lý trực quan
13.10. AI local và văn hóa cải tiến liên tục trong bệnh viện
14. Ứng dụng AI local trong hoạt động chuyên môn
14.1. Hỗ trợ tra cứu hướng dẫn chuyên môn
14.2. Hỗ trợ tóm tắt tài liệu chuyên môn
14.3. Hỗ trợ xây dựng phiếu tư vấn, phiếu hướng dẫn người bệnh
14.4. Hỗ trợ chuẩn hóa nội dung giáo dục sức khỏe
14.5. Hỗ trợ xây dựng checklist an toàn người bệnh
14.6. Hỗ trợ tổng hợp thông tin từ hồ sơ bệnh án: điều kiện, giới hạn và rủi ro
14.7. Hỗ trợ nghiên cứu khoa học trong bệnh viện
14.8. Hỗ trợ đào tạo liên tục cho nhân viên y tế
14.9. Những tác vụ không nên giao hoàn toàn cho AI local
15. Ứng dụng AI local theo từng phòng, khoa trong bệnh viện
15.1. Ban giám đốc và lãnh đạo bệnh viện
15.2. Phòng Kế hoạch tổng hợp
15.3. Phòng Quản lý chất lượng
15.4. Phòng Điều dưỡng
15.5. Phòng Công nghệ thông tin
15.6. Phòng Tổ chức cán bộ
15.7. Phòng Hành chính quản trị
15.8. Phòng Tài chính kế toán
15.9. Phòng Vật tư thiết bị y tế
15.10. Khoa Dược
15.11. Khoa Kiểm soát nhiễm khuẩn
15.12. Khoa Dinh dưỡng
15.13. Khoa Khám bệnh
15.14. Khoa lâm sàng
15.15. Khoa cận lâm sàng
15.16. Bộ phận Chăm sóc khách hàng và Công tác xã hội
16. AI local với dữ liệu và phần mềm bệnh viện
16.1. Các nguồn dữ liệu có thể tích hợp
16.2. Dữ liệu từ văn bản, quy trình, biểu mẫu
16.3. Dữ liệu từ website nội bộ và hệ thống QMS
16.4. Dữ liệu từ HIS
16.5. Dữ liệu từ EMR
16.6. Dữ liệu từ LIS
16.7. Dữ liệu từ PACS
16.8. Dữ liệu từ hệ thống khảo sát hài lòng người bệnh
16.9. Dữ liệu từ báo cáo sự cố y khoa
16.10. Nguyên tắc tích hợp dữ liệu an toàn
16.11. Ẩn danh và tối thiểu hóa dữ liệu trước khi đưa vào AI
16.12. Không đưa dữ liệu nhạy cảm trực tiếp vào model khi chưa kiểm soát
17. Bảo mật, pháp lý và đạo đức khi dùng AI local trong bệnh viện
17.1. Đặc thù dữ liệu y tế và dữ liệu cá nhân
17.2. Nguyên tắc bảo mật khi triển khai AI local
17.3. Phân quyền người dùng theo vai trò
17.4. Kiểm soát truy cập API
17.5. Không mở Ollama trực tiếp ra Internet
17.6. Reverse proxy qua Nginx và lớp xác thực trung gian
17.7. Ghi log câu hỏi, câu trả lời và người sử dụng
17.8. Kiểm soát dữ liệu đầu vào và đầu ra
17.9. Chính sách lưu trữ và xóa lịch sử hội thoại
17.10. Trách nhiệm chuyên môn khi sử dụng câu trả lời từ AI
17.11. AI chỉ hỗ trợ, không thay thế quyết định chuyên môn của nhân viên y tế
17.12. Hội đồng chuyên môn và quy chế sử dụng AI trong bệnh viện
18. Tối ưu hiệu năng Ollama trong bệnh viện
18.1. Các yếu tố ảnh hưởng đến tốc độ phản hồi
18.2. Chọn model theo VRAM và RAM
18.3. Khi nào chạy bằng CPU, khi nào chạy bằng GPU?
18.4. Tối ưu context window
18.5. Tối ưu prompt cho từng tác vụ bệnh viện
18.6. Tối ưu số lượng người dùng đồng thời
18.7. Quản lý hàng đợi request
18.8. Theo dõi tài nguyên bằng nvidia-smi, htop, nvtop
18.9. Benchmark model trên máy chủ thực tế
18.10. Đánh giá tốc độ, độ chính xác và mức độ hữu ích
19. Quản trị vận hành hệ thống AI local bệnh viện
19.1. Khởi động, dừng và kiểm tra dịch vụ Ollama
19.2. Quản lý model đã tải
19.3. Quản lý dung lượng lưu trữ model
19.4. Backup thư mục model
19.5. Backup dữ liệu FAISS và kho tài liệu
19.6. Cập nhật Ollama an toàn
19.7. Quản lý log hệ thống
19.8. Giám sát nhiệt độ, điện năng và UPS
19.9. Xử lý lỗi treo model, đầy RAM, đầy VRAM, đầy ổ cứng
19.10. Kế hoạch bảo trì định kỳ
19.11. Tài liệu hóa cấu hình và quy trình vận hành
20. Mô hình triển khai thực tế tại bệnh viện
20.1. Mục tiêu triển khai hệ thống AI local
20.2. Mô tả cấu hình máy chủ AI local
20.3. Phân vai trò CPU, GPU, RAM, SSD, HDD
20.4. Thiết kế thư mục lưu model, dữ liệu và backup
20.5. Sơ đồ kết nối giữa AI local và các hệ thống bệnh viện
20.6. Tích hợp AI local với website nội bộ
20.7. Tích hợp AI local với Drupal
20.8. Tích hợp AI local với hệ thống quản lý chất lượng
20.9. Tích hợp AI local với kho văn bản pháp luật y tế
20.10. Kịch bản triển khai thí điểm tại một số phòng chức năng
20.11. Kịch bản mở rộng toàn bệnh viện
21. Đánh giá hiệu quả ứng dụng AI local trong bệnh viện
21.1. Vì sao cần đánh giá hiệu quả?
21.2. Nhóm chỉ số về sử dụng hệ thống
21.3. Nhóm chỉ số về thời gian xử lý công việc
21.4. Nhóm chỉ số về chất lượng câu trả lời
21.5. Nhóm chỉ số về mức độ hài lòng của nhân viên
21.6. Nhóm chỉ số về giảm tải công việc hành chính
21.7. Nhóm chỉ số về an toàn thông tin
21.8. Phương pháp thu thập phản hồi người dùng
21.9. Cải tiến liên tục hệ thống AI local
22. Lộ trình triển khai AI local trong bệnh viện
22.1. Giai đoạn 1: Nhận thức và chuẩn bị
22.2. Giai đoạn 2: Cài đặt Ollama và chạy thử model
22.3. Giai đoạn 3: Xây dựng chatbot nội bộ cơ bản
22.4. Giai đoạn 4: Xây dựng RAG với tài liệu bệnh viện
22.5. Giai đoạn 5: Triển khai thí điểm tại phòng Quản lý chất lượng và Kế hoạch tổng hợp
22.6. Giai đoạn 6: Mở rộng sang các phòng, khoa khác
22.7. Giai đoạn 7: Tích hợp với phần mềm bệnh viện
22.8. Giai đoạn 8: Chuẩn hóa quy chế, đào tạo và vận hành chính thức
23. Các lỗi thường gặp khi triển khai AI local trong bệnh viện
23.1. Không nhận GPU NVIDIA
23.2. Ollama không khởi động
23.3. Model chạy quá chậm
23.4. Hết VRAM khi chạy model lớn
23.5. Hết RAM khi xử lý tài liệu lớn
23.6. Không gọi được API từ máy khác trong mạng LAN
23.7. Lỗi CORS khi tích hợp với website
23.8. Câu trả lời tiếng Việt chưa tốt
23.9. Câu trả lời sai hoặc không có căn cứ
23.10. FAISS tìm sai tài liệu liên quan
23.11. Người dùng hiểu nhầm AI là nguồn quyết định chuyên môn
23.12. Thiếu quy chế vận hành và kiểm soát rủi ro
Phụ lục
Phụ lục 1. Các lệnh Ollama thường dùng
Phụ lục 2. Mẫu Modelfile cho trợ lý bệnh viện
Phụ lục 3. Mẫu Modelfile cho trợ lý quản lý chất lượng
Phụ lục 4. Mẫu Modelfile cho trợ lý tra cứu văn bản pháp luật y tế
Phụ lục 5. Mẫu gọi Ollama API bằng Python
Phụ lục 6. Mẫu gọi Ollama API bằng PHP
Phụ lục 7. Mẫu tích hợp Ollama với Drupal
Phụ lục 8. Mẫu cấu hình Nginx reverse proxy cho Ollama
Phụ lục 9. Mẫu cấu trúc thư mục cho hệ thống AI local bệnh viện
Phụ lục 10. Checklist cài đặt Ollama trên Ubuntu Server
Phụ lục 11. Checklist lựa chọn model AI local cho bệnh viện
Phụ lục 12. Checklist xây dựng RAG cho tài liệu bệnh viện
Phụ lục 13. Checklist bảo mật AI local trong bệnh viện
Phụ lục 14. Checklist vận hành định kỳ hệ thống AI local
Phụ lục 15. Mẫu quy chế sử dụng AI trong bệnh viện
Phụ lục 16. Mẫu phiếu đánh giá hiệu quả ứng dụng AI local

AI Local với Ollama trong bệnh viện