Chương 6. Lựa chọn model AI local cho bệnh viện

Giới thiệu chương

Sau khi bệnh viện đã có máy chủ AI local, cài đặt được Ollama và kiểm tra hệ thống vận hành cơ bản, câu hỏi tiếp theo là: nên dùng model nào? Đây là một trong những quyết định quan trọng nhất khi triển khai AI local. Model quyết định phần lớn chất lượng câu trả lời, tốc độ phản hồi, mức tiêu thụ tài nguyên, khả năng xử lý tiếng Việt, khả năng viết văn bản hành chính, khả năng hỗ trợ quản lý chất lượng, khả năng tra cứu tài liệu nội bộ và khả năng tích hợp vào hệ thống bệnh viện.

Trong thực tế, nhiều người có xu hướng chọn model theo tên nổi tiếng, theo số tham số lớn nhất hoặc theo lời giới thiệu trên Internet. Cách chọn này rất dễ sai trong môi trường bệnh viện. Một model lớn chưa chắc chạy tốt trên máy chủ hiện có. Một model mạnh tiếng Anh chưa chắc viết tiếng Việt hành chính tốt. Một model trả lời hay trong hội thoại chung chưa chắc phù hợp với văn bản quản lý bệnh viện. Một model tóm tắt tốt chưa chắc phù hợp để tạo embedding. Một model chạy được trên máy cá nhân chưa chắc đủ ổn định khi phục vụ nhiều người dùng nội bộ.

Vì vậy, chọn model cho bệnh viện phải dựa trên một hệ tiêu chí rõ ràng. Cần xem phần cứng có gì, GPU bao nhiêu VRAM, RAM bao nhiêu, ổ cứng có đủ không, số người dùng dự kiến là bao nhiêu, tác vụ chính là gì, dữ liệu tiếng Việt hay tiếng Anh, có cần RAG không, có cần embedding không, có cần reranking không, câu trả lời cần độ chính xác hay độ sáng tạo, có cần tốc độ nhanh hay chấp nhận chậm để đổi lấy chất lượng cao hơn.

Một điểm rất quan trọng là không có “model tốt nhất cho mọi việc”. Trong bệnh viện, có nhiều nhóm tác vụ khác nhau. Soạn thảo văn bản hành chính cần model viết mạch lạc, đúng văn phong, ít lan man. Tra cứu quy trình nội bộ cần model biết bám nguồn và không tự suy diễn. Quản lý chất lượng cần model có khả năng phân tích nguyên nhân, lập kế hoạch, xây dựng bảng kiểm. Tài liệu chuyên môn y tế cần model thận trọng, không tự đưa ra khuyến cáo vượt phạm vi. Văn bản pháp luật y tế cần model biết giữ căn cứ, không bịa số hiệu, không tự tạo điều khoản. Embedding cần model chuyển văn bản thành vector tốt, không phải model sinh văn bản. Reranking lại cần model đánh giá mức độ liên quan giữa câu hỏi và tài liệu.

Chương này sẽ trình bày toàn diện các nguyên tắc lựa chọn model AI local cho bệnh viện. Trước hết là nguyên tắc chung: chọn theo nhu cầu, phần cứng, ngôn ngữ, tác vụ, rủi ro và khả năng vận hành. Sau đó là cách chọn model theo cấu hình phần cứng, theo ngôn ngữ, theo tác vụ. Chương cũng giới thiệu các nhóm model phổ biến như Llama, Qwen, Mistral, Gemma, Phi; phân tích model dùng cho văn bản hành chính bệnh viện, tài liệu chuyên môn y tế, quản lý chất lượng, tra cứu văn bản pháp luật y tế, embedding và reranking. Cuối chương là kinh nghiệm đánh giá model trước khi đưa vào sử dụng thật.

Mục tiêu của chương này không phải là đưa ra một danh sách cố định model phải dùng, vì hệ sinh thái model thay đổi liên tục. Mục tiêu là giúp bệnh viện có phương pháp lựa chọn và đánh giá model. Khi có phương pháp, bệnh viện có thể tự đánh giá model mới, so sánh trên dữ liệu thực tế của mình và chọn giải pháp phù hợp hơn thay vì phụ thuộc hoàn toàn vào quảng cáo hoặc đánh giá chung trên Internet.

Đăng nhập để gửi ý kiến

Chương 6. Lựa chọn model AI local cho bệnh viện

Giới thiệu chương

Vì Sao Tôi Không Tin Các AI Agent Hoạt Động Độc Lập Nếu Không Có Giám Sát Nghiêm Ngặt

Thúy Hường

Câu hỏi, thảo luận