Bài 1. Mô hình ngôn ngữ lớn là gì?

1. Đặt vấn đề

Trong vài năm gần đây, thuật ngữ “mô hình ngôn ngữ lớn” xuất hiện ngày càng nhiều trong các cuộc thảo luận về trí tuệ nhân tạo. Nhiều hệ thống AI hiện nay có thể viết văn bản, trả lời câu hỏi, tóm tắt tài liệu, dịch thuật, lập trình, giải thích khái niệm, phân tích nội dung và hỗ trợ người dùng làm việc với thông tin phức tạp. Nền tảng đứng sau phần lớn các khả năng này là mô hình ngôn ngữ lớn, thường được gọi là LLM, viết tắt của Large Language Model.

Đối với bệnh viện, hiểu đúng mô hình ngôn ngữ lớn là bước đầu tiên để sử dụng AI một cách có trách nhiệm. Nếu xem LLM như một “người biết tất cả”, bệnh viện có thể kỳ vọng quá mức và sử dụng sai. Nếu xem LLM chỉ như một phần mềm tìm kiếm thông thường, bệnh viện sẽ không khai thác hết tiềm năng của nó. Cách hiểu đúng hơn là: LLM là một hệ thống xử lý ngôn ngữ dựa trên xác suất, có khả năng sinh và biến đổi văn bản rất mạnh, nhưng không phải là nguồn sự thật tuyệt đối và không thay thế trách nhiệm chuyên môn của con người.

2. Khái niệm mô hình ngôn ngữ lớn

Mô hình ngôn ngữ lớn là một loại mô hình trí tuệ nhân tạo được huấn luyện trên khối lượng văn bản rất lớn để học các quy luật, mẫu câu, mối liên hệ ngữ nghĩa, cách lập luận và cấu trúc ngôn ngữ. Khi nhận một đoạn đầu vào, mô hình dự đoán phần tiếp theo có khả năng phù hợp nhất.

Nói đơn giản, LLM hoạt động bằng cách dự đoán token tiếp theo dựa trên ngữ cảnh đã có. Token có thể là một từ, một phần của từ, dấu câu hoặc ký hiệu. Từ quá trình dự đoán liên tục này, mô hình tạo ra câu trả lời hoàn chỉnh.

Điều quan trọng là LLM không “hiểu” theo cách con người hiểu. Nó không có trải nghiệm thực tế, không có trách nhiệm đạo đức, không có nhận thức lâm sàng, không biết chắc đâu là đúng nếu không có nguồn kiểm chứng. Nó tạo ra câu trả lời dựa trên các mẫu đã học và ngữ cảnh người dùng cung cấp. Chính vì vậy, LLM có thể rất hữu ích, nhưng cũng có thể sai.

3. Vì sao gọi là “lớn”?

Từ “lớn” trong mô hình ngôn ngữ lớn có thể hiểu ở nhiều khía cạnh.

Thứ nhất là lớn về số lượng tham số. Tham số là các giá trị bên trong mô hình được điều chỉnh trong quá trình huấn luyện. Một mô hình có thể có 1 tỷ, 3 tỷ, 7 tỷ, 14 tỷ, 32 tỷ, 70 tỷ hoặc nhiều tham số hơn. Số lượng tham số càng lớn, mô hình thường càng có khả năng biểu diễn ngôn ngữ và xử lý tác vụ phức tạp tốt hơn, nhưng cũng cần nhiều tài nguyên tính toán hơn.

Thứ hai là lớn về dữ liệu huấn luyện. LLM được huấn luyện trên khối lượng văn bản rất lớn, bao gồm sách, bài viết, mã nguồn, tài liệu kỹ thuật, hội thoại, trang web và nhiều loại dữ liệu khác tùy nhà phát triển. Nhờ đó, mô hình học được nhiều kiểu diễn đạt, nhiều lĩnh vực kiến thức và nhiều dạng nhiệm vụ.

Thứ ba là lớn về khả năng ứng dụng. LLM không chỉ làm một nhiệm vụ duy nhất. Cùng một mô hình có thể được dùng để tóm tắt, hỏi đáp, viết lại, phân loại, trích xuất, lập dàn ý, dịch thuật, giải thích và hỗ trợ lập trình. Đây là điểm khác biệt so với nhiều mô hình AI truyền thống vốn được thiết kế cho một tác vụ hẹp.

Tuy nhiên, lớn không đồng nghĩa với luôn tốt hơn trong mọi hoàn cảnh. Một model 70B có thể rất mạnh nhưng không phù hợp với máy chủ bệnh viện nếu không đủ GPU, RAM hoặc tốc độ xử lý. Một model 7B hoặc 14B được chọn đúng, kết hợp RAG tốt, có thể hữu ích hơn trong hệ thống nội bộ.

4. LLM làm được gì trong bệnh viện?

Trong môi trường bệnh viện, LLM có thể hỗ trợ nhiều nhóm công việc liên quan đến ngôn ngữ và tri thức.

Đối với công việc hành chính, LLM có thể hỗ trợ viết kế hoạch, báo cáo, công văn, thông báo, quy trình, quy định và tài liệu đào tạo. Đối với quản lý chất lượng, LLM có thể hỗ trợ xây dựng bảng kiểm, phân tích nguyên nhân gốc rễ, tóm tắt phản ánh người bệnh, gợi ý kế hoạch cải tiến và chuẩn hóa nội dung SOP. Đối với đào tạo, LLM có thể tạo câu hỏi, tình huống, bài giảng, tài liệu hướng dẫn và nội dung ôn tập. Đối với công nghệ thông tin, LLM có thể hỗ trợ viết tài liệu kỹ thuật, giải thích lỗi, tạo script mẫu và hướng dẫn người dùng.

Tuy nhiên, LLM không nên được sử dụng như một công cụ tự động ra quyết định chuyên môn. Trong bệnh viện, mọi nội dung liên quan đến chẩn đoán, điều trị, thuốc, thủ thuật, phẫu thuật, kết quả xét nghiệm hoặc tư vấn người bệnh phải được kiểm tra bởi nhân viên y tế có thẩm quyền.

5. LLM khác gì với công cụ tìm kiếm?

Công cụ tìm kiếm truyền thống chủ yếu tìm các tài liệu có chứa từ khóa hoặc phù hợp với truy vấn. Nó trả về danh sách kết quả để người dùng tự đọc và đánh giá. LLM thì khác. LLM có thể tạo ra câu trả lời trực tiếp, diễn giải nội dung, tổng hợp nhiều ý và trình bày theo yêu cầu.

Ví dụ, nếu người dùng tìm “quy trình báo cáo sự cố y khoa”, công cụ tìm kiếm có thể trả về các file liên quan. LLM có thể tóm tắt các bước, diễn giải trách nhiệm từng bộ phận và gợi ý cấu trúc báo cáo. Nếu kết hợp với RAG, LLM có thể trả lời dựa trên tài liệu nội bộ được truy xuất.

Nhưng chính khả năng tạo câu trả lời trực tiếp này cũng là rủi ro. Người dùng có thể tin vào câu trả lời mà không kiểm tra nguồn. Vì vậy, trong bệnh viện, LLM nên được kết hợp với cơ chế trích dẫn tài liệu, kiểm tra nguồn và cảnh báo giới hạn sử dụng.

6. LLM có “biết” quy trình riêng của bệnh viện không?

Thông thường, LLM không tự biết quy trình riêng của từng bệnh viện, trừ khi thông tin đó đã được đưa vào ngữ cảnh, fine-tuning hoặc hệ thống RAG. Một model dù rất mạnh vẫn có thể không biết biểu mẫu nội bộ, quy định riêng, tên phòng ban, quy trình ký duyệt hoặc phiên bản mới nhất của tài liệu bệnh viện.

Đây là lý do RAG đặc biệt quan trọng. Thay vì kỳ vọng model tự nhớ mọi thứ, bệnh viện có thể xây dựng kho tài liệu nội bộ, tạo embedding, lưu vào FAISS và khi người dùng hỏi, hệ thống sẽ truy xuất tài liệu liên quan đưa vào prompt. Khi đó, LLM đóng vai trò diễn giải và tổng hợp dựa trên nguồn nội bộ.

Với bệnh viện, câu trả lời đúng theo tài liệu nội bộ thường quan trọng hơn câu trả lời nghe hay nhưng chung chung.

7. Các giới hạn của LLM

LLM có một số giới hạn cần hiểu rõ.

Thứ nhất, LLM có thể tạo thông tin sai nhưng nghe thuyết phục. Hiện tượng này thường được gọi là hallucination. Trong bệnh viện, hallucination có thể nguy hiểm nếu người dùng dùng câu trả lời AI cho nội dung chuyên môn hoặc văn bản chính thức mà không kiểm tra.

Thứ hai, LLM bị giới hạn bởi context window. Nó chỉ xử lý được một lượng ngữ cảnh nhất định trong mỗi lần hỏi. Nếu đưa quá nhiều tài liệu vào, hệ thống có thể bị quá tải hoặc bỏ sót thông tin.

Thứ ba, LLM không tự cập nhật tài liệu nội bộ. Nếu quy trình bệnh viện thay đổi, cần cập nhật kho tài liệu hoặc prompt. Model không tự biết văn bản mới nếu không được cung cấp.

Thứ tư, LLM không hiểu trách nhiệm pháp lý. Nó có thể viết một câu trả lời tự tin, nhưng không chịu trách nhiệm nếu câu trả lời sai. Trong bệnh viện, trách nhiệm vẫn thuộc về con người và tổ chức.

Thứ năm, LLM local có thể hạn chế về chất lượng so với các model cloud lớn. Vì vậy, cần chọn tác vụ phù hợp với năng lực model.

8. Nguyên tắc sử dụng LLM trong bệnh viện

Khi sử dụng LLM trong bệnh viện, nên tuân thủ một số nguyên tắc.

Thứ nhất, dùng LLM như công cụ hỗ trợ, không dùng như nguồn quyết định cuối cùng.

Thứ hai, ưu tiên các tác vụ xử lý văn bản, tra cứu, tóm tắt, soạn thảo, đào tạo và quản lý chất lượng trước khi mở rộng sang tác vụ chuyên môn phức tạp.

Thứ ba, yêu cầu câu trả lời có nguồn khi liên quan đến quy trình, quy định hoặc tài liệu nội bộ.

Thứ tư, không nhập dữ liệu người bệnh định danh vào hệ thống nếu chưa có cơ chế bảo mật, phân quyền và phê duyệt.

Thứ năm, luôn có người kiểm tra trước khi sử dụng kết quả AI cho văn bản chính thức hoặc quyết định chuyên môn.

9. Kết luận

Mô hình ngôn ngữ lớn là nền tảng của nhiều ứng dụng AI hiện nay. Trong bệnh viện, LLM có thể hỗ trợ mạnh mẽ các tác vụ liên quan đến văn bản, tri thức, quy trình, đào tạo, quản lý chất lượng và quản trị. Tuy nhiên, LLM không phải là bác sĩ, không phải nguồn sự thật tuyệt đối và không tự biết quy trình riêng của bệnh viện nếu không được cung cấp dữ liệu phù hợp.

Hiểu đúng LLM giúp bệnh viện triển khai AI local an toàn hơn: chọn tác vụ phù hợp, kết hợp với RAG, yêu cầu nguồn trích dẫn, kiểm soát dữ liệu và giữ con người trong vòng chịu trách nhiệm.

Đăng nhập để gửi ý kiến