Sinh viên Bách khoa đưa luận văn AI lên tạp chí Q1

Sinh viên Bách khoa đưa luận văn AI lên tạp chí Q1

Từ luận văn tốt nghiệp của sinh viên Trường ĐH Bách khoa (ĐH Quốc gia TP.HCM), một nghiên cứu về kỹ thuật mới giúp AI trả lời câu hỏi trắc nghiệm ổn định hơn được đăng trên tạp chí quốc tế Q1.

Khởi nguồn từ một luận văn tốt nghiệp đại học, công trình nghiên cứu của thầy trò khoa khoa học và kỹ thuật máy tính của trường này đã được công bố trên tạp chí quốc tế hàng đầu về trí tuệ nhân tạo (AI) trong giáo dục sau khi trải qua nhiều vòng phản biện.

Bài báo Enhancing Large Language Model Performance for Automatic Zero-Shot Multiple-Choice Question Answering via Single-Token Logit Prompting của nhóm tác giả từ Việt Nam đã được công bố trên tạp chí Computers and Education: Artificial Intelligence.

Đây là tạp chí mở thuộc Nhà xuất bản Elsevier, hiện xếp hạng Q1, đứng đầu lĩnh vực giáo dục (Education), hạng 4 trong lĩnh vực khoa học máy tính ứng dụng (Computer Science Applications) và hạng 5 lĩnh vực trí tuệ nhân tạo (AI- Artificial Intelligence), theo SCImago.

Nhóm tác giả gồm Đặng Phú Quốc – cựu sinh viên Trường ĐH Bách khoa (đồng tác giả chính), Trần Trương Tuấn Phát – giảng viên Trường ĐH Bách khoa (đồng tác giả chính), TS Vũ Đức Lý (giảng viên Trường ĐH Quốc tế Miền Đông), Nguyễn Song Thiên Long và Võ Thị Như Quỳnh cùng là sinh viên năm thứ ba Trường ĐH Bách khoa, được PGS.TS Quản Thành Thơ – Trưởng khoa khoa học và kỹ thuật máy tính Trường ĐH Bách khoa (ĐH Quốc gia TP.HCM) hướng dẫn.

Công trình tập trung vào đề xuất kỹ thuật viết lời nhắc (prompting) mới mang tên Single-Token Logit (STL) nhằm nâng cao độ chính xác và tính ổn định của các mô hình ngôn ngữ lớn (LLM) khi tự động trả lời câu hỏi trắc nghiệm (MCQ). Tác giả Đặng Phú Quốc cho biết nghiên cứu xuất phát từ luận văn tốt nghiệp đại học của anh.

“Ban đầu mình chỉ đặt mục tiêu giải quyết tốt một bài toán chuyên môn về mô hình ngôn ngữ lớn, chứ không kỳ vọng sẽ được công bố trên tạp chí thứ hạng cao. Sau khoảng 28 tháng kể từ khi bắt tay nghiên cứu, đến tháng 3-2026 công trình đã được đăng trên tạp chí Computers and Education: Artificial Intelligence”, anh Quốc chia sẻ.

Thông tin thêm, anh Trần Trương Tuấn Phát cho hay nhóm đã trải qua nhiều vòng phản biện kín hai chiều. Mỗi vòng đều yêu cầu những cải tiến đáng kể như bổ sung thí nghiệm, làm rõ cách diễn giải, củng cố định hướng nghiên cứu và tái cấu trúc bản thảo.

Việc lựa chọn nơi nộp bài được nhóm thực hiện theo gợi ý của Nhà xuất bản Elsevier. Chỉ sau khi được chấp nhận, nhóm mới có thông tin đây là tạp chí đứng đầu thế giới trong lĩnh vực giáo dục (Education). “Đó là kết quả đặc biệt mà chính nhóm tác giả cũng không ngờ tới”, PGS.TS Quản Thành Thơ nói thêm.

Từ thực tế nghiên cứu, nhóm nhận thấy hiện tượng gọi là giới hạn Multiple-Choice Symbol Binding (MCSB) làm giảm đáng kể độ tin cậy của LLM, nhất là khi ứng dụng vào chấm bài hay xây dựng ngân hàng câu hỏi của lĩnh vực giáo dục. Vì thế, nhóm đề xuất kỹ thuật Single-Token Logit (STL).

Thay vì đưa toàn bộ đáp án và yêu cầu mô hình chọn A – B – C – D như thông thường, STL tách từng đáp án riêng biệt và yêu cầu mô hình đánh giá theo dạng đúng – sai cho từng lựa chọn.

Hệ thống lần lượt hỏi “Đáp án này có đúng không?” và sử dụng xác suất của token “yes” để đánh giá mức độ phù hợp. “Cơ chế này giúp mô hình xác minh từng lựa chọn một cách độc lập, không bị chi phối bởi vị trí hay nhãn đáp án, khắc phục trực tiếp hạn chế của giới hạn MCSB”, anh Phát nói về ưu điểm của nghiên cứu.

Nghiên cứu còn tích hợp kỹ thuật Retrieval-Augmented Generation (RAG) cho phép mô hình truy xuất kiến thức bên ngoài khi cần, giúp tăng độ chính xác theo ngữ cảnh cũng như kiểm tra độ ổn định của giải pháp trong các điều kiện khác nhau.

Khi thử nghiệm trên ba bộ dữ liệu khoa học chuẩn gồm ARC, OpenBookQA và SciQ, STL cho kết quả ngang bằng hoặc vượt trội so với nhiều phương pháp phổ biến với mức cải thiện lên tới 11 điểm phần trăm trong một số cấu hình, đồng thời giảm đáng kể chi phí tính toán.

Về tiềm năng ứng dụng, kỹ thuật STL có thể hỗ trợ giáo viên rà soát đề thi, tự động gợi ý đáp án cho câu hỏi chưa có lời giải, hỗ trợ chấm bài và phát triển các hệ thống học tập thông minh có khả năng giải thích kết quả đánh giá.

Theo PGS.TS Quản Thành Thơ, công bố không chỉ đóng góp xuất sắc về mặt giá trị học thuật đối với các nghiên cứu trong lĩnh vực LLM mà còn cho thấy việc nâng cao độ tin cậy của AI không nhất thiết phải đến từ mô hình lớn hơn hay kiến trúc phức tạp. “Đôi khi chỉ một thay đổi nhỏ trong cách thiết kế lời nhắc (prompt) cũng có thể tạo ra khác biệt lớn trong ứng dụng thực tế”, ông Thơ nhận định.

Nước nào là thị trường xuất khẩu lớn nhất của Việt Nam?
Nước nào là thị trường xuất khẩu lớn nhất của Việt Nam?

Tin Gốc: https://tuoitre.vn/sinh-vien-bach-khoa-dua-luan-van-ai-len-tap-chi-q1-20260412080023156.htm