Luận văn của sinh viên đăng tạp chí hội nghị xử lý ngôn ngữ tự nhiên lớn nhất thế giới

28/08/2021 11:00 GMT+7

TTO - 2 sinh viên năm cuối Trường ĐH Bách khoa (ĐH Quốc gia TP.HCM) có bài báo đăng trên tạp chí hội nghị về lĩnh vực xử lý ngôn ngữ tự nhiên lớn nhất thế giới.

Luận văn của sinh viên đăng tạp chí hội nghị xử lý ngôn ngữ tự nhiên lớn nhất thế giới - Ảnh 1.

Sinh viên Nguyễn Thành Thông và Lữ Ngọc Thiên Trúc - Ảnh: THY HUYỀN

Hai sinh viên Nguyễn Thành Thông và Lữ Ngọc Thiên Trúc (sinh viên năm cuối khoa khoa học và kỹ thuật máy tính Trường ĐH Bách khoa - ĐH Quốc gia TP.HCM) đã có bài báo được chấp thuận tại hội nghị Empirical Methods in Natural Language Processing - EMNLP 2021.

Hiện nay, Nguyễn Thành Thông đang là thành viên của VinAI Research, còn Lữ Ngọc Thiên Trúc đang được đào tạo tại Vingroup Big Data Institute.

Nội dung bài báo là một phần của luận văn tốt nghiệp đại học của hai sinh viên, dưới sự hướng dẫn của PGS.TS Quản Thành Thơ - phó trưởng khoa khoa học và kỹ thuật máy tính, và PGS Lưu Anh Tuấn (cựu sinh viên Trường ĐH Bách khoa, hiện đang công tác tại Trường Nanyang Technological University - Singapore).

Bài báo "Enriching and Controlling Global Semantics for Text Summarization" (tạm dịch: "Làm giàu và điều khiển ngữ nghĩa toàn cục để tóm tắt văn bản") có nội dung hướng đến vấn đề tự động tóm tắt văn bản bằng trí tuệ nhân tạo (AI).

Đây là một công việc rất cần thiết cho những người làm việc trong môi trường học thuật cần phải đọc và nắm được các thông tin chính yếu của một lượng lớn tài liệu.

Nguyễn Thành Thông chia sẻ về kết quả nghiên cứu: "Hệ thống AI được đề xuất từ phương pháp của bài báo có thể tóm tắt một đoạn văn bản dài thành một nội dung cô đọng nhưng vẫn đầy đủ các thông tin chính yếu nhất".

Các thành tựu mới nhất trong lĩnh vực này thường dựa trên Transformer, một trong những mô hình học sâu tiên tiến nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên. Tuy nhiên các phương pháp hiện nay thường bị thiếu những từ khóa và thông tin quan trọng nhất khi tóm tắt các văn bản dài.

PGS.TS Quản Thành Thơ nhận xét: "Hệ thống được đề cập trong bài báo của hai sinh viên Thông và Trúc sẽ tìm cách hệ thống hóa thông tin toàn cục của bài báo gốc trước khi tích hợp vào kết quả tóm tắt. Nhờ vậy, bản tóm tắt của nhóm được đánh giá là có đầy đủ thông tin nhất trong số các phương pháp tóm tắt văn bản tự động hiện nay".

EMNLP là một trong hai hội nghị lớn nhất thế giới về lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).

Tạp chí được xếp hạng A1 bởi bảng xếp hạng hội nghị Qualis và xếp hạng A bởi bảng xếp hạng hội nghị ERA, tức là được xếp loại cao nhất bởi hai bảng xếp hạng này. Đây là các bảng xếp hạng chuyên dùng đánh giá hội nghị, tương tự như bảng xếp hạng bằng chỉ số SJR của SCImago dành cho tạp chí.

Sinh viên có bài báo khoa học đăng tạp chí IEEE Access Sinh viên có bài báo khoa học đăng tạp chí IEEE Access

TTO - Bài báo khoa học của sinh viên Lê Ngọc Huy - Trường ĐH Công nghệ thông tin (ĐH Quốc gia TP.HCM) - đã được chấp nhận đăng trên tạp chí IEEE Access (Mỹ).

TRẦN HUỲNH
Bình luận (0)
    Xem thêm bình luận
    Bình luận Xem thêm
    Bình luận (0)
    Xem thêm bình luận