XÂY DỰNG VĂN PHẠM TẠO GIAO DIỆN NGƯỜI DÙNG |
BUILDING THE GRAMMAR TO CREATE USER INTERFACE |
Tác giả: , |
Đăng tại: Vol. 18, No. 5.1, 2020; Trang: 117-120 |
Tóm tắt bằng tiếng Việt: |
Một trong những thao tác thường gặp trong xử lý ngôn ngữ tự nhiên, đặc biệt trong xử lý tiếng Việt nói chung và tiếng dân tộc thiểu số nói riêng, là phải xây dựng các công cụ để truy cập đến kho ngữ vựng. Thông qua giao diện của các công cụ, người sử dụng có thể xem nội dung, tìm kiếm, cập nhật dữ liệu hay triển khai các ứng dụng. Hiện nay, vẫn chưa có nhiều các kho ngữ vựng đa ngữ tiếng Việt có cấu trúc nhất quán, có nội dung phong phú, đa dạng và dễ dàng khai thác theo định hướng mã nguồn mở. Mặt khác, việc xây dựng các công cụ truy cập dữ liệu như vậy thường mất nhiều thời gian và công sức, khó trao đổi giữa các nhóm nghiên cứu, phụ thuộc vào bản chất của các kho ngữ vựng. Từ đó, bài báo đề xuất xây dựng văn phạm cho phép lập trình tạo giao diện để người dùng có thể truy cập đến các kho ngữ vựng đa ngữ tiếng Việt có cấu trúc nhất quán đã được định nghĩa trước. |
Từ khóa: kho ngữ vựng đa ngữ; Xử lý dân tộc thiểu số; Giao diện người dùng; ANTRL; kho ngữ vựng Việt-Ê Đê |
Abstract: |
One of the common operations in natural language processing, especially in Vietnamese language processing in general and ethnic minority language processing in particular is to build tools to access vocabulary database. Through the interface of the tool, users can view content, search the information, update data or deploy applications. Currently, there is not much Vietnamese multilingual vocabulary database with consistent structure, rich content, diversity and easy exploitation in the direction of open source. Furthermore, building such tool to access data often takes a lot of time and effort, and it is difficult to exchange between research groups and it depends on the nature of the vocabulary database. From that, the article proposes building the grammar for programmers to create interfaces so that users access to Vietnamese multilingual vocabulary database with predefined consistent structure. |
Key words: Multilingual vocabulary database; ethnic minority language processing; user interface; ANTRL; Vietnamese-Ede vocabulary database. |
Tài liệu tham khảo: |
[1] https://www.antlr.org/.
[2] Phan Thị Tươi, Xử lý ngôn ngữ tự nhiên, NXB Đại học Quốc gia TP Hồ Chí Minh, 2012.
[3] Trần Thị Bích Hằng, Nghiên cứu ứng dụng ANTLR để xử lý các thông điệp trong phần mềm đa ngữ, Luận văn Thạc sĩ ngành Khoa học Máy tính, Đại học Đà Nẵng, 2013.
[4] Phạm Hồng Nguyên, Giáo trình Chương trình dịch, Nhà xuất bản Đại học Quốc gia Hà Nội, 2009.
[5] Đoàn Văn Ban, Lập trình Java nâng cao, ebookbkmt.com
[6] Phan Huy Khánh, Văn Thị Thu Hương, Thái Thu Hà, Lê Thị Thanh Thủy, “Phát triển công cụ tương tác với các kho ngữ liệu nhờ văn phạm tạo sinh giao diện”, Hội thảo Quốc gia lần thứ X về Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, 2007.
[7] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, Souksan Vilavong, “Using Unicode in Encoding the Vietnamese Ethnic Minority languages, applying for the Ede language”, KSE 2013, số 1, Trang 137-148, 2013.
[8] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Xây dựng kho ngữ vựng song ngữ Việt-Ê Đê dựa trên mô hình tương tác Việt-Ê Đê”, Tạp chí Khoa học Công nghệ ĐHĐN, Số 5(114), quyển 2, trang: 36-40, 2017. |
|
|
|