Doktor Baru ITS Bangun WordNet Indonesia
PERISTIWA TEKNOLOGI

Doktor Baru ITS Bangun WordNet Indonesia

Mungkin saat ini kita lazim menggunakan WordNet Bahasa Inggris. Seperti halnya mengetik kata ‘love’ yang berarti menyayangi maka akan muncul berbagai alternatif penggunaan kata tersebut. Mulai dari ungkapan untuk kegaiatan yang disayangi atau menyatakan kasih sayang platonik bahkan romantis.

Namun bagaimana untuk Bahasa Indonesia, pernahkan kalian menemukan WordNet Bahasa Indoensia dan mencobanya?

Adalah Gunawan, mahasiswa program doktor Jurusan Teknik Elektro ITS yang mencoba membuat WordNet Bahasa Indonesia tersebut. Dosen asal Sekolah Tinggi Teknik Surabaya ini mencoba membangun prototipe WordNet Bahasa Indonesia sebagai bahan disertasi untuk mendapatkan gelar doktornya.

Dikatakan Gunawan, WordNet merupakan basis data leksikal untuk berbagai macam bahasa. Aplikasi ini melakukan pengelompokan kata dalam satu himpunan yang disebut Synonym Set (synset). Sebagai contoh, jika kita mengetik kata makan di internet, akan keluar beberapa alternatif penggunaan yang berhubungan dengan kata tersebut.

Namun sejauh ini, WordNet berbahasa Indonesia belum banyak dibangun di Indonesia. Padahal jika diamati dalam perkembangan teknologi informasi, terdapat jutaan halaman web menggunakan Bahasa Indonesia. Ditambah Indonesia merupakan negara ke-12 untuk jumlah pemakai internet terbanyak di dunia.

Ironisnya, riset pada pengolahan bahasa alami, sistem temu kembali informasi, Text Mining, dan Web Mining dalam Bahasa Indonesia sangatlah kurang.

Gunawan menilai salah satu penyebabnya adalah belum tersedianya basis data leksikal Bahasa Indonesia yang dapat digunakan secara bebas untuk penelitian.

“Saat basis data leksikal Bahasa Indonesia terbentuk, maka pencapaian ini akan membuka pintu bagi ribuan riset dan pengembangan aplikasi dalam pengolahan Bahasa Indonesia,” terang Gunawan.

Menurut Gunawan, ketersediaan WordNet Bahasa Indonesia juga akan menstimulus lebih banyak penelitian dalam pengolahan bahasa, deep learning sampai proses komputasi yang lebih besar.

Pendekatan yang dilakukan dalam riset ini juga dapat diterapkan untuk tujuan pembangunan WordNet dalam bahasa-bahasa daerah seperti Bahasa Jawa, Sunda, Bali, dan lain lain. “Akan lebih baik jika web resources untuk bahasa daerah tersebut telah tersedia,” pungkasnya. (sak)