Categories
DSP Pembelajaran

Desain Pembangunan Korpus Indonesia (Tinjauan Informatika)

Kebutuhan penggunaan korpus yang menggunakan bahasa Indonesia semakin meningkat akan tetapi kebutuhan tersebut belum didukung dengan tersedianya korpus berbahasa Indonesia. Banyak negara sudah memiliki korpus nasional seperti British National Corpus (BNC), American National Corpus (ANC) dan lain sebagainya. Proyek pembuatan Korpus Nasional Bahasa Indonesia (KNBI) sendiri pernah disinggung dalam laporan akhir tahun anggaran 2001 proyek Iptekda BPPT. Namun perkembangannya sampai saat ini belum diketahui sejauh mana statusnya. Dengan adanya korpus bahasa Indonesia akan membantu banyak bidang seperti penerjemahan, komputasi linguistik dan lain sebagainya. Pembuatan korpus sendiri memiliki kriteria desain supaya dapat memenuhi kebutuhan yang diharapkan. Desain tersebut ada yang bersifat umum dan khusus, korpus bahasa yang satu dengan yang lain dapat berbeda disesuaikan dengan bahasa yang akan diproses dan kompleksitas yang melingkupi bahasa tersebut. Pembuatan korpus bahasa saat ini juga harus mempertimbangkan perkembangan teknologi, khususnya teknologi informatika. Sebagai contoh bidang informatika yang berkaitan dengan desain korpus adalah seperti internet, basis data, pengkodean, proses stemming dan lainnya. Korpus saat ini harus mampu beradaptasi dengan sifat internet, seperti keterbukaan dan interoperabilitas. Pengkodean korpus yang mampu digunakan kembali untuk diproses kembali juga merupakan salah satu kemampuan dari desain pembuatan korpus saat ini. Bagaimana korpus disimpan juga menarik untuk dikaji dalam desain korpus. Aspek-aspek bidang informatika tersebut merupakan tujuan dari penelitian ini.

(klik disini untuk unduh artikelnya)