Kebutuhan penggunaan korpus yang menggunakan bahasa Indonesia semakin meningkat akan tetapi kebutuhan tersebut belum didukung dengan tersedianya korpus berbahasa Indonesia. Banyak negara sudah memiliki korpus nasional seperti British National Corpus (BNC), American National Corpus (ANC) dan lain sebagainya. Proyek pembuatan Korpus Nasional Bahasa Indonesia (KNBI) sendiri pernah disinggung dalam laporan akhir tahun anggaran 2001 proyek Iptekda BPPT. Namun perkembangannya sampai saat ini belum diketahui sejauh mana statusnya. Dengan adanya korpus bahasa Indonesia akan membantu banyak bidang seperti penerjemahan, komputasi linguistik dan lain sebagainya. Pembuatan korpus sendiri memiliki kriteria desain supaya dapat memenuhi kebutuhan yang diharapkan. Desain tersebut ada yang bersifat umum dan khusus, korpus bahasa yang satu dengan yang lain dapat berbeda disesuaikan dengan bahasa yang akan diproses dan kompleksitas yang melingkupi bahasa tersebut. Pembuatan korpus bahasa saat ini juga harus mempertimbangkan perkembangan teknologi, khususnya teknologi informatika. Sebagai contoh bidang informatika yang berkaitan dengan desain korpus adalah seperti internet, basis data, pengkodean, proses stemming dan lainnya. Korpus saat ini harus mampu beradaptasi dengan sifat internet, seperti keterbukaan dan interoperabilitas. Pengkodean korpus yang mampu digunakan kembali untuk diproses kembali juga merupakan salah satu kemampuan dari desain pembuatan korpus saat ini. Bagaimana korpus disimpan juga menarik untuk dikaji dalam desain korpus. Aspek-aspek bidang informatika tersebut merupakan tujuan dari penelitian ini.

(klik disini untuk unduh artikelnya)

Tags: , , ,

8 Responses to “Desain Pembangunan Korpus Indonesia (Tinjauan Informatika)”

  1. Pak Dr. Agfianto, Saya Hanung Triyoko, Mahasiswa S3 Linguistik UGM yang sangat berminat mengembangkan penelitian linguistik Bahasa Indonesia berbasis korpus. Saya sangat tertarik mendapatkan fulltext artikel Bapak dkk, tentang korpus, mohon kiranya bapak sudi membantu saya mengirimkan makalah tersebut melalui email saya diatas karena saya tidak memiliki akses langsung ke perpustakaan Bapak, maturnuwun.

  2. email saya hanungina@yahoo.co.id

  3. betul pak, semua memang harus mengikuti perkembangan jaman, seperti internet yang semakin cepat kita bisa mengakses data.

  4. Mungkin korpus Indonesia bisa dibuat mirip seperti korpus-korpus di tatoeba.org.

  5. adaptasi terhadap perkembangan jaman memang sangat perlu

  6. semoga semakin maju !

  7. Korpus sendiri itu apa ya pak?

  8. thank you for sharing. it’s so helpful

Leave a Reply

You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>