Pada tugas softskill bahasa indonesia kali ini saya mengambil masalah penelitian bahasa menggunakan tools korpus yang dimana ada sebuah permasalah dari artikel yang ditulis oleh Wahyu Adi Putra Ginting. Disini penulis artikel ingin membuat korpus daring sebagai jalan keluar perkara korpus Bahasa Indonesia karena, teknologi komputer adalah perkakas yang sudah sangat lazim digunakan saat berurusan dengan pembangunan sebuah korpus linguistik. Oleh karena itu, data yang ada dalam sebuah korpus bahasa itu pun berupa data komputer. Data ini biasanya terlalu besar atau banyak bila ingin dicetak. Sebagai contoh, ada satu korpus daring bahasa Inggris-Amerika, bernama Corpus of Contemporary American
English (COCA) ), yang memiliki data sebanyak 410 juta kata . Masa data sebanyak itu tidak mungkin dicetak, maka dari itu jaringan Internet adalah alat yang tepat untuk memasyarakatkan korpus bahasa. Di Internet sendiri, selain COCA banyak sekali beredar korpus bahasa.
Disini penulis ingin membangun korpus Bahasa Indonesia dalam bentuk daring dan juga sebagai usaha untuk menerangkan dengan ringkas-jelas apa itu korpus bahasa, menyebarkan kesadaran akan pentingnya sebuah korpus Bahasa Indonesia, dan juga sebagai bentuk apresiasi dan dukungan penulis terhadap cita-cita teman dari penulis ini, Ivan Lanin.
B. Tujuan
Tujuan dari pembuatan korpus daring bahasa tersebut adalah karena keberadaan korpus sangatlah dibutuhkan. Korpus dapat menjadi sebuah sumber, sebuah lumbung yang menyimpan rekaman-rekaman penggunaan praktis bahasa tertentu. Korpus dapat pula digunakan sebagai data-keras untuk membuktikan gejala-gejala kebahasaan yang terjadi pada suatu bahasa, gejala peyorasi atau ameliorasi makna kata, contohnya. Teks-teks yang tersimpan dalam sebuah korpus dapat dijadikan acuan untuk memeriksa alur perubahan peyoratif atau amelioratif dari makna kata tertentu. Tentunya, akan sangat menyusahkan bila kita harus mencari acuan tersebut dalam buku-cetak maka dibuatlah korpus tersebut. Hal lain yang harus diperhitungkan dalam penciptaan sebuah alat adalah ketersediaan akses terhadap alat tersebut. Alat bagus akan menjadi kurang berfaedah bila tak dapat digunakan oleh khalayak banyak. Dalam konteks inilah penulis berpikir bahwa konsep daring dapat menjadi jawaban untuk akses sebuah korpus bahasa.
C. Target
Target
dari pembuatan korpus ini adalah semua elemen masyarakat yang menggunakan korpus bahasa dengan tekhnologi komputer dan perusahaan- perusahaan pusat bahasa. Penulis juga memiliki gagasan tentang keinteraktifan korpus daring Bahasa Indonesia. Korpus yang nantinya akan dibangun itu baiknya sebuah korpus yang
mempunyai keinteraktifan. Dalam arti, ada jalur yang disediakan oleh pengelola korpus daring tersebut bagi pengunjung yang ingin mengajukan tambahan data. Sebuah korpus bahasa tentunya bukanlah sebuah lumbung mati. Selayaknya bahasa, korpus tersebut pastilah harus terus berkembang, baik dari segi jumlah atau pun keragaman jenis datanya. Sebuah bangunan sebesar korpus bahasa tentunya tidak bisa dipelihara ‘sendirian’.
D. Metode
Metode pembuatan korpus ini sebetulnya sangat mirip dengan metode pengarsipan. Yang diarsipkan tentulah bahasa dengan berbagai unsurnya: kata, frasa, idiom, ungkapan, dll, dari bertumpuk-tumpuk teks yang ada. Cara pengarsipannya adalah pertama-tama, karena data yang digunakan sangatlah banyak, umumnya teknologi yang digunakan untuk mengarsipkan bahasa adalah teknologi komputer. Penjelasan berikutnya seperti ini: Misalkan kita ingin membangun korpus dari sumber teks yang berupa novel-novel berbahasa Indonesia. Novel-novel ini dikumpulkan menurut periode penerbitannya, misalnya: novel-novel Indonesia yang terbit di periode tahun 1990-2010. Korpus yang akan dibangun adalah lumbung yang akan menampung seluruh teks yang ada di novel tersebut. Dalam bentuknya yang paling kecil, tentunya yang diarsipkan adalah kata. Maka, tentu juga kita akan punya banyak sekali data. Pengarsipan dilakukan dengan mendaftar kata-kata tersebut secara alfabetis: dari A-Z. Jadi nanti ketika kita ingin mencari kata, misalnya, corak, maka kita akan menemukan kata tersebut, salah satunya, dalam novel Dadaisme karya Dewi Sartika (terbit tahun 2004), pada halaman 148. Satu lagi informasi yang biasanya ada dalam korpus bahasa adalah kekerapan munculnya suatu kata dalam kumpulan teks yang menjadi sumber bahan korpus tersebut. Jadi, kita bisa tahu berapa kali sebuah kata muncul dalam satu teks tertentu atau dalam seluruh kumpulan teks.
E. Hasil
Sehubungan dengan kamus, korpus dapat juga dipakai sebagai bahan untuk menunjang konteks makna sebuah kata sebab korpus dapat juga berisi daftar kata dalam lingkungannya di sebuah teks, baik lisan maupun tertulis. Singkatnya korpus merupakan sebuah alat persis sebagaimana hakikat sebuah mesin bagi manusia alat untuk membantu penyelesaian sebuah pekerjaan.
F. Kesimpulan
Kesimpulan dari penulis adalah bahwa sebuah korpus bahasa tentunya bukanlah sebuah lumbung mati. Selayaknya bahasa, korpus tersebut pastilah harus terus berkembang, baik dari segi jumlah atau pun keragaman jenis datanya. Sebuah bangunan sebesar korpus bahasa tentunya tidak bisa dipelihara ‘sendirian’. Sewaktu mengajukan gagasan ini pada temannya, penulis memberi contoh tentang pembuatan Oxford English Dictionary yang legendaris itu. Kamus tersebut adalah kamus etimologis lengkap yang menyertakan contoh pemakaian setiap lema lewat teks-teks empiris (teks-teks yang memang ada dalam bentuk cetakan). Pengerjaannya melibatkan banyak sekali sukarelawan dan berton-ton buku. Para sukarelawan inilah yang membantu para penulis kamus mendata kata-kata yang pernah ada dalam teks-teks tertulis bahasa Inggris. Kenyataan ini memberi penulis ide tentang sifat interaktif untuk kamus daring Bahasa Indonesia. Mengapa tidak melibatkan penutur untuk ikut menyumbang, yang juga berarti memelihara pertumbuhan, korpus Bahasa Indonesia? Sumbangan baru tersebut, selain membantu para pengelola untuk mengembangkan korpus, juga menciptakan semacam rasa memiliki dalam diri para penutur Bahasa Indonesia. Bukankah ini (salah-)satu cara untuk memantapkan rasa percaya diri penutur terhadap bahasanya sendiri.
Sumber :
Resume tersebut dikutip dari sebuah artikel yang ditulis oleh Wahyu Adi Putra Ginting yang berjudul “Korpus Daring Bahasa Indonesia” yang ditulis pada 21 November 2010. Berikut ini alamat websitenya http://lidahibu.com/2010/11/21/korpus-daring-bahasa-indonesia/
Tidak ada komentar:
Posting Komentar