Kompetisi Wikisumber 2023

Kompetisi Wikisumber 2023

Pada tahun 2023 Komunitas Wikimedia Yogyakarta mengadakan Kompetisi Wikisumber untuk pertama kalinya. Kompetisi Wikisumber adalah kompetisi menguji baca dan mengetik ulang sejumlah buku berbahasa Jawa yang berlangsung pada 6–20 Maret 2023.

Apa keistimewaan Kompetisi Wikisumber kali ini? Di samping menguji baca sekitar 30 buku bahasa Jawa Latin dengan berbagai topik, para peserta juga dapat menguji baca 3 manuskrip istimewa yang berasal dari akhir abad ke-18 dan awal abad ke-19, yaitu Serat Jaya Lengkara Wulang, Serat Sélarasa, dan Serat Damar Wulan. Ketiga manuskrip tulisan tangan ini berjumlah lebih dari seribu halaman dan tersimpan dengan baik. Selain itu, manuskrip tersebut telah didigitalisasikan bersama-sama dengan koleksi manuskrip Jawa lainnya dari British Library. 

This image has an empty alt attribute; its file name is photo_2023-03-10_12-52-22.jpg

Bahasa Jawa yang dipertuturkan oleh lebih dari 100 juta orang yang mayoritas tinggal di Pulau Jawa adalah salah satu bahasa yang unik di dunia karena memiliki tradisi literatur dalam tiga sistem penulisan: Alfabet Latin, Abjad Pegon, dan Aksara Jawa (turunan Aksara Kawi dari abad ke-8). Oleh karena itu, tidak jarang ada buku yang ditulis dalam tiga aksara yang berbeda.

This image has an empty alt attribute; its file name is photo_2023-03-10_12-52-19.jpg

Karena sedikitnya literatur dalam bahasa Jawa, terutama untuk buku-buku lama yang sulit ditemukan lagi, Komunitas Wikimedia Yogyakarta berharap buku yang tersedia di Wikisumber dan artikel di Wikipedia bahasa Jawa dapat menjadi sumber bacaan berbahasa Jawa yang dapat diakses dengan bebas.

Menguji baca manuskrip aksara Jawa memiliki kesulitannya sendiri. Wikipedia bahasa Jawa baru menyediakan cara mengetik aksara Jawa pada tahun 2013 dan banyak orang masih tidak terbiasa mengetik dengan aksara mereka sendiri karena jarang menggunakannya dalam kehidupan sehari-hari. Beberapa video tutorial untuk mengetik dengan Universal Language Selector telah disediakan. Lokakarya daring juga diselenggarakan oleh GLAM Indonesia pada bulan Oktober 2022 lalu. Salah satu hal yang membantu peserta kompetisi dalam menguji baca ketiga manuskrip adalah hasil transkripsi dari Yayasan Sastra Lestari, walaupun transkripsinya berupa transliterasi ke dalam huruf Latin. Jika peserta menemui kesulitan dalam membaca naskah manuskrip, mereka dapat merujuk ke situs Sastra.org untuk melihat transliterasinya sebagai bantuan.

This image has an empty alt attribute; its file name is photo_2023-03-10_12-52-20.jpg

Kompetisi Wikisumber diadakan hampir bertepatan dengan peluncuran Wikisource Loves Manuscript yang memiliki tujuan untuk mendigitalisasi, mempreservasi, dan mentranskripsikan lebih dari 20 ribu halaman manuskrip di Indonesia. Menguji baca naskah non-Latin sebetulnya bisa menggunakan OCR (Pengenalan Karakter Optis), layaknya menguji baca sebuah buku Latin. Sayangnya, penggunaan OCR untuk aksara Jawa belum memungkinkan. Proyek percontohan Wikisource Loves Manuscript menggunakan alat berbasis kecerdasan buatan bernama Transkribus untuk membantu mengotomatisasi pengenalan teks. Namun, teknologi ini memiliki sebuah persyaratan agar dapat mengenali karakter dengan baik. Transkribus perlu dilatih terlebih dahulu dengan data yang sudah ada (naskah aksara Jawa dan transkripsinya). Saat ini alat tersebut belum dapat dilatih karena belum ada data untuk transkripsi aksara Jawa dari manuskrip. Kondisi ini menjadi latar belakang Kompetisi Wikisumber diadakan. Dengan menguji baca manuskrip beraksara Jawa dan menyediakan transkripsinya, Transkribus dapat belajar bagaimana membedakan karakter-karakter aksara Jawa. Semakin banyak data dan latihan, alat tersebut akan semakin mumpuni. Semoga pada kompetisi Wikisumber selanjutnya alat ini sudah cukup baik untuk digunakan dan dapat menyediakan teks OCR dasar untuk kemudian diperiksa (diuji baca). Nantinya, semakin banyak pengetahuan yang ditulis dalam aksara Jawa bisa diakses dan dibaca oleh masyarakat dengan mudah.