Kompetisi Wikisumber 2023

Pada tanggal 6 Maret, Komunitas Wikimedia Yogyakarta mengadakan Kompetisi Wikisumber yang pertama. Meskipun ini kali pertama Wikimediawan Yogyakarta melakukan kegiatan ini, mereka sudah tidak asing lagi dengan edit-a-thon dan tantangan menulis, setelah sebelumnya melaksanakan tantangan menulis WikiTeroka 3.0 (2022) dan WikiTeroka 4.0 (2023) untuk Wikipedia bahasa Jawa. Bahkan sebenarnya ini bukan pertama kalinya Wikisumber bahasa Jawa terlibat dalam kompoetisi, setelah sebelumnya Komunitas Wikisource Indonesia mengadakan Kompetisi Wikisource 2022 tahunan ketiga, yang mengundang Wikipustaka Bali dan Wikisumber Jawa yang baru saja diluncurkan pada tahun 2021 untuk ikut berpartisipasi. Dalam kompetisi tersebut, ada 10 buku bahasa Jawa Latin dan 2 buku beraksara Jawa yang dikerjakan, dengan jumlah total sekitar 2 ribu halaman yang diuji baca dan divalidasi dalam waktu 2 minggu.

This image has an empty alt attribute; its file name is photo_2023-03-10_12-52-19.jpg

Apa keistimewaan Kompetisi Wikisumber kali ini? Di samping menguji baca sekitar 30 buku bahasa Jawa Latin dengan berbagai topik, para peserta juga dapat menguji baca 3 manuskrip istimewa yang berasal dari akhir abad ke-18 dan awal abad ke-19. Ketiga manuskrip ini ialah Serat Jaya Lengkara Wulang (1803) – BL MSS Jav 24, Serat Sélarasa – BL MSS Jav 28, dan Serat Damar Wulan – BL MSS Jav 89. Ketiga manuskrip tulisan tangan ini berjumlah lebih dari seribu halaman dan tersimpan dengan baik serta telah didigitalisasikan bersama-sama dengan koleksi manuskrip Jawa lainnya dari British Library. Bahasa Jawa yang dipertuturkan oleh lebih dari 100 juta orang yang mayoritas tinggal di Pulau Jawa di Indonesia, adalah salah satu bahasa yang unik di dunia, karena memiliki tradisi literatur dalam tiga sistem penulisan: Alfabet Latin, Abjad Pegon, dan Aksara Jawa (yang merupakan turunan Aksara Kawi dari abad ke-8). Oleh karena itu, tidak jarang ada buku yang ditulis di dalam tiga aksara yang berbeda, walaupun saat ini sulit untuk mencari publikasi-publikasi dalam bahasa Jawa.

This image has an empty alt attribute; its file name is photo_2023-03-10_12-52-20.jpg

Karena sedikitnya literatur dalam bahasa Jawa, terutama untuk buku-buku lama yang sulit ditemukan lagi (hampir semua buku bahasa Jawa sudah tidak dicetak ulang), Komunitas Wikimedia Yogyakarta berharap buku-buku yang kini tersedia di Wikisumber – dan artikekl-artikel di Wikipedia bahasa Jawa – dapat menjadi sumber-sumber bacaan berbahasa Jawa yang berkualitas yang dapat diakses dengan bebas.

Menguji baca manuskrip aksara Jawa juga memiliki kesulitannya sendiri. Masukan menggunakan aksara Jawa baru tersedia di Wikipedia bahasa Jawa pada tahun 2013, dan banyak orang masih tidak terbiasa mengetik dengan aksara mereka sendiri, karena jarang menggunakannya dalam kehidupan sehari-hari. Beberapa video tutorial untuk mengetik dengan Universal Language Selector telah disediakan, dan lokakarya daring telah diselenggarakan oleh GLAM Indonesia pada bulan Oktober yang lalu. Salah satu hal yang membantu peserta kompetisi dalam menguji baca ketiga manuskrip tersebut adalah hasil transkripsi dari Yayasan Sastra Lestari, walaupun transkripsinya berupa transliterasi ke dalam huruf Latin. Jika peserta menemui kesulitan dalam membaca naskah manuskrip, mereka dapat merujuk ke situs Sastra.org untuk melihat transliterasinya sebagai bantuan.

This image has an empty alt attribute; its file name is photo_2023-03-10_12-52-22.jpg

Kompetisi ini dilangsungkan hampir bertepatan dengan peluncuran Wikisource Loves Manuscript di Jakarta pada Hari Bahasa Ibu Internasional, yang memiliki tujuan untuk mendigitalkan, mempreservasi, dan mentranskripsikan lebih dari 20 ribu halaman manuskrip di Indonesia. Idealnya, sama seperti ketika seseorang menguji baca sebuah buku Latin ia dibantu oleh OCR (Pengenalan Karakter Optis), maka untuk pengujibacaan naskah non-Latin juga dapat menggunakan OCR. Namun sayangnya saat ini hal tersebut belum dimungkinkan dengan aksara Jawa. Proyek percontohan Wikisource Loves Manuscript bertujuan untuk menggunakan alat berbasis kecerdasan buatan bernama Transkribus untuk membantu mengotomatisasi pengenalan teks. Namun teknologi ini memiliki sebuah persyaratan: agar alat ini dapat mengenali karakter dengan baik, maka Transkribus perlu dilatih terlebih dahulu dengan data yang sudah ada (naksah Aksara Jawa dan transkripsinya). Karena saat ini belum ada data untuk transkripsi aksara Jawa dari manuksrip, maka alat tersebut belum dapat dilatih. Inilah mengapa Kompetisi Wikisumber diadakan; dengan menguji baca manuskrip beraksara Jawa dan menyediakan transkripsinya, maka Transkribus akan dapat belajar bagaimana membedakan karakter-karakter Aksara Jawa. Dengan semakin banyak data dan latihan, maka alat tersebut akan semakin mumpuni. Semoga di kompetisi Wikisumber selanjutnya, alat ini sudah akan menjadi cukup baik untuk dapat digunakan dan dapat menyediakan teks OCR dasar untuk kemudian diperiksa (diuji baca) oleh Wikisumberwan. Dari sana, akan semakin banyak pengetahuan yang ditulis dalam aksara Jawa, yang sebelumnya tidak dapat dengan mudah diakses dan dibaca oleh masyarakat luas, akan terbuka dan kearifan yang terkandung di dalamnya dapat dibagikan ke pembaca moderen.

Kompetisi Wikisumber 2023 berlangsung tanggal 6-20 Maret 2023. Peserta terbuka untuk umum, tanpa harus memahami bahasa Jawa (khusunya untuk menguji baca buku-buku Latin). Namun hadiah untuk pemenang utama dan peserta yang mendapatkan suvenir hanya akan dikirimkan ke alamat di Indonesia.