Sözlükbilimsel veri nedir?

Türkî Wikimedistlere yönelik Vikiveri Eğitimleri konferansının grup fotoğrafı, İstanbul 2022

Kasım 2022’nin sonlarında İstanbul’daki Üsküdar Üniversitesi, Wikimedia Topluluğu Kullanıcı Grubu Türkiye ve Türk Dilleri Kullanıcı Grubu tarafından düzenlenen “Türk dillerinde konuşan Wikimedia katılımcıları için Wikidata eğitimleri günleri” konferansına ev sahipliği yaptı. Bu konferansın temel amacı, ağırlıklı olarak Türk dilleri konuşulan bölgelerden gelen katılımcıların yeterliliklerini geliştirirken, Vikiveri’ye özellikle odaklanarak Wikimedia projelerini geliştirmekti. Konferansın ikinci gününde Asaf Bartov daha önce bilinmeyen bir konuyu tanıttı: Sözlükbilimsel veriler veya kısaca Sözcükbirimleri.

2012’de kurulan Vikiveri, başlangıçta Q ögelerinin onları temsil eden kelimelerden ziyade, fikirlerle ilişkilendirildiği kavramsal öğelere odaklandı. 2018’den bu yana, Vikiveri’ye, her biri karşılık gelen dillerde titizlikle açıklanan çok sayıda dildeki kelimeleri, ifadeleri ve cümleleri kapsayan yeni bir veri kategorisi dahil edildi. Bu dilsel bilgi deposu, Lexemes (L), Forms (F) ve Senses (S) olarak bilinen benzersiz varlıklar içinde barındırılır.

Kelimelerin kesin betimlemeleri, altta yatan kavramlarla doğrudan ilişkilidir ve editörlere çeşitli dillerdeki tüm kelimeleri titizlikle tanımlama yeteneği sağlar. Vikiveri’nin tüm deposuna benzeyen bu yapılandırılmış veriler yeniden kullanılabilir ve topluluğun kullanabileceği çeşitli araçlar ve sorgular için değerli bir kaynak görevi görür. Özellikle sözlükbilimsel veriler Vikisözlük’ü büyük ölçüde destekleyebilir.

Projenin logosu

Bu girişim kapsamında, eş anlamlılar (örneğin, canlı /lɪv/ ve canlı /laɪv/) ve aynı kökene sahip sözcükler (örneğin, yakın, yakın anlamına gelir veya yakın, kapalı anlamına gelir) birbiriyle bağlantılıdır. Ayrıca, birden fazla dilbilgisel role sahip kelimeleri tanımlar. Bu girişimin önemli bir yönü, farklı kelimelerin morfolojik ve anlamsal çeşitlemelerini gösteren pratik örneklerin her birine açıklayıcı bir kullanım durumu eşliğinde sunulmasıdır. Proje, kelimeleri ve anlamlarını titizlikle etiketleyerek kelime kayıtları ve formatları hakkında paha biçilmez bilgiler sağlamaktadır. Örneğin, “man” genellikle resmî ve akademik metinlerde kullanılırken, “guy” günlük konuşma dilinde kullanılır.

Vikiveri sözcük birimleri alanında, tek tek bileşenlerin ayrı girişlere sahip olduğu bileşik sözcüklerde bile sözcük köklerinin yeri belirlenebilir. Bu proje aynı zamanda çeşitli dillerdeki kelime anlamlarının ve bu dillerdeki tam karşılıklarının da dahil edilmesine olanak sağlamaktadır. Üstelik, görsellerin eklenmesi, insan sesi kayıtları ve kelime dağarcığı için Uluslararası Fonetik Alfabe (IPA) dahil olmak üzere çok sayıda olanak sunar. Özellikle avantajlı bir yanı, kelimelerin karşılık gelen Vikiveri sayfalarına bağlanmasıdır; burada kullanıcılar kelimelerin soyut anlamlarının ötesine geçerek derinlemesine açıklamalara erişebilirler.

Kullanımı:

Bu çaba kullanıcılara çok sayıda yetenek kazandırmakta ve ben bunların arasında en önemlilerini açıklayacağım:

  • Çeviri Makinesi: Eşler arası eşleştirmeye dayanan mevcut çeviri sistemlerinden farklı olarak bu proje, metni kapsamlı bir şekilde okuma ve anlama yeteneğine sahip bir çeviri makinesinin geliştirilmesini kolaylaştırıyor. Bu, kelimelerin anlamlarının çeşitli dillerde birleştirilmesiyle mümkün olmaktadır.
  • Metin okuma: Tüm kelimeler için telaffuz ve IPA’nın varlığı sayesinde, görme engellilerin metin okumasına yardımcı olacak yazılımların oluşturulması mümkün hale gelmektedir.
  • Dilbilgisi ve Yazım Denetimi Araçları: Bu proje tarafından oluşturulan verilerden yararlanılarak dilbilgisi ve yazım denetimi araçları, dilsel hataları düzeltmek için tasarlanabilir.
  • Bilgi Kartları: Dil öğretimi alanında bilgi kartları son derece etkilidir ve modern öğrenciler yeni diller edinmek için bunları sıklıkla kullanırlar. Bu projeden elde edilen veriler, bilgi kartları hazırlamak için değerli bir kaynak görevi görüyor.
  • Dilbilgisi pratiği: Bu projeye farklı kelimelerin dilbilgisel özelliklerinin dahil edildiği göz önüne alındığında, mevcut veriler dilbilgisi uygulamaları için en iyi şekilde kullanılabilir. Öğrencilerin dilbilgisi yanlışlarını düzeltmelerine yardımcı olacak yazılımlar tasarlanabilir.
  • Telaffuz alıştırması: Her kelime bir telaffuz ses dosyasıyla donatıldığından, öğrenciler kendi telaffuzlarını anadili İngilizce olan kişilerin telaffuzlarıyla karşılaştırabilirler.

Artık ülkenizdeki bu öncü projenin ilk katılımcısı olma fırsatına sahipsiniz. Yeniliği ve şu ana kadar sınırlı katılımı göz önüne alındığında, projenin kullanıcı topluluğu yeni gelenleri memnuniyetle karşılıyor ve onlara yardım etmeye kararlı. Sorularınız varsa lütfen aşağıdaki adresteki Telegram grubunu kullanın: Telegram Grup Bağlantısı. https://t.me/joinchat/ICn09hkymb2dwpFKwGo5uA

No comments

Comments are closed automatically after 21 days.