
في عالم يقوده البحث الدلالي، والذكاء الاصطناعي، والبيانات المنظمة، لم تعد اللغة مجرد وسيلة تواصل، بل أصبحت طبقة بيانات تُبنى عليها الأنظمة الحديثة.
بالنسبة للغة العربية، ورغم غناها الصرفي والاشتقاقي، ظلّ تمثيلها داخل ويكي بيانات ناقصاً بشكل واضح؛ إذ لم يتجاوز عدد المعجميات العربية قبل بدء المشروع 2500 معجمية، وكان كثيرٌ منها يفتقر إلى البيانات الصرفية والاشتقاقية الأساسية، مع وجود جذور غير مرتبطة، وأوزان غير مكتملة، وأفعال بلا أشكال، ومفردات بلا إطار أنطولوجي واضح.
من هنا بدأت العمل على مشروع «إثراء المعجميات العربية» خلال الفترة من أغسطس إلى ديسمبر 2025، ليس كمحاولة تحسين جزئية فقط، بل كجهد عملي لاختبار إمكانية بناء طبقة لغوية عربية متماسكة داخل المنصة يمكن الاعتماد عليها لاحقًا في ويكاموس وغيرها من المنصات.
من فجوة واضحة إلى عمل ممنهج
في البداية، طوّرتُ لوحة بيانات لمساعدتي على فهم الواقع الفعلي للمفردات العربية، ومع بداية تحليل البيانات، تبيّن لي أن حجم الفجوة أكبر بكثير مما توقعت، وفي المقابل أن إمكانية البناء كانت متاحة إذا توفرت الأدوات والمنهجية.
اعتمدتُ على مزيج من العمل اليدوي والأدوات المساعدة لإنشاء المعجميات وربطها بالجذور العربية، وإضافة التصريفات الصرفية للأفعال، والأسماء المشتقة للأسماء والصفات.
حين تتحول الأرقام إلى بنية معرفية
خلال هذا المشروع ، تمكّنتُ من إنشاء أكثر من 33,000 معجمية عربية في ويكي بيانات، شملت الأفعال والأسماء والصفات والجذور. ولم يكن هذا الرقم مجرد توسّع كمي، بل نتيجة عمل منهجي شمل:
- تنظيم وربط أنماط مثل اسم الفاعل واسم المفعول واسم المصدر بالمعجميات المرتبطة.
- ربط نحو 4,000 جذر عربي بالمعاجم التاريخية مثل معجم الدوحة التاريخي للغة العربية ومعجم الشارقة التاريخي
- بناء تصريفات صرفية للأفعال بمتوسط يقارب 120 تصريفاً لكل فعل. (مثال)
- تطوير لوحة تفاعلية لتحليل المفردات العربية، تُمكّن من تتبع جودة البيانات، واكتشاف التكرار، وتحسين الاتساق العام
المعرفة الحرة لا تُبنى فردياً
رغم أن العمل بدأ بشكل فردي، إلا أن أهم تحول حدث عندما بدأ المجتمع يتفاعل معه. وقد تُوّج ذلك بتلقي دعوة من مجتمع ويكي بيانات العربي لتقديم دورة تدريبية ضمن فعاليات أيام ويكي بيانات. وخلال هذه الدورة، قدّمت خلاصة العمل في عرض تدريبي امتد لساعة كاملة، ركّز على بناء المعجميات، والربط الصرفي، وكيفية نمذجة اللغة العربية داخل المنصة. كما أعددت عرضاً تقديمياً مكوّناً من 47 صفحة، وحرصت على نشره بصيغة المستندات المنقولة على ويكيميديا كومنز ليكون مرجعاً مفتوحاً يمكن لأي مهتم الاستفادة منه.
بالنسبة لي، كانت هذه اللحظة تأكيداً على أن المشروع لم يعد مجرد جهد فردي، بل أصبح جزءاً من مسار تعلّمي ومجتمعي أوسع.
ما الذي يعنيه هذا للمستقبل؟
إن بناء بنية معجمية عربية داخل ويكي بيانات ليس غاية بحد ذاته، بل خطوة أساسية نحو:
- تحسين الترجمة الآلية
- دعم البحث الدلالي
- تمكين أدوات تحليل اللغة العربية
- تطوير تطبيقات تعتمد على البيانات اللغوية المنظمة
وكل هذه المجالات تعتمد بشكل مباشر على جودة وعمق البيانات المعجمية.
خلاصة التجربة
ما بدأته كمحاولة لفهم البيانات تحوّل إلى جهد لبنائها، وما انطلق كأداة بسيطة أصبح مدخلاً لإعادة تشكيل تمثيل اللغة العربية داخل أحد أهم مشاريع المعرفة المفتوحة. إن إنشاء أكثر من 33 ألف معجمية عربية لا يمثّل نهاية الطريق، بل يضع أساساً لبنية يمكن للمجتمع البناء عليها وتطويرها. وما تحقق حتى الآن ليس سوى خطوة أولى نحو ترسيخ حضور اللغة العربية في فضاء الويب الدلالي وتعزيز محتواها المعرفي.
في الختام، أتوجه بالشكر إلى مشروع المليون ويكي لرعايتهم المالية لهذا المشروع.
بقلم: Mr. Ibrahem
Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation