جرار في "شومان": المادة العربية المحوسبة ما تزال ضعيفة

10-03-2020

دعا أستاذ الذكاء الاصطناعي وحوسبة اللغة في جامعة بيرزيت الفلسطينية، د. مصطفى جرار إلى ضخ المزيد من نتاجاتنا المعرفية والعقلية والفكرية والعلمية المتعقلة باللغة العربية في الحاسوب؛ لتوفير فضاء معرفي حقيقي متاح للجميع.

وبين جرار أن حوسبة اللغة العربية بات أمراً ضرورياً، إذ لا تزال المادة العربية في قواعد البيانات والقواعد الحاسوبية "ضعيفة".

واستعرض جرار في محاضرة "تجربة بناء أضخم قاعدة بيانات لغوية في تاريخ اللغة العربية"، نظمها منتدى عبد الحميد شومان الثقافي، ذراع البنك العربي للمسؤولية الثقافية والاجتماعية، أمس الإثنين، الجهود المبذولة في جامعة بيرزيت من أجل حوسبة اللغة العربية، وإثراء المحتوى الرقمي باللغة العربية عبر شبكة الانترنت.

وحسب جرار، فإن الجامعة تستخدم محركات: "البحث المعجمي"، و"الانطولوجيا العربية"، و"كراس للهجة العامية الفلسطينية"، وهي متاحة جميعها لاستخدام الباحثين والجمهور مجاناً عبر موقع الجامعة الإلكتروني.

وفي المحاضرة التي أدارها مع الجمهور أمين عام مجمع اللغة العربية الأردني د. محمد السعودي، بين جرار أن "محرك البحث المعجمي" لجامعة بيرزيت الأول من نوعه في العالم ليس فقط على مستوى اللغة العربية، بل على مستوى جميع اللغات المستخدمة عبر شبكة الانترنت، حيث تتضمن قاعدة بيانات المحرك حوسبة (150) معجما عربيا مختلفا، سواء المعاجم اللغوية العامّة التراثية والحديثة، أو المعاجم العلمية المتخصصة في مختلف مجالات العلوم التطبيقية والإنسانية.

ويوفر المحرك، بحسب جرار، ترجمة دقيقة بالعربية للمصطلحات والألفاظ الأجنبية، وبما يتجاوز الأخطاء والمغالطات الكثيرة التي تعتري ترجمات محركات البحث شائعة الاستخدام مثل محرّك (جوجل ترانزليت)، حيث تعتمد المحركات على غرار (جوجل) ما يسمى "الترجمة الإحصائية" لمعاني المفردات والكلمات، وليس الترجمة "المعجمية" المنضبطة، كما في محرك جامعة بيرزيت.

وسلط جرار، الفائز بجائزة عبد الحميد شومان للباحثين العرب لدورة العام 2019- حقل العلوم التكنولوجية والزراعية (حوسبة اللغة العربية)، الضوء على منهجيات جديدة لتوصيف اللغة العربية من أجل النهوض بها لمواكبة عصر المعرفة والذكاء الاصطناعي.

واستعرض أيضاً، أضخم قاعدة بيانات لغوية في تاريخ اللغة العربية؛ وهي شبكة لغوية شاملة تحتوي على جميع المستويات التصريفية، والاشتقاقية، والدلالية، والأنطولوجيا، والعامية، بشكل مترابط، إضافةً لربطها بشبكات لغوية أجنبية.

ولفت جرار إلى أن زيادة الاهتمام بالمصادر اللغوية كـ (معاجم، مكانز، مسارد، أنطولوجيات..)، يأتي بهدف بناء تطبيقات حاسوبية، مثل: الترجمة الآلية، استرجاع البيانات بأكثر من لغة، فهم وتحليل النصوص المكتوبة والمنطوقة، التحدث مع الآلة.

إلا أن عدم دعم التطبيقات الحديثة للغة العربية، يعود، بحسب جرار، إلى شح المصادر اللغوية العربية المحوسبة، إذ لا يوجد قائمة بجميع المدخلات العربية، كما لا يوجد مصادر لغوية حديثة.

وأوضح المحاضر أن جامعة بيرزيت ساهمت في جمع ورقمنة وتنقيح ودمج وتوحيد المصادر اللغوية، وإتاحتها للجمهور العربي والباحثين ومتعلمي اللغة العربية، ومطوري التطبيقات عبر واجهات برمجية (APIs).

وبشأن محرك "الانطولوجيا العربية"، بين جرار أنه يهدف إلى ضبط فوضى التعريفات والدلالات والمفاهيم في اللغة العربية، والتي تعتري حتى النقاشات العلمية والأكاديمية المتخصصة، فيما يستعير المحرك ذاته مفهوم "الانطولوجيا" من الفلسفة، والذي يعني "علم الوجود"، أو علم "ماهية الأشياء"، كما تشير إليه المصادر التراثية العربية.

لكن محرك "كراس"، يأتي، وفق جرار، استجابة لحقيقة واقعية مفادها أن نسبة كبيرة من المحتوى العربي عبر شبكة الانترنت مكتوب باللهجات العامية، وعدم قدرة محركات البحث وأجهزة الحاسوب على التعرّف على هذه اللهجات.

وبحسبه، قاعدة البيانات المعجمية، هي أضخم قاعدة بيانات للغة العربية ومتعددة اللغات تحتوي على أنواع كثيرة من المصادر اللغوية، مثل: معاجم لغوية، ومعاجم ثنائية/ثلاثية اللغة، وقواعد بيانات تصريفية، ومسارد، ومكانز، وفروق لغوية، والأنطولوجيا العربية، وغيرها، في حين تغطي مجالات عدة: علوم، وهندسة، وصحة وطب، وفلسفة، وإنسانيات، وفنون.

من جهته، أكد السعودي في معرض تقديمه للمحاضر أهمية حوسبة اللغة العربية من خلال مشروعات ضخمة تعيد لها مكانها من جديد من خلال حوسبتها، وإيجاد مرجعية متخصصة لمأسسة ومراقبة آليات عمل مراكز تعليم اللغة العربية لغير الناطقين بها.

واعتبر السعودي أن المحاضرة قدمت لمحة عامة ومهمة عن توجهات علمية جديدة في تعريف وتوصيف دلالة الكلمة، وهي ما يعرف بالأنطولوجيا اللغوية والتي تعتبر البنية التحتية الأساسية لبناء تطبيقات ذكية في المستقبل.

يشار إلى أن "شومان"، ذراع البنك العربي للمسؤولية الثقافية والاجتماعية، هي مؤسسة لا تهدف لتحقيق الربح، تُعنى بالاستثمار في الإبداع المعرفي والثقافي والاجتماعي للمساهمة في نهوض المجتمعات في الوطن العربي من خلال الفكر القيادي والأدب والفنون والابتكار.