تكنولوجيا
لماذا يواجه التعلم الآلى صعوبة مع اللغة العربية؟
يعد التعلم الآلي أحد أسرع التقنيات نمواً وأكثرها تحولاً في العالم، حيث إنه يتعامل على نطاق واسع مع الناطقين بالإنجليزية والصينية ويسمح للناس والاقتصادات باللحاق بركب التطور في وقت حاسم جداً، بحسب ما أشار موقع صحيفة ذا ناشيونال الإماراتية.
وذكر البروفيسور أشرف النجار، منسق مجموعة أبحاث التعلم الآلي ومعالجة اللغة العربية في جامعة الشارقة لصحيفة ذا ناشيونال، أن اللغة العربية تتخلف عن ركب التعلم الآلي، وأضاف أنه من المتوقع أن ينمو سوق التعلم الآلي العالمي من 7.3 مليار دولار (26.7 مليار درهم) عام 2020 إلى 30.6 مليار دولار عام 2024، وذلك وفقاً لتقرير عام 2019 الصادر عن موقع Market Research Future، لكن انتشار وباء كورونا حد من هذه النفقات، رغم استمرار الطلب على علماء تحليل البيانات.
يوجد حالياً حوالي 75000 قائمة وظائف نشطة حول العالم على موقع لينكد إن تطلب توظيف الأشخاص الذين يتمتعون بمهارات التعلُم الآلي، ومعظم هذه الوظائف مدرجة في الولايات المتحدة وآسيا وأوروبا الغربية.
هناك العديد من الأمثلة على ظهور التعلم الآلي في الحياة اليومية مثل توصيات نتفليكس أو قوائم التشغيل التي أنشأتها سبوتيفاي Spotify، وسيري Siri أو أليكسا Alexa، جنبا إلى جنب عندما ترسل شركة بطاقات الائتمان تنبيهاً نصياً حول نشاط احتيالي محتمل.
تستخدم الشركات أيضاً التعلم الآلي من أجل تكوين تصورات حول رؤى المستهلك وتحسين خدمة العملاء وخفض التكاليف وأتمتة العمليات، ولكن أغلب هذه البيانات المستخدمة لأي من هذه الأنشطة هي باللغة الصينية أو الإنجليزية، أو ربما الإسبانية أو الفرنسية، وهي اللغات الأكثر شيوعاً التي تغذي طفرة الذكاء الاصطناعي، وفقاً للبروفسور النجار الذي أوضح أن تحديات اللغة العربية تنقسم إلى شقين وهى تعقيد اللغة وكمية الموارد والبحوث التي وضعت موضع التطوير.
هناك أيضاً 3 أنواع مختلفة معترف بها من اللغة العربية، وهي العربية التقليدية، كما في لغة القرآن، واللغة الفصحى الحديثة، المستخدمة في المحادثات الرسمية وعبر التلفزيون، والعامية التي “تكتسب زخماً عبر وسائل التواصل الاجتماعي، وأكد البروفيسور النجار أن العامية لها سكانها وعملائها وهي في حالة ازدهار ولها 20 لهجة”.
إن التباين والغموض في المعنى يجعل اللغة العربية صعبة للغاية لتدريب الآلات على اتخاذ قرارات تشبه الإنسان عند قراءتها، وقد ساعد جون ليلي وايت، رائد التحول الرقمي في شركة الإعلام الأردنية (البوابة)، الشركة في الآونة الأخيرة على الفوز بمنحة من جوجل لمواجهة هذا التحدي، وكان عنوان عرضه: “لماذا لا تستطيع الآلات قراءة اللغة العربية على نطاق واسع؟”، وبدعم مالي من جوجل، سيعمل فريقه على جعل أحد أكبر أرشيفات الأخبار باللغة العربية في الشرق الأوسط قابلاً للبحث.
هناك طلب متزايد من قطاعي التجارة والمنح الدراسية لجعل قاعدة البيانات هذه قابلة للبحث، وفتحها أمام الناشرين والباحثين في الخارج الذين يمكنهم من استخراج المعنى والصورة من الأرشيف، وبمجرد تطوير الأداة، والتي من المتوقع أن تستغرق حوالي 18 شهراً، يصبح بالإمكان استخدامها من قبل منصات النشر ومواقع الويب الأخرى لتحسين تصفية المحتوى العربي والعثور عليه.
وقريباً، ستفتح الجامعة المخصصة للذكاء الاصطناعي في الإمارات العربية المتحدة، جامعة محمد بن زايد للذكاء الاصطناعي، أبوابها في يناير المقبل، وستشهد جامعة الشارقة اهتماماً أكبر من رجال الأعمال والقطاع الخاص للعثور على تطبيقات تجارية لأبحاثها، وأضاف البروفيسور النجار: “أعتقد أننا سنشهد خطوات كبيرة في العقد المقبل”. “إنها واعدة للغاية”.