منقح اللغة العربية

المحاور الرئيسية:
1. المنقح الإملائي
2. المنقح النحوي
3. الإعراب
4. استخدام الخدمة في المواقع الإلكترونية

المنقح الإملائي:
كثيراً ما نشاهد العديد من الأخطاء الإملائية في المواقع الإلكترونية عندما نتصفحها والأسباب كثيرة، منها السرعة في الكتابة، صغر سن الكاتب، عدم تمكنه من قواعد اللغة العربية، والعديد من الأسباب الأخرى. مهمة التنقيح اليدوية مجهدة وتحتاج وقتاً طويلاً، فكانت الفكرة باستخدام قوة الحواسيب وانتشار الإنترنت في إيجاد تطبيق ويب (Web Application) يقوم بهذه المهمة استناداً إلى قاعدة بيانات تحتوي على آلاف الكلمات العربية الصحيحة، حيث يقوم بتجزئة الجملة التي أدخلها المستخدم إلى كلمات، ومقارنة هذه الكلمات مع الكلمات الموجودة لديه وفي حال عدم وجود تطابق يعتبر هذه الكلمة خاطئة إملائياً، وبالتأكيد الكلمات الموجودة في قاعدة بيانات التطبيق ليست شاملة ولذلك سيكون بإمكان المستخدم اقتراح كلمة غير موجودة في التطبيق لضمها إلى قاعدة البيانات وهكذا سيكون للتطبيق نكهة الويب 2.0 أي التفاعل مع المستخدم وإسهام المستخدم في إثراء التطبيق.

شكل المنقح الإملائي

شكل المنقح الإملائي

المنقح النحوي:
المرحلة التالية للتطبيق ستكون إمكانية اكتشاف الأخطاء النحوية (مثل: “جمع الفلاحين المحصول” والصحيح “جمع الفلاحون المحصول”، أيضاً: “الرياضةَ مفيدة” والصحيح “الرياضةُ مفيدة”).
سيقوم التطبيق “منقح اللغة العربية” بدراسة الجملة، تحليلها وتحديد نوعها، ثم تحديد نوع كل كلمة نحوياً، وبعد ذلك التقاط الأخطاء الموجودة في هذه الجملة وإظهار هذه الأخطاء وإظهار البديل الصحيح أو الأقرب إلى الصحيح.

الإعراب:
الخطوة الثالثة ستكون إمكانية إعراب جملة كاملة بناءً على الميزتين السابقتين، سيدخل المستخدم جملة كاملة وسيقوم التطبيق:
1.  دراسة الجملة نحوياً وتحديد نوعها.
2.  تحديد نوع كل كلمة نحوياً.
3.  إعراب الكلمات بناء على نوعهم ومكانهم في الجملة.

استخدام الخدمة في المواقع الإلكترونية:
سيتم بناء واجهة تخاطب (API) مع خدمة “منقح اللغة العربية”، لاستخدامها في المواقع بطريقة بسيطة وسهلة لأي مدير موقع. حيث سيقوم فقط بنسخ أسطر جافاسكربت بسيطة لاستخدام الخدمة في موقعه، وسيحدد مدير الموقع المحتوى المراد تنقيحه وبعدها ستقوم الخدمة بإرسال هذا المحتوى وتحليله إملائياً ونحوياً وفي النهاية تقوم بوضع خط أحمر تحت الكلمات الخاطئة إملائياً وخط أخضر تحت الكلمات الخاطئة نحوياً في موقعه، وبهذه الطريقة ستقوم هذه الخدمة بخفض الأخطاء الإملائية والنحوية في المواقع بشكل كبير للوصول إلى لغة عربية سليمة وأيضاً تعليم القواعد العربية بشكل ضمني.

استخدام الخدمة في موقع كمثال

استخدام الخدمة في موقع كمثال

28 من التعليقات لـ “منقح اللغة العربية”

  1. [...] قريباً بإذن الله سيتم كتابة مجموعة من المقالات التي تتحدث عن التقنيات المستخدمة في منقح اللغة العربية. [...]

  2. فكرة جيدة ومشروع طموح يا خالد.
    سيكون من الجيد طرح المشروع كمصدر حر مفتوح المصدر، لتحصل على دعم باقي المبرمجين المهتمين بالموضوع. والأفضل الاعتماد على المشاريع السابقة وعدم البدء من الصفر، لو هناك مشاريع سابقة شبيهة.

    أتمنى لك التوفيق

  3. خالد قال:

    بالتأكيد هذه النقاط بالذات سجلتها والآن أقوم ببعض الأبحاث عن هكذا مشاريع لكي لا اضطر للبدء ببعض الأمور من الصفر وإذا لديك روابط تفيدني فأرسلها من فضلك.

    سيتم وضع مخطط كامل للمشروع وطرحه على شكل مصدر مفتوح للاستفادة منه وتبادل الخبرات وبالفعل تم إنجاز قسم من المشروع وبالذات المنقح الإملائي أما المنقح النحوي فبحاجة لبعض الوقت.

    شكراً لمرورك.

  4. Adnan قال:

    مشروع كبير وسوف يأخذ الكثير من الوقت,
    1- هل وجدت قاعدة بيانات لكلمات اللغة العربية أم أنك سوف تنشأ واحدةً خاصةً بك؟
    2-إذا بقدر ساعدك بساعدك :) ,أقترح ان تنشأ استضافة SVN للمشروع أو على Sourceforge.net كما قال الأخ محمد سعيد احجيوج.
    حكيت بالفصحة ,تعبت:-))).
    سلام.

  5. خالد قال:

    1- نعم استعنت بمعاجم عربية كالقاموس المحيط ولسان العرب.
    2- إن شاء الله في SVN عندي بالسيرفر وإن شاء بس رتب الأمور والكود بنشأ هالشي كله على سيرفري ليش السورس فورج :)

  6. Saeed Alkhen قال:

    فكرة رائعة و جميلة و الأحلى منها فكرة الموقع, أعطاك الله العافية….
    عودة إلى فكرة المشروع : أرجو ان تسمح لي بالمساعدة في هذا المشروع, فأنا و الحمد لله أمتلك بعض الأفكار البسيطة عن موضوع استخلاص جذر الكلمة العربية وتجريدها من الزوائد و الضمائر لتعود إلى الجذر الثلاثي, الرباعي أو الخماسي, تدعى هذه الآلية باللغة الانكليزية بالـ Stem Extracting….
    أرجو ان يكون التعليق مفيداً

    السلام عليكم و بالتوفيق………….

  7. ميمون قال:

    السلام عليكم

    بارك الله فيك أخي خالد، نشيط ماشاء الله عليك

    في الحقيقة فقط البارحة كنت أناقاش الموضوع مع أحد الاصدقاء,
    على فكرة هناك أحد الاخوة قام بمشروع مماثل للمكتب المفتوح على ماأذكر,

    على كل حال و كما قال الاخ سعيد و الاخ عدنان سيكون فعلا أمرا مفيدا طرح التطبيق
    كمشروع مفتوح المصدر لتسريع وتيرته,

    وفقك الله أخي الحبيب

    • خالد قال:

      وعليكم السلام ورحمة الله،

      تسلم أخي ميمون، سأضيفه لقائمة المصادر التي سأطلع عليها ولو في وسيلة للتواصل مع الأخ اللي نفذ هالفكرة عالمكتب المفتوح يكون ممتاز.

  8. خالد قال:

    المعلم سعيد هنا!
    إذا بتقدر ترسل لي إيميل بهذه الأفكار مع كل المصادر الممكن أن تساعد في سير المشروع وأتمنى فعلاً أن تكون في فريق التطوير.

    وعليكم السلام ورحمة الله

  9. الفكرة رائعة ..
    في انتظار المشروع

    • خالد قال:

      إن شاء الله خلال أيام قليلة سأتكلم عن ماتم إنجازه وعن المخطط الزمني المتوقع لإنهاء أجزاء المشروع.

  10. إبتداء من 20 مايو سيتم في القاهرة لقاء برمجي لحل بعض المشاكل المتعلقة باللغة العربية. مشروعك هذا يتقاطع مع الأفكار التي سيتم تنفيذها خلال اللقاء. لا أدري إن كان الوقت ما زال كافيا لتحصل على دعوة للمشاركة في هذا اللقاء. سيكون من الجيد الاشتغال رفقة الفريق المشاركة. سأعلم المنظمين، ربما ما تزال الفرصة سانحة لمشاركتك.

    • خالد قال:

      جميل جداً وتمنيت أن يوجد تفاصيل أكثر عن هذا الماراثون البرمجي، لازلت اتبحر بالمصادر والمشاريع والمكتبات العالمية بخصوص معالجة اللغة العربية.
      شكراً لك على الاهتمام بهذا المشروع المتواضع أخ سعيد.

  11. محمد قال:

    إذن، خطوة للأمام تحسب لك يا خالد!
    الكثير يعيب تواجد أخطاء إملائية، تفردت بإيجاد حل عملي، سر للأمام إن شاء الله.

    أعتقد أن التطبيق شبيه شيءا ما بالموجود في MS Word النسخة العربية (تصحيح الكلمات، النحو.. لكنه ليس تطبيق ويب طبعا)، لربما توفر جزء منه للمطورين..

  12. [...] المختبر هو من بين مشاريع المدون خالد الحوراني الكثيرة والمشروع الجديد هو مكان لتجميع الأفكار البرمجية المتميزة والتي يجري العمل على تطويرها وتحسينها، وأول هذه  الافكار هو فكرة إنشاء منقح اللغة العربية [...]

  13. فكرة رائعة ومتابع لأخبار المشروع أولاً بأول

  14. مشروع أكثر من رائع لا يسعنى أن نقول إلا بارك الله فيك ووفقك على هذه المجهودات الرائعة

    لا تنسى تخلي لها إضافة بالووردبريس بنحتاجها كثير بعالم التقنية :)

    بالتوفيق يارب, وألف مبروك على المختبر فكرته أكثر من رائعة

  15. ميمون قال:

    السلام عليكم

    وجدت رابط في في موقع لينوكس المغرب قد يساعد في المهمة
    المدقق الإملائي العربي الحر http://www.linux-maroc.org/ar/946_

    • خالد قال:

      وعليكم السلام ورحمة الله،
      أخي ميمون بارك الله فيك انتهيت الآن من معظم أوراق البحث واتجه لقراءة بعض الأكواد التي كتبت لهذا الغرض فجاء الرابط في وقته.

  16. Vexard قال:

    المشروع راائع بمعنى الكلمة ولا اجد الكلام للوصف
    وما يزيد المشروع روعة اقتراح ان يكون له API بحيث يسهل استخدامة
    جزاك الله خيؤا استاذ خالد ووفقك فى اكمال المشروع
    (وعذرا اذا كن تعليقى غير مطابق لقوانين اللغه فليس لدى منقح للغه ههه :) )

  17. توفيق قال:

    أنا بحاجة لمثل هذه قاعدة البيانات لبرنامج ضروري أعمل عليه
    أتمنى ان تساعدني في حال توصلت لها

  18. bassem قال:

    مبروك المختبر خالد
    موفق بالمشروع مستني ال SVN

  19. طارق قال:

    بالتوفيق مشروع رائد

  20. rssam قال:

    السلام عليكم ..
    فكرة أكثر من رائعة أخي خالد ..
    تدل على فكرك النير ، وعبقريتك الفذة بلا مجاملة ..
    المشروع في الحقيقة صعب جداً .. لكن من كان عنده دافع و هدف فالأمر أسهل بكثير ..
    ولن تنال المجد حتى تلعق الصبرا ..
    كان لي مشروع بسيط ، ارتكزت على الجانب الإملائي ..
    أود لو أتوصل معك بشكل أكبر ،
    ومن دواعي سروري المشاركة معك في إنجاز هذا المشروع .. من الناحية اللغوية والإملائية ..
    تحياتي العميقة لك ..

  21. خالد قال:

    شكراً للجميع المشروع قيد العمل الآن.

إكتب تعليقك

عن المختبر

مختبر حلولي هو مكان لتجميع الأفكار البرمجية المتميزة والتي يجري العمل على تطويرها وتحسينها، أيضاً يوجد مقالات متنوعة عن هذه المشاريع والتقنيات المستخدمة فيها.