<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>المختبر</title>
	<atom:link href="http://labs.holooli.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://labs.holooli.com</link>
	<description>مشاريع مبتكرة!</description>
	<lastBuildDate>Wed, 20 May 2009 13:13:04 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
		<item>
		<title>المشاركة بمؤتمر صناعة المحتوى الرقمي العربي</title>
		<link>http://labs.holooli.com/2009/acnc-participation/</link>
		<comments>http://labs.holooli.com/2009/acnc-participation/#comments</comments>
		<pubDate>Tue, 19 May 2009 12:27:50 +0000</pubDate>
		<dc:creator>خالد</dc:creator>
				<category><![CDATA[أخبار]]></category>
		<category><![CDATA[منقح اللغة العربية]]></category>

		<guid isPermaLink="false">http://labs.holooli.com/?p=29</guid>
		<description><![CDATA[السلام عليكم، تم قبول مشروع منقح اللغة العربية في مؤتمر صناعة المحتوى الرقمي العربي في قصر الأمويين بدمشق، حيث تبدأ أعمال المؤتمر في 13\6 وتستمر لثلاثة أيام حتى تاريخ 15\6\2009. أيضاً يعقد بعد يومين مؤتمر للأعمال الناشئة (Entrepreneurship) في لبنان، سأحاول جاهداً حضوره حيث سيلقي الأستاذ حبيب حداد مؤسس يملي محاضرة قيمة وسيتسنى لي فرصة [...]]]></description>
			<content:encoded><![CDATA[<p>السلام عليكم،</p>
<p><a href="http://acnc.sy/site/acnc/index.php?path=cat-index/news-and-press-reports/61&amp;node-details=1" target="_blank">تم قبول مشروع منقح اللغة العربية</a> في مؤتمر <a href="http://acnc.sy" target="_blank">صناعة المحتوى الرقمي العربي</a> في قصر الأمويين بدمشق، حيث تبدأ أعمال المؤتمر في 13\6 وتستمر لثلاثة أيام حتى تاريخ 15\6\2009.</p>
<p>أيضاً يعقد بعد يومين مؤتمر <a href="http://www.entrepreneurs-forum.org/seminars.php" target="_blank">للأعمال الناشئة</a> (Entrepreneurship) في لبنان، سأحاول جاهداً حضوره حيث سيلقي الأستاذ <a href="http://www.yamli.com/" target="_blank">حبيب حداد مؤسس يملي</a> محاضرة قيمة وسيتسنى لي فرصة التواصل معه والاستفادة من خبراته في هذا المجال.</p>
]]></content:encoded>
			<wfw:commentRss>http://labs.holooli.com/2009/acnc-participation/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>التحليل الصرفي</title>
		<link>http://labs.holooli.com/2009/%d8%a7%d9%84%d8%aa%d8%ad%d9%84%d9%8a%d9%84-%d8%a7%d9%84%d8%b5%d8%b1%d9%81/</link>
		<comments>http://labs.holooli.com/2009/%d8%a7%d9%84%d8%aa%d8%ad%d9%84%d9%8a%d9%84-%d8%a7%d9%84%d8%b5%d8%b1%d9%81/#comments</comments>
		<pubDate>Mon, 18 May 2009 19:02:58 +0000</pubDate>
		<dc:creator>خالد</dc:creator>
				<category><![CDATA[منقح اللغة العربية]]></category>

		<guid isPermaLink="false">http://labs.holooli.com/?p=17</guid>
		<description><![CDATA[بداية لفهم نص أي لغة في العالم ينبغي فهم المكونات الأساسية لهذا النص ألا وهي الكلمات، فهم وتحليل الكلمة أو مايسمى بالتحليل الصرفي (morphological analysis) هو الأساس في تطبيقات استرجاع المعلومات (Information Retrieval) وهي التطبيقات التي تبنى عليها برامج الأرشفة، محركات البحث، محركات قواعد البيانات، تلخيص النصوص ومعالجة اللغات الطبيعية. بعض الطرق لفهم الكلمة تعتمد [...]]]></description>
			<content:encoded><![CDATA[<p>بداية لفهم نص أي لغة في العالم ينبغي فهم المكونات الأساسية لهذا النص ألا وهي الكلمات، فهم وتحليل الكلمة أو مايسمى بالتحليل الصرفي (<a href="http://en.wikipedia.org/wiki/Morphology_(linguistics)" target="_blank">morphological analysis</a>) هو الأساس في تطبيقات استرجاع المعلومات (<a href="http://en.wikipedia.org/wiki/Information_retrieval" target="_blank">Information Retrieval</a>) وهي التطبيقات التي تبنى عليها برامج الأرشفة، محركات البحث، محركات قواعد البيانات، تلخيص النصوص ومعالجة اللغات الطبيعية.</p>
<p>بعض الطرق لفهم الكلمة تعتمد على إرجاع الكلمة إلى جذرها (Root)، بينما يعتمد البعض الآخر على إرجاع الكلمة لأصلها (Stem) أي إزالة البوادىء واللواحق، وبمثال بسيط يتوضح الأمر: لنقل أن لدي كلمة &#8220;وكتابهم&#8221; فجذر هذه الكلمة هو &#8220;كتب&#8221; أم أصلها (stem) فهو &#8220;كتاب&#8221; بإزالة البوادىء واللواحق.</p>
<p>كلتا الطريقتين فعالتين وتستخدم الأولى (الجذر) في تطبيقات معالجة اللغات حيث نحتاج إلى جذر الكلمة، أما الثانية (الأصل) فتستخدم غالباً في تطبيقات تلخيص وأرشفة النصوص حيث لانحتاج إلى جذر الكلمة.</p>
<p>الوصول للجذر أو الأصل في اللغة العربية ليس بالأمر السهل فمن المعروف أن <a href="http://ar.wikipedia.org/wiki/%D9%84%D8%BA%D8%A7%D8%AA_%D8%B3%D8%A7%D9%85%D9%8A%D8%A9" target="_blank">اللغات السامية</a> من اللغات المعقدة بنيوياً، وبشكل عام يوجد أربع طرق مشهورة لمعالجة اللغة العربية:</p>
<ul>
<li>المقارنة المباشرة: حيث يستعمل التطبيق قائمة كبيرة من الكلمات ويقارن الكلمة المدخلة مع كامل القائمة لإيجاد الكلمة المطابقة لها والمعلومات المتعلقة بهذه الكلمة.</li>
<li>معالجة اللغة: تتفرع هذه الطريقة للكثير من الأساليب والطرق (سنتحدث عنهم لاحقاً)، تعتمد على إزالة الزوائد من الكلمة (البوادىء الأحرف الزائدة في بداية الكلمة واللواحق الأحرف الزائدة في نهايتها والأحرف الزائدة في منتصف الكلمة) ثم الوصول إلى الجذر (شرح مبسط جداً فقط لتوضيح الفكرة بينما الطريقة فيها الكثير من التفاصيل).</li>
<li>الدمج أو المجموعة: حيث تأخذ الكلمة المدخلة ويتم توليد عدة كلمات منها (مجموعة)، ونقارن هذه المجموعة مع قائمة بجذور الكلمات وعند وجود تطابق يكون هذا التطابق هو جذر تلك الكلمة.</li>
<li>القواعد (Rule-based): كل مجموعة متشابهة من حيث الشكل من الكلمات يتم توليد قالب أو باترن لها.</li>
</ul>
<p>بالتأكيد في الطريقة الأولى يوجد ضياع كبير بمساحة التخزين حيث نحتاج لمساحة هائلة إذا علمنا أن العدد التقديري لكلمات اللغة العربية هو من مرتبة 10 قوة 10 أي العشرة مليارات! بينما الطريقة الثانية هي الأكثر شيوعاً واستخداماً وكفاءةً وسنتحدث عنها بإذن الله في المرات القادمة بتوسع ونرى ماتم إنجازه في منقح اللغة العربية.</p>
<p>المصادر:</p>
<ul>
<li>Ahmed, Mohamed Attia, “A Large-Scale Computational Processor of the Arabic Morphology, and Applications.”</li>
<li>Ibrahim A. Al Kharashi, Imad A. Al Sughaiyer &#8220;Rule merging in a rule-based Arabic stemmer&#8221;</li>
</ul>
<p><em>ملاحظة: تم تحديث التدوينة وإضافة الطريقة الرابعة لمعالجة اللغة العربية.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://labs.holooli.com/2009/%d8%a7%d9%84%d8%aa%d8%ad%d9%84%d9%8a%d9%84-%d8%a7%d9%84%d8%b5%d8%b1%d9%81/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>منقح اللغة العربية</title>
		<link>http://labs.holooli.com/projects/arabic-validator</link>
		<comments>http://labs.holooli.com/projects/arabic-validator#comments</comments>
		<pubDate>Tue, 12 May 2009 19:33:30 +0000</pubDate>
		<dc:creator>خالد</dc:creator>
				<category><![CDATA[projects]]></category>
		<category><![CDATA[منقح اللغة العربية]]></category>

		<guid isPermaLink="false">http://labs.holooli.com/?p=1</guid>
		<description><![CDATA[المحاور الرئيسية: 1. المنقح الإملائي 2. المنقح النحوي 3. الإعراب 4. استخدام الخدمة في المواقع الإلكترونية المنقح الإملائي: كثيراً ما نشاهد العديد من الأخطاء الإملائية في المواقع الإلكترونية عندما نتصفحها والأسباب كثيرة، منها السرعة في الكتابة، صغر سن الكاتب، عدم تمكنه من قواعد اللغة العربية، والعديد من الأسباب الأخرى. مهمة التنقيح اليدوية مجهدة وتحتاج وقتاً [...]]]></description>
			<content:encoded><![CDATA[<p><strong>المحاور الرئيسية:</strong><br />
1. المنقح الإملائي<br />
2. المنقح النحوي<br />
3. الإعراب<br />
4. استخدام الخدمة في المواقع الإلكترونية</p>
<p><strong>المنقح الإملائي:</strong><br />
كثيراً ما نشاهد العديد من الأخطاء الإملائية في المواقع الإلكترونية عندما نتصفحها والأسباب كثيرة، منها السرعة في الكتابة، صغر سن الكاتب، عدم تمكنه من قواعد اللغة العربية، والعديد من الأسباب الأخرى. مهمة التنقيح اليدوية مجهدة وتحتاج وقتاً طويلاً، فكانت الفكرة باستخدام قوة الحواسيب وانتشار الإنترنت في إيجاد تطبيق ويب (Web Application) يقوم بهذه المهمة استناداً إلى قاعدة بيانات تحتوي على آلاف الكلمات العربية الصحيحة، حيث يقوم بتجزئة الجملة التي أدخلها المستخدم إلى كلمات، ومقارنة هذه الكلمات مع الكلمات الموجودة لديه وفي حال عدم وجود تطابق يعتبر هذه الكلمة خاطئة إملائياً، وبالتأكيد الكلمات الموجودة في قاعدة بيانات التطبيق ليست شاملة ولذلك سيكون بإمكان المستخدم اقتراح كلمة غير موجودة في التطبيق لضمها إلى قاعدة البيانات وهكذا سيكون للتطبيق نكهة الويب 2.0 أي التفاعل مع المستخدم وإسهام المستخدم في إثراء التطبيق.</p>
<div id="attachment_9" class="wp-caption alignnone" style="width: 509px"><img class="size-full wp-image-9" title="شكل المنقح الإملائي" src="http://labs.holooli.com/wp-content/uploads/2009/05/1.jpg" alt="شكل المنقح الإملائي" width="499" height="110" /><p class="wp-caption-text">شكل المنقح الإملائي</p></div>
<p><strong>المنقح النحوي:</strong><br />
المرحلة التالية للتطبيق ستكون إمكانية اكتشاف الأخطاء النحوية (مثل: &#8220;جمع الفلاحين المحصول&#8221; والصحيح &#8220;جمع الفلاحون المحصول&#8221;، أيضاً: &#8220;الرياضةَ مفيدة&#8221; والصحيح &#8220;الرياضةُ مفيدة&#8221;).<br />
سيقوم التطبيق &#8220;منقح اللغة العربية&#8221; بدراسة الجملة، تحليلها وتحديد نوعها، ثم تحديد نوع كل كلمة نحوياً، وبعد ذلك التقاط الأخطاء الموجودة في هذه الجملة وإظهار هذه الأخطاء وإظهار البديل الصحيح أو الأقرب إلى الصحيح.</p>
<p><strong>الإعراب: </strong><br />
الخطوة الثالثة ستكون إمكانية إعراب جملة كاملة بناءً على الميزتين السابقتين، سيدخل المستخدم جملة كاملة وسيقوم التطبيق:<br />
1.  دراسة الجملة نحوياً وتحديد نوعها.<br />
2.  تحديد نوع كل كلمة نحوياً.<br />
3.  إعراب الكلمات بناء على نوعهم ومكانهم في الجملة.</p>
<p><strong>استخدام الخدمة في المواقع الإلكترونية:</strong><br />
سيتم بناء واجهة تخاطب (API) مع خدمة &#8220;منقح اللغة العربية&#8221;، لاستخدامها في المواقع بطريقة بسيطة وسهلة لأي مدير موقع. حيث سيقوم فقط بنسخ أسطر جافاسكربت بسيطة لاستخدام الخدمة في موقعه، وسيحدد مدير الموقع المحتوى المراد تنقيحه وبعدها ستقوم الخدمة بإرسال هذا المحتوى وتحليله إملائياً ونحوياً وفي النهاية تقوم بوضع خط أحمر تحت الكلمات الخاطئة إملائياً وخط أخضر تحت الكلمات الخاطئة نحوياً في موقعه، وبهذه الطريقة ستقوم هذه الخدمة بخفض الأخطاء الإملائية والنحوية في المواقع بشكل كبير للوصول إلى لغة عربية سليمة وأيضاً تعليم القواعد العربية بشكل ضمني.</p>
<div id="attachment_10" class="wp-caption alignnone" style="width: 449px"><img class="size-full wp-image-10" title="استخدام الخدمة في موقع كمثال" src="http://labs.holooli.com/wp-content/uploads/2009/05/2.jpg" alt="استخدام الخدمة في موقع كمثال" width="439" height="193" /><p class="wp-caption-text">استخدام الخدمة في موقع كمثال</p></div>
]]></content:encoded>
			<wfw:commentRss>http://labs.holooli.com/projects/arabic-validator/feed/</wfw:commentRss>
		<slash:comments>29</slash:comments>
		</item>
	</channel>
</rss>

