جاءته النتائج على استحياء ولم تقل له إن أبيها يدعوه لأنه -أبيها- ليس عربيا، فتساءل ممتعضا إن كان الأب غير عربي أوليس الجدُ عربيًا؟ أين أنت يا جدي الخوارزمي؟ أليس من المؤسف ألا يكون للعربية محركًا متخصصًا وأنت من اخترعت الخوارزميات Algorithms التي تعمل عليها محركات البحث الأخرى؟
حسُن، لا أؤمن باستحضار الأرواح؛ فجدّنا الخوارزمي -رحمة الله عليه- قد وُري الثرى بعدما أدى ما عليه، فماذا عنا؟ أبشر أيها الصديق العربي؛ فإن الخوارزمي قد عاد من جديد لكن في صورة عصرية تتناسب مع معطيات القرن الحادي والعشرين، والخوارزمي المقصود في قرننا هذا هو الاسم الذي أطلقه دكتور مهندس حسام الدين محجوب على وليده الجديد ليعتمد حلاً دقيقًا لموضوع شكوى مستخدمنا من خلال تطبيق محرك البحث العربي المتطور.
كما نعلم، تختلف العربية عن اللاتينية في خصائص عدة أهمها الاشتقاق والحركات الإعرابية، وهذا تحديدا هو ما تفتقر إليه محركات البحث الحالية، لذلك يعتمد محرك الخوارزمي -وهو ثمرة جهود خمس عشر عاما أو يزيد من العمل الدءوب- على تقنيات تفهم العربية وتتفاعل معها ألا وهي "التحليل الصرفي" Morphological Analysis والتي تعني ببساطة التعامل مع كلمة البحث من خلال العودة لجذرها اللغوي للحصول على تصريفاتها بغية الوصول إلى النتائج المطلوبة في وقت قليل وبصورة دقيقة.
طلاسم؟ إذًا بالمثال يتضح المقال؛ أنت تريد البحث عن كلمة "اجتماع" في موقع ما:
- محركات البحث العادية سوف تعطيك نتائج مثل (اجتماع - الاجتماع - الاجتماعات) إن وجدت في النص؛
- الخوارزمي سوف يعطيك نتائج معتمدة على جذر الكلمة [ج.م.ع] مثل (جَمَعَ - أجْمَعَ - اجتَمَعَ - إجماع - جماعة - اجتماع - اجتماعية - جمعية، إلخ) إن وجدت في النص.
لمزيد من الدقة وحصرًا لنطاق البحث، فلا يقتصر البحث بالتحليل الصرفي بل يتعداه إلى البحث بالمعنى الذي يريده المستخدم، ثم يقوم المحرك بالبحث الصرفي بناء على ما حدده المستخدم بالمعنى سابقا.
طلاسم مرة أخرى؟ إذًا بالمثال يتضح المقال؛ أنت تريد البحث عن جملة "الفن الحديث" في موقع ما:
- محركات البحث العادية سوف تعطيك نتائج معتمدة على الكلمتين مثل (فن – حديث - الفن - الحديث - فن حديث - الفن الحديث) أي في صورة متفرقة؛
- أما الخوارزمي فيجب عليك أولا تحديد المعنى الذي تريده: هل تريد البحث عن كلمة "حديث" بمعنى (جديد) أم تريدها بمعنى (الكلام)؟ اختيارك للمعنى هو الذي يحدد للمحرك الخطوة التالية للبحث إما بالصيغة الصرفية لمعنى (الكلام) أو (الجديد).
يعني هذا -ببساطة- أنه في حال اختيارك للبحث عن "حديث" بمعنى (الكلام) فإن الجملة المفتاحية التي أدخلتها لن تظهر في نتائج البحث، لأنه لا يوجد شيء يسمى الفن الكلام أو أي مشتق من مشتقات الكلام، لذا سوف تقتصر نتائج بحث على جمل مثل "في المتحف قال المتحدثون الرسميون عن مجلس الإدارة"، ولن تظهر في تلكم النتائج جُمَلا مثل "وضعت الوزارة خطة لتحديث الحيّ".
هذا عن تطبيقات الويب لمديري المواقع العربية، فماذا إذًا عن تطبيقات المحرك في الشركات والمؤسسات (Enterprises)؟ حدث ولا حرج؛ ففي المؤسسات التي تعتمد على ُنظم إدارة الوثائق Document Management Systems -مثل دور النشر، المكتبات، المؤسسات الصحافية- يقوم المحرك أولا بفهرسة وثائقك العربية بأنماطها المختلفة مثل "HTML،PDF ،TXT ، RTF" مع دعم كامل لتقنية اليونيكود -Unicode- ثم يبحث فيها داخل الشبكة المحلية باعتماد تقنية محرك الويب، كما يمكنه فهرسة كل قسم على حدة (دوريات ثقافية - دوريات أدبية - أخبار سياسية - أخبار علمية) مع الإدارة الكاملة لتلكم الفهارس: إضافة/حذف/دمج.
لا يستوي الحديث -بمعنى الكلام- عن التقنية بدون الحديث عن مخترعها كي ُنعطِ كل ذي حق حقه؛ دكتور حسام محجوب هو من أوائل الذين عملوا في مجال تطبيقات حاسوب IBM بالعربية وملحقاته في ثمانينيات وتسعينيات القرن الماضي ببريطانيا ثم بمصر، كما عمل على تطوير المدقق الإملائي العربي لطاقم النشر لبرنامج الوثائق "أوفيس 97"، بالإضافة إلي عمله في تطوير معاجم إلكترونية لمؤسسة سابقة بالمملكة العربية السعودية مثل "المكنز الكبير"، "المعجم الموسوعي لألفاظ القرآن الكريم وقراءاته"، "معجم اللغة العربية المعاصرة" وأخيرا -وليس آخرا إن شاء الرحمن- محرك البحث "الخوارزمي" الذي يعرف اختصارا باسم "KSearch".
ختاما: هذا المقال ليس خيالا علميا بل هو شرح ميسر لا يوفي حق مجهود فريق عربي متكامل يعي أهمية لغة الضاد على رأسه دكتور حسام الدين محجوب والأستاذ محمد جمال جزاهم ربي عنا خيرا ويستطيع مطورو المواقع العربية وكذا أصحاب المؤسسات المعنية بهذا الأمر التواصل معهم من خلال رابط الشركة
http://www.alkhawarizmy.com