السلام عليكم
كتبت عدة مرات عن بعض ملامح مشروعي الهادف إلى نمذجة صرفية أصواتية للعربية
عندما حاولت تطبيق النمذجة واخترت مضطرا مكنز القرآن فهو المكنز الوحيد شبه المكتمل للعربية وجدت عقبات عدة أهمها غياب الأوزان الصرفية والجذور تماما عن المكنز واستحال تطبيق النمذجة
بني المكنز في جامعة ليدز مستعينا بعمل بدأ في جامعة يافا ((للأسف)) وإن لم يقم عليه حسب ما قاله قيس دوكس المطور الرئيس للمكنز مع عدة مطورين ساهموا بدرجة أو بأخرى
طبعا تطور المكنز على مراحل ضمن حزمة من الأدوات المساعدة إلى أن وصل لحالته الحالية والتي يبدو أن قيس وأستاذه إيريك أتويل اعتبروها من الناحية اللغوية مكتملة وانتقل للعمل على الأنطولوجيا والتصنيفات الدلالية وهو بهذا يشابه المكانز الأوربية التي لا تحوي ميزانا صرفيا ولا أهمية فيها للبنية الاشتقاقية
لا يمكن نمذجة العربية بدون ميزانها الصرفي وتصنيف الكلمات Part of speach المعتمد كبديل عن المعيار الصرفي باللغات اللاتينية لا يغني عن الميزان الصرفي للعربية لكن المطورين العرب للأسف ارتأوا التقليد لصعوبة البناء من الصفر
يقدم الميزان الصرفي بالعربية أكثر بكثير مما تقدمه الأدوات اللاتينية من ناحية نمذجة الدلالة والمعنى لكنه بدون شك أصعب بكثير
اكتشفت مؤخرا أني لست أول من حاول الخوض بهذا الاتجاه ورفض فرض النمذجة اللاتينةي على العربية وهناك محاولات منذ الثمانيات لكنها لم تكلل بالنجاح ولم تنتج تصور واضح
وعندما بدأت مشروعي في 2005 وناقشت بداياته هنا كان غرضي النمذجة الصرفية والدلالية فقط واكتشفت أن هناك ثغرات لا يستهان بها بالأساس اللغوي الذي وضعه اللسانيون العرب ليمكن نمذجته وأن هناك حاجة ماسة لنمذجة أصواتية مع الصرفية لسد هذه الثغرات بالتدريج
ثم جاءت إشكالية التطبيق بعدم وجود بيانات صرفية كافية حتى في أكمل مكنز عربي حتى الآن وأكثر نص دُرس ربما في تاريخ الإنسانية كلها
المقاربة كانت وجود البيانات ثم حصرها إحصائها جدولتها ثم تطبيق النمذجة
بما أنه لا بيانات لدينا نحتاج لمقاربة مختلفة نطور فيها النمذجة أثناء ملء البيانات وبذلك نكمل المكنز صرفيا بنفس الوقت الذي نكمل فيه النمذجة
الفكرة هي استخدام بنية النمذجة نفسها وخوارميات تماثل للمساعدة في تسريع هذا العمل وبنفس الوقت بناء العلاقات الصرفية والتماثلية داخل مكنز القرآن ولاحقا داخل أي مكنز عربي أكبر
بشكل مبسط
بما أننا نحتاج إلى جذر ووزن كل كلمة بالقرآن وهي عملية صعبة وطويلة
وهذه الأوزان مرتبة ضمن جدول ارتقاء بحيث تتضمن تلقائيا نوع الكلمة وبعض ملامح دلالتها وهذه طبقة ثانية من النمذجة كان ممكنا تأجيلها خصوصا أنها تحتاج لتدقيق لساني عميق لا تغني خبرتي المتواضعة
فكرتي حاليا بناء الكل دفعة واحدة بالتدريج وبالاستفادة من بنية النمذجة وخدماتها
فعندما نضع وزن لكلمة مثلا الحَمْدُ = الجذر "ح م د" من حَمَد يَحمَد الوزن "ال" أداة تعريف "فَعْلُ" مصدر
سيقترح النموذج تدقيق كل المواضع التي وردت بها كلمة الحمد وهذا بسيط
هل هناك حالات الجذر الستة الأخرى؟ (المنسوبة لعين المضارع)
هل هناك مصادر لها؟
سيقترح النموذج مماثلات مثل القَلْب وهي اسم جنس وأصلها مصدر قلب
هل يمكن أن تأتي الحَمْد اسم جنس؟
هذه المعلومات ينبغي ملؤها بالتدريج ستكتمل النمذجة مع البناء الصرفي للقرآن مع قدر لابأس به من الطبقة الثانية المتعلقة بتصنيفات ودلالات الأوزان الصرفية وحالاتها
بتصوري الحالي يجب بناء منصة برمجية تتيح إدخال معظم هذه البيانات من خلال خيارات وقدر محدود جدا من الإدخال النصي كونها تلقائيا مطلوبة من النموذج الرقمي
عند إدخال وزن الحمد سيكون هناك خيارات عن نوعه ونوع جذره ثم سيصبح الوزن "فَعْلُ" متاحا لأي كلمة مشابهة
يعني بالتدريج سيصبح العمل أكثر سهولة وسيصبح النظام أذكى في التنبؤ بالاحتمالات
هذا تصوري الحالي عن المرحلة التالية من مشروع ترميز للنمذجة الأصواتية والصرفية بانتظار تعليقاتكم وانتقاداتكم
كتبت عدة مرات عن بعض ملامح مشروعي الهادف إلى نمذجة صرفية أصواتية للعربية
عندما حاولت تطبيق النمذجة واخترت مضطرا مكنز القرآن فهو المكنز الوحيد شبه المكتمل للعربية وجدت عقبات عدة أهمها غياب الأوزان الصرفية والجذور تماما عن المكنز واستحال تطبيق النمذجة
بني المكنز في جامعة ليدز مستعينا بعمل بدأ في جامعة يافا ((للأسف)) وإن لم يقم عليه حسب ما قاله قيس دوكس المطور الرئيس للمكنز مع عدة مطورين ساهموا بدرجة أو بأخرى
طبعا تطور المكنز على مراحل ضمن حزمة من الأدوات المساعدة إلى أن وصل لحالته الحالية والتي يبدو أن قيس وأستاذه إيريك أتويل اعتبروها من الناحية اللغوية مكتملة وانتقل للعمل على الأنطولوجيا والتصنيفات الدلالية وهو بهذا يشابه المكانز الأوربية التي لا تحوي ميزانا صرفيا ولا أهمية فيها للبنية الاشتقاقية
لا يمكن نمذجة العربية بدون ميزانها الصرفي وتصنيف الكلمات Part of speach المعتمد كبديل عن المعيار الصرفي باللغات اللاتينية لا يغني عن الميزان الصرفي للعربية لكن المطورين العرب للأسف ارتأوا التقليد لصعوبة البناء من الصفر
يقدم الميزان الصرفي بالعربية أكثر بكثير مما تقدمه الأدوات اللاتينية من ناحية نمذجة الدلالة والمعنى لكنه بدون شك أصعب بكثير
اكتشفت مؤخرا أني لست أول من حاول الخوض بهذا الاتجاه ورفض فرض النمذجة اللاتينةي على العربية وهناك محاولات منذ الثمانيات لكنها لم تكلل بالنجاح ولم تنتج تصور واضح
وعندما بدأت مشروعي في 2005 وناقشت بداياته هنا كان غرضي النمذجة الصرفية والدلالية فقط واكتشفت أن هناك ثغرات لا يستهان بها بالأساس اللغوي الذي وضعه اللسانيون العرب ليمكن نمذجته وأن هناك حاجة ماسة لنمذجة أصواتية مع الصرفية لسد هذه الثغرات بالتدريج
ثم جاءت إشكالية التطبيق بعدم وجود بيانات صرفية كافية حتى في أكمل مكنز عربي حتى الآن وأكثر نص دُرس ربما في تاريخ الإنسانية كلها
المقاربة كانت وجود البيانات ثم حصرها إحصائها جدولتها ثم تطبيق النمذجة
بما أنه لا بيانات لدينا نحتاج لمقاربة مختلفة نطور فيها النمذجة أثناء ملء البيانات وبذلك نكمل المكنز صرفيا بنفس الوقت الذي نكمل فيه النمذجة
الفكرة هي استخدام بنية النمذجة نفسها وخوارميات تماثل للمساعدة في تسريع هذا العمل وبنفس الوقت بناء العلاقات الصرفية والتماثلية داخل مكنز القرآن ولاحقا داخل أي مكنز عربي أكبر
بشكل مبسط
بما أننا نحتاج إلى جذر ووزن كل كلمة بالقرآن وهي عملية صعبة وطويلة
وهذه الأوزان مرتبة ضمن جدول ارتقاء بحيث تتضمن تلقائيا نوع الكلمة وبعض ملامح دلالتها وهذه طبقة ثانية من النمذجة كان ممكنا تأجيلها خصوصا أنها تحتاج لتدقيق لساني عميق لا تغني خبرتي المتواضعة
فكرتي حاليا بناء الكل دفعة واحدة بالتدريج وبالاستفادة من بنية النمذجة وخدماتها
فعندما نضع وزن لكلمة مثلا الحَمْدُ = الجذر "ح م د" من حَمَد يَحمَد الوزن "ال" أداة تعريف "فَعْلُ" مصدر
سيقترح النموذج تدقيق كل المواضع التي وردت بها كلمة الحمد وهذا بسيط
هل هناك حالات الجذر الستة الأخرى؟ (المنسوبة لعين المضارع)
هل هناك مصادر لها؟
سيقترح النموذج مماثلات مثل القَلْب وهي اسم جنس وأصلها مصدر قلب
هل يمكن أن تأتي الحَمْد اسم جنس؟
هذه المعلومات ينبغي ملؤها بالتدريج ستكتمل النمذجة مع البناء الصرفي للقرآن مع قدر لابأس به من الطبقة الثانية المتعلقة بتصنيفات ودلالات الأوزان الصرفية وحالاتها
بتصوري الحالي يجب بناء منصة برمجية تتيح إدخال معظم هذه البيانات من خلال خيارات وقدر محدود جدا من الإدخال النصي كونها تلقائيا مطلوبة من النموذج الرقمي
عند إدخال وزن الحمد سيكون هناك خيارات عن نوعه ونوع جذره ثم سيصبح الوزن "فَعْلُ" متاحا لأي كلمة مشابهة
يعني بالتدريج سيصبح العمل أكثر سهولة وسيصبح النظام أذكى في التنبؤ بالاحتمالات
هذا تصوري الحالي عن المرحلة التالية من مشروع ترميز للنمذجة الأصواتية والصرفية بانتظار تعليقاتكم وانتقاداتكم
تعليق