amattouch
شاركت: 15 فبراير 2006
نشرات: 285
ارسل: الاحد فبراير 26, 2006 10:22 am موضوع الرسالة: حول المعالجة الآلية للغات
--------------------------------------------------------------------------------
تعريفات1
توم TAUM
هو اسم مختزل للترجمة الآلية لجامعة مونريال . وكانت الحكومة الكندية في 1965 وراء المشروع . وكان المشروع في بدياته عاما للترجمة ولكن بعد سنوات العمل والبحث تخصص المشروع في متابعة أحوال الطقس كتطبيق أساسي ميداني للبرنامج. ولذلك أصبح اليوم معروفا باسم توم ــ طقس..
هذا البرنامج يترجم المعلومات الطقسية للحكومة الكندية منذ عام 1977 من الإنجليزية إلى الفرنسية ومنذ عام 1989 من الفرنسية إلى الإنجليزية. فالترجمات من الإنجليزية إلى الفرنسية فهي توجه لمناطق فانكوفر وإدمونتن وكالجري ورجينا وتورونتو وهاليفاكس أما الترجمة من الفرنسية إلى الإنجليزية فتهم منطقة مونريال. واليوم فإن كل التوقعات الطقسية الكندية أصبحت مترجمة.
البرنامج يعتمد على 2000 كلمة وتعبرة. ويترجم ساعة بعد ساعة كل التوقعات بمعدل 30000 ألف كلمة في اليوم.
وواقعيا توم ـ طقس هو نظام مستعمل منذ زمن وقد حاز على استحسان الجميع. وللتدقيق يجب التفريق بين استعمال عادي وشامل واستعمال الزبائن من حيث التخصص والتواتر.
ولأن البرنامج شديد التخصص والتميز فهو يحوي مصطلحات محصورة أي ذي معجم محدد وشامل للكلمات المراد ترجمتها وتركيبا جامدا يدور حول عدد قليل من التركيبات الجملية وهو ما يمنح تطابقا كاملا لكل تركيب وهيكلة تعبيرية متكررة, لدرجة أن المترجم الإنساني لن يصبر أمام ملل التكرار أكثر من أشهر. وقد خلت مصلحة الطقس الكندية مشكلتين : الملل البشري ومشكلة لغوية باختيارها وتطويرها لنظام توم ـ طقس.
تعريفات 2
Titus تيتوس
طور برنامج تيتوس في ظروف خاصة ولأهداف محددة.
وكان وراء ظهوره ذلك معهد النسيج الفرنسي. فقد تصور المعهد برنامج تيتوس لترجمة ملخصات المقالات التي تخص النسيج للمهندسين المتخصصين المحتاجين للمعلومات العلمية الجديدة.
يتعامل برنامج تيتوس مع أربع لغات عمل : الفرنسية والإنجليزية والألمانية والإسبانية وكل الأزواج اللغوية فعالة.
وكان من المفروض أن يكون المعجم الأساس صغيرا ولو أنه من غير سابق الحصر. والتركيب محصورا نسبيا والمقالات تساير في عمومها ضرورة الوضوح والبساطة والقصر. وبرمج تيتوس للعمل في إطار تركيب مراقب, وقد شهد عدة تغيرات وخاصة تنوع الجمل المقبولة. وعندما جرب العهد الفرنسي للأبحاث العلمية برنامج تيتوس لترجمة ملخصات المقالات العملية المنشورة ظهر أن محرري الملخصات لا يحترمون شروط الكتابة المرخصة في المعالجة الآلية. وطرح إشكال بشري هل يمكن فرض تركيب مراقب ملزم على المحرر؟ فضرورات المعالجة الآلية لم تغير من عادات التحرير. ويمكن استعمال البرنامج بموازاة بيانات سابقة الإعداد, وهذا يقلص إنتاجيته, فقد أعد تيتوس كبرنامج كامل الآلية. ويمكن استعماله كما هو إذا احترمت بعض الشروط : ترتيب العناصر في الجملة وزمن الأفعال المقبول والملحقات الممكنة. و شيئا فشيئا تحول إلى نظام تفاعلي مع إمكانية إصلاح على الشاشة للمشتركات اللفظية والكتابية.
تعريف 3
Spanam /Engspan
برنامج يترجم من اللغة الإنجليزية إلى اللغة الإسبانية والعكس. وقد أعد خصيصا لمنظمة الصحة لعموم أمريكة في واشنطن التي تنشر وتصدر العديد من الوثائق الطبية الموجهة لأمريكا اللاتينية. وفي البداية أعد البرنامج الموجه نحو اللغة الإسبانية لخدمة مصالح الصحة في القرى النائية ولمقاربة أكبر عدد من الساكنة. وحاليا يستعمل زوجي اللغة بنجاح في مجالات الصحة والتغذية والفلاحة.
وإذا كانت بداية البحث حول البرنامج قد بدأت في جامعة جوج تاون فإنها طورت في منظمة الصحة لعموم أمريكة. وحيث أن المجال محصور ونوعية النصوص محددة فقد سار العمل بوتيرة سريعة. وأول الإصدارت نحو الإسبانية ظهرت في 1976 ودخلت مجال العمل في 1979 وجددت في 1988.... أما النسخة نحو الإنجليزية فهي قريبة العهد ودخلت مجال التطبيق في 1984. والبرنامج من شاكلة برامج سيستران : الترجمة الخامة تتطلب تصحيحا لتغدو النصوص مقبولة. وفي دراسة للانعكاسات ظهر أن المستعملين يحبذون الترجمة المصححة الآلية على الترجمة البشرية اليدوية.
وإنتاجية البرنامج تقارب 6500 كلمة/يوم للمترجم المصحح وهناك محاولات لإصدار يتعامل مع أزواج لغات أخرى.
تعريفات 4
Weidner
كان لجامعة بريغام دور مهم في تطوير العديد من برامج الترجمة الآلية وكان الهدف الأول منذ 1970 ترجمة النصوص المقدسة الخاصة بجماعة المرمون. وتابعت العمل شركة ويدنر منذ تأسيسها في 1977 بمشاركة كوادر الجامعة وحرج أول برنامج من الإنجليزية إلى الفرنسية في 1980. وتبع ذلك أزواج لغات أخرى من الإنجليزية إلى الإسبانية والألمانية والبرتغالية والإيطالية والعربية... ومن الفرنسية إلى الإنجليزية والإسبانية والألمانية إلى الإنجليزية و. ويمكن تشغيل هذه البرامج على حواسيب شخصية إلا البرامج الخاصة بالإنجليزية/العربية والألمانية/الإنجليزية.
وأكبر عائق لهذه البرامج هو صغر المعجم الذي يلائم دائما نوع النص المراد ترجمته وعلى المشغل إعداد معجم وهذا مكلف وضد إنتاجية البرنامج.
وإنتاجية البرنامج العملية : 4000-8000 كلمة/ساعة.
ويستعمل للترجمة في شركات دولية ومنها ماترا موتورولا طومسون بول أيروسباس بيركينس إنجين رانكس كسيروكس ...
واليوم تتوجه المجموعة المنتجة لتطوير برامج موجهة للسوق اليايانية.
تعريفات 5
Alps
بدايات ألبس كانت في جامعة برغام وقد تأسست الشركة في 1980.
ويمتاز برنامج ألبس بمستوياته الثلاثة لترجمة الألفاظ : الاختيار والذاتية والتفاعلية. وتحوي المستويات العليا المستويات الدنيا. والمستوي الأعلى تفاعلي أي أنه يقدم ترجمات جملة لجملة ويطرح أسئلة لمحو الغموض. وعموما يعد المستوى الثاني ـ الذاتية أكثر نفعا غير أن حلف الأطلسي و إحصائيات كندا تستعملان المستوى الثالث مستوى التفاعلية.
ومن اللغات العاملة في البرنامج : من الإنجليزية إلى الفرنسية والألمانية والإسبانية والإيطالية.
من الفرنسية إلى الإنجليزية.
من الألمانية إلى الإنجليزية.
ومن الشركات الكبرى التي تستعمل البرنامج: تكساس أنسترمنت , ونرس داتا, واتحاد المصارف السويسرية, ورانك كسيروكس, وهناك شركات ترجمة تستعمل هذا البرنامج ك أنترلونجوا وملتيسكربت...
ومن عيوب البرنامج المعجم الصغير ويجب أن تكون النصوص المعروضة للترجمة تقنية مكررة مكتوبة بلغة سهلة وبسيطة. ويتعامل البرنامج مع نصوص من 30000كلمة وأكثر من ذلك تتقلص الإنتاجية.
وللبرنامج إصدارات للتشغيل على الحواسيب الشخصية.
تعريفات 6
Logos
تعد برامج لوجوس منافسة لبرامج سيستران من حث جودة الترجمة رغم أن الأخير له معجم واسع ويتعامل بلغات عدة.
ولوجوس شركة أمريكية تطورت في الستينات. وخرجت أول برنامج الترجمة في 1971 خاص بالترجمة من الإنجليزية إلى اللغة الفتينامية متخصص بترجمة وثائق تتعلق بالتجهيزات العسكرية. وطورت لوجوس في الثمانينات برنامجا للترجمة الألمانية/الإنجليزية. وظهرت إصدارت لاحقا خاصة باللغات الفرنسية والإسبانية والإيطالية ولغات أخرى. وطورت شركة لوكوس برامج ترجمة ملحقة لنشر متعدد اللغات.
يمكن تشغيل بعض برامج لوكوس على حواسيب شخصية باستعمال واجهة يونكس.
ويستعمل في عدة شركات عالمية.
تعريفات 7
Smart/ Seppli
تستعمل وزارة الهجرة والعمل الكندية برامج سمارت لترجمة طلبات التشغيل ما بين الفرنسية والإنجليزية, وتنشر النتائج مباشرة على شاشات 4000 حاسوب موزع على مجموع التراب الكندي ويمكن للموظف تدقيقها آنيا وأغلب التدقيقات مع قلتها تمس التركيب ولا يتطلب البرنامج مراقبة التركيب المسبقة وذلك راج لقصر النصوص مما يجعل تراكيبها بسيطة وإن تنوع التحرير, ويستفيد البرنامج من تعدد المعطيات ويدمجها.
وتمكن برامج سمارت ترانسليتر من ترجمة خامة بسرعة 200000ك/س مع حواسيب مركزية.
وطورت جامعة جنيف نظام سيبلي وهو قريب من السابق للتعامل مع الألمانية/الفرنسية والألمانية/الإيطالية لنشر عروض العمل الصادرة في عاصمة الفيدرالية بيرن باللغات الفرنسية والألمانية والإيطالية والتي كانت ترجمتها بشرية. وزيادة على الجانب الاقتصادي في القضية فإن البرنامج يهدف إلى تشجيع الطلاب على التعامل مع المعالجة الآلية للغات الطبيعية.
تعريف 8
Socatra
وسوكترا اختزال لأسم : الشركة الترجمة الكندية. ونظامها المطروح يتعامل ما بين الفرنسية والإنجليزية. ولا يوجد في السوق وتتم الترجمة الخامة أو المحققة داخل مكاتب الشركة
وتقول الشركة أن الطاقة الإنتاجية لنظامها تصل إلى 200000ك/س على الأقل ومولد مسردي ب 500000ك/س وهي أرقام ضخمة.
Metal
ميتال هي اختزال لعبارة : الترجمة وتحليل اللغات, وكانت بدايات المشروع في جامعة تكساس في 1961 للترجمة من الألمانية إلى الإنجليزية. وتخلت الجامعة عن المشروع لصالح شركة سيمنس الألمانية التي عرضت في الثمانينات أوائل منتوجها للترجمة في ما بين العديد من اللغات –الفرنسية الهولندية الألمانية الإسبانيةـ وهي برامج ناجحة في مجال الاتصالات.
وميزة النظام أنه مركب من وحدات قابلة للتغيير مع مجموعة من القواعد النحوية المحددة يمكن الرجوع إليها كلما دعت الضرورة وقت التحليل وهكذا نحصل على عدة تمثيليات مقبولة للجملة وترفض أقل التمثيليات قبولا. ورغم أن نظام الوحدات المستقلة يسمح بالتطوير الدائم والتحسين إلا الزيادة المعجمية والبرمجية تؤدي إلى نتائج سلبية.
PC-translator
الحاسوب المترجم قد تجدونه في الأسواق على شكل حواسيب جيبية : وهو نظام يختلف عن باقي الأنظمة الأخرى. فشركة المنتوجات اللغوية تعرض بثمن بخس برامج ثنائية اللغة ـ من وإلى الإنجليزية : الفرنسية/ الدنماركية/السويدية/النرويجية/الإسبانية/الهولندية/الألمانية/الإيطالية....
والبرنامج ليس مؤللا بالمعنى الدقيق فهو يكتفي ببعض المواصفات اللسانية وبعض الوحدات اللغوية وقلة من القواعد التركيبية فهو أقرب إلى برنامج مساعد منه لبرنامج آلي أو مؤلل.
Gigatext
مثل مدرسي لما يجب الابتعاد عنه : خسارة ملايين الدولارات الكندية في برنامج يترجم النصوص القانونية ما بين الفرنسية والإنجليزية ولكن النتيجة صفر.
Winger
نحت شركة وينجر للنسيج منحى الترجمة الآلية من الإنجليزية إلى الدنماركية مستغلة قاعدة معلوماتها الضخمة. والبرنامج يعوض نقص الجانب التركيبي بالتفاعلية إذ أنه يمنح المستعمل عدة حلول يختار منها أحسنها. وهو أقرب إلى برنامج ألي مساعد للترجمة. وتعرض الشركة حاليا عدة برامج للترجمة بين اللغات الإنجليزية والإسبانية والروسية.
PaTrans
نظام للترجمة بين اللغتين الإنجليزية والدنماركية متخصص.
Tovna
برنامج إسرائيلي لم يخرج للسوق إلا في 1985 للغتين الفرنسية والإنجليزية والروسية. وميزته التقنية أنه يستفيد من تدقيقات الترجمات الخامة ويستغلها في ترجمات لاحقة.
Lexi-Tech
برنامج كندي موجه لخدمات عسكرية محددة وبداية بهدف ترجمة 100000 صفحة ذات علاقة مع الترسانة البحرية. ويحوي معجمها 75000 عبارة ولفظة مع برامج توسط بني خاصة بالشركة.
البرامج اليابانية
ولنا معها عودة خاصة
متابعة للسوق التجاري الدولي وللتطور العلمي والتقاني فقد واجهت الشركات اليابانية مشكلة الترجمة بين اليابانية والإنجليزية. ولذلك أصبحت الترجمة الآلية مع الجيل الخامس من الحواسيب من المهمات الأولية منذ 1980 وقامت الحكومة اليابانية بمجهود ضخم وشجعت الأبحاث في المجال وكان للأستاذ ماكوتو نجاو ـ مشروع حكومي ـ تأثير في توجيه الأبحاث نحو تحليل تركيبي شجري.
وهناك توجه كبير لتوسيع البرامج إلى لغات أسيوية أخرى كالصينية والكورية وغيرها من اللغات العالمية.
ومن الشركات اليابانية ذات الباع العالي في المجال
توشيبا, و فيجيتسو, و ميتشوبيشي وهيتاتشي....
وكل مشاريعها واعدة على مستويات الترجمة ومعالجة الصوت {ترجمة المكالمات الهاتفية آليا}.
ورغم أن إنتاجية الكثير من برامج الترجمة المعروضة وتتطلب تدقيقا مكلفا إلا أن اليابان يعد من أكثر البلدان توسعا في التجهيز والاستعمال ويعتبر أن المستقبل هو للترجمة الآلية فلا خيار لها نظرا لانعزال اللغة اليابانية وقلة العارفين بها عالميا والمترجمين منها وإليها.
مراكز علمية
الصين حاولت الصين الشعبية تطوير برنامج jet لترجمة إلى الصينية من اللغات الإنجليزية والفرنسية والألمانية والروسية. ولكن المشروع لم يعطي لحد الساعة نتائج
مجموعة الدول المستقلة
PARS
هو نظام للترجمة بين الروسية والإنجليزية يخص النصوص العلمية والاقتصادية. وهو يعتمد على نتائج جامعة جورج تاون للترجمة لغة إلى لغة.
SPRINT
خاص بمجالات الحاسوبيات والاقتصاد وهو إنجليزي روسي اللغة وعرضته مجموعة الترجمة لعموم روسيا.
ASPERA
هو من نوعية الأنظمة المعجمية روسي إنجليزي اللغة.
ETAP
نظام إنجليزي روسي اللغة خاص للنصوص الحاسوبية و للعلوم المعلوماتية.
ولبقية المراكز سنعود إليها في موضع آخر.
GETA
Ariane & Callipe
جامعة جرونبل الفرنسية ومركزها للدراسات والترجمة المؤللة الذي أداره بجدارة الأستاذ فوكوا لسنوات وقد اهتم مركزه بأوجه متعددة للمعالجة الآلية للغات. وكانت الترجمة من الروسية أحد مرتكزات العمل في المعهد.
Susy
بدأ مشروع سيزي في 1972 في جامعة شروبروك الألمانية للترجمة من الألمانية إلى الروسية. وتوجه الاهتمام نحو إضافة لغات أخرى الفرنسية والإنجليزية والدنماركية والهولندية وأولى المركز أهمية للغة الإسبرنتو. واستعمل البرنامج للفهرست الوثائقية وتحليل النصوص وإدماج المصطلحات الخارجية..
DLT
برنامج هولندي. تفاعلي متعدد اللغات يمن من توليد نصوص في إطار شبكة حواسيب. مع بنك معلومات معرفية بين اللغات . وتتم الترجمة عبر لغة توسطية هي لغة الإسبرنتو التي تستعمل للتواصل بين الحواسيب النهائية. فهو إذن موجه للتواصل أكثر من توجهه للترجمة رغم ما يزعم واضعوه.
Rosetta
أول برنامج من القطاع الخاص في أروبا. من شركة فيليبس. وقد نتجت عنه تجارب بين الإنجليزية والأسبانية والهولندية.
LMT
هو برنامج لشركة إبم المعروفة وهو برنامج ذي هدف متواضع ويتعامل مع اللغات : الفرنسية والإنجليزية والألمانية والدنماركية وغيرها. والمعجم والمسارد معروضة على الشاشة وعلى المستعمل التعرف على الترجمات المعروضة.
Pangloss
من عمل جامعتي المكسيك وكاليفورنيا الجنوبية وهو موجه لمنصة عمل المترجم.
ArchTran
من نتائج تايوان.
Systran
سيستران هي اختزال للعبارة الإنجليزية الترجمة الآلية, نظام أمريكي من تصور بيتر توما, اعتمدته وطورته لجنة المجموعة الأوروبية في أواخر السبعينات لمصالحها الترجمية وصدرته للأسواق. ورغم ما يعاب عليه من حيث المستوى الجمالي واللساني هو أكثر البرامج في الوقت الراهن عمليا وظيفية التي تساير متطلبات الترجمة الآلية ويمكن ترجمة صالحة مباشرة دون تدقيق وإن كانت النصوص الخارجة غير صحيحة مائة في المائة على المستوى التركيبي والنحوي.
وقد خضع تطويره لعدة مراحل ولم يتم تصوره مباشرة كتطبيق لنظرية محددة وإنما تميز بتكون متنام مجزئ المراحل وهو ما يعيبه عن البرنامج أصحاب الموقف النظري .
ويتعامل سيستران في المجموعة الأوروبية مع أزيد من 14 زوج ـ لغة. بتفاوت في الإنتاجية بين الأزواج فأقدمها تعطي نتائج متميزة عن الأخرى.
وطورت الشركة صاحبة المشروع, كاشو, نظام مصلحة ترجمة مباشرة على الخط لعدة لغات.
وبلغت إنتاجية البرنامج لبعض الأزواج : 500000 ك/س أي 1000 ص/د وهو ما يقارب عشرين صفحة في الساعة.
وحاولت شركة كاشو في مراحل تطوير نظام عربي سنتطرق له في جانب البرامج الخاصة بالعربية. ولأن هذا برامج سيستران هي المعتمدة في المجموعة الأوروبية فسنعود إليها تفصيلا لاحقا.
Eurotra
اختزال لعبارة الترجمة وأوروبا. منتوج أوروبي خالص, بدأ التفكير فيه عام 1977 على المستوى الأكاديمي بعرض تشجيع البرامج الأوروبية, ودعمته المجموعة الأوروبية. وكان الهدف محاولة إيجاد مترجم آلي يتعامل مع كل اللغات الرسمية في المجموعة الأوروبية وهي كانت تقارب الثمانين زوجا آنئذ واليوم تفوق 300. وميزة البرنامج أنه بني انطلاقا من نظرية متميزة تعتمد على [تمثيل] تصوير وسطي ودلالي مجرد بين اللغة الأصل ولغة الهدف ونمط التحويل. عكس البرامج المطورة حول محور والتي تتطلب لغة ثالثة شديدة الهيكلة.
وفي برنامج أوروترا يتشكل التصوير من تراكيب اللغة الأصل مع معلومات معجمية عن الألفاظ و بنية النص مرفوقة أحيانا بتصوير لمعلومات دلالية. وتصوير اللغة الهدف هو منسوخ عن تصور لغة الأصل. ويتدخل التجريد في تصوير المرحلة الوسطية. ورغم أن نمط المحور هو أكثر اقتصادية إلا أن الاختيار وقع في هذا البرنامج على نمط التحويل وهو يتطلب لكل لغة ـ هدف كتابة ثلاث وحدات أنماط : نمط التحليل ونمط التحويل ونمط التوليد ـ عكس نمط , بل أنماط المحور التي تتطلب فقط كتابتين : التحليل والتوليد غير أنها عمليات صعبة تتطلب تعمقا كبيرا في النص الأصلي. وتوليدية معقدة وعلى العكس ففي نمط التحويل يكفي تطبيق قواعد التركيب النحوية.
وهناك أسباب أخرى تفسر هذا الاختيار راجعة لطبيعة اللغات المراد التعامل معها.
فأمام اللغات المتقاربة صنفا وتركيبيا كاللغات الأوروبية يستحسن استعمال نمط التحويل لتشابه المعجم وتقارب التركيب, أما إذا تعلق الأمر بمزج بين لغات متباينة الصنف كالإسبانية والصينية مثلا فيفضل نمط المحور لما يتطلب ذلك من تصور شديد التجرد مشترك بين اللغتين وكما قلنا فهذا البرنامج موجه أساسا لخدمة اللغات الأوروبية المتقاربة.
إحالة : الزوج اللغوي
للدقة يجب التمييز حين الحديث عن الأزواج اللغوية زوج ـ لغة يعني من لغة س إلى ص أما من ض إلى س فذلك زوج آخر والمابين لغتين تعني إذا زوجين.
وحين تسمع ببرنامج يتعامل : من س إلى ص
ومن س إلى ن
لا يعني أنه يتعامل من ص إلى ن
لأن هندسة اللغويات الحاسوبية تأخذ بعين الاعتبار تأثير النقل والانتقال للغوي فالقواعد المتحكمة في الانتقال من لغة إلى أخرى تخلف عن قواعد النقل المعاكس. ولذلك قد تجد برنامجا ذي إنتاجية عالية في الترجمة من لغة إلى أخرى وضعيف الانتاجية حين يتعلق الأمر بالترجمة المعاكسة لنفس اللغتين وقد تنعدم هذه الأخيرة في بعض البرامج أي تنجد مترجما آليا من لغة س إلى لغة ص حصرا وليس العكس.
إحالة : في الحدود بين الآلي والمساعد الآلي
أن هدف الترجمة الآلية هو الاغتناء عن العنصر البشري وبقدر ما قل تدخل هذا الأخير يعد البرنامج آليا وحين يتطلب تدخلا كبيرا يعد البرنامج مساعدا. وتتحدد الفروق أيضا إذا اعتبرنا نوعية وسعة المعجم وطريقة هندسة البرنامج ذاته. فإذا كان البرنامج يكتفي بترجمة كلمة إزاء كلمة فهو مساعد لا أكثر لأنه يفتقد آليات العمل المؤلل.
إحالة : المحورية أو التحويل
إن نمط المحور يتشكل من وحدتين نمطيتين : التحليل الذي ينتج عنة تصوير/ تمثيل للنص الأصلي في لغة جديدة مستقلة ونمط توليد يترجم هذه اللغة الجديدة إلى لغة الهدف, والعملية الوسطية تهتم بالمفاهيم المجردة والعلاقات بينها وليس بالتركيب الجملي وقد تحمل معلومات خالسانية. ففي نمط المحور يتجاوز التصوير حدود الجملة إلى النص حاملا معه معطيات خطابية وذلك يستحيل قي نمط التحويل الذي يتعامل مع كل جملة على حدا
ومنه يمكن أن نتخيل أن النمط المحوري أقرب إلى معنى النص وإن ابتعد عن هيكلة النص الأصلي. ومع يضل نمط التحويل أسهل لأنه في آخر المطاف يكتفي بالجانب اللساني من عملية الترجمة.
أن كل برامج الترجمة المؤللة تهدف في ما تهدف إلى مساعدة المترجم في :
الترجمة في للشركات الكبرى تتبعا لسوقها العابر للحدود من أجل محو هذه الحدود.
خدمة للتجسس الصناعي والتتبع التقاني, لتتبع واستباق ما قد يبدعه الخصم من جديد في حرب تنافسية.
من أسلحة الحرب باردة أو حامية.
هذه أبرز المشجعات على تطوير برامج الترجمة المؤللة وإن تم إدخال نتائج التطوير في مجالات أهلية وإلى استعمالات شخصية أو سلمية.
والملاحظ هو أن البلدان ذات التعدد اللغوي المؤسس هي التي تبنت وأنتجت أحسن البرامج.
سيستران حفريات تاريخية.
SYSTRAN
حفريات تاريخية
في الخمسينات وفي جو الحرب الباردة بدأت الولايات المتحدة تتخوف من التطور التقاني السوفياتي. وتخيل الأمريكان أنه لو تمت ترجمت خيرة الوثائق العلمية الروسية لتمكن خبراء الغرب من استباق تقدم الروس وتحديد قدراتهم.
وكان مصب همهم هو كل ما تعلق واقترب من القدرات والتقنيات العسكرية من وثائق بما فيها البحوث الروسية النووية والفضائية.
ولأن ترجمة بشرية لكم هائل من الوثائق و بالسرعة المطلوبة لم يكن ممكنا فقد انصب التفكير على آلية وآلة مترجمة.
وفي خضم الصراع على السبق الفضائي لم تعد ترجمة الوثائق الروسية قضية علمية فحسب بل مسألة مصير وبالتالي سياسية. ذلك أن الروس أطلقوا في الرابع من تشرين 1957 صاروخ سبوتنيك نحو الفضاء, ودار الملاح الروسي يوري جاجرين حول الكرة الأرضية في الثاني عشر من نيسان 1961. وبمجرد وصول الرئيس الأمريكي كيندي إلى البيت الأبيض طالب ببدل الجهد لمحو العار الذي لحق بالولايات المتحدة.
وتزامن ذلك مع تطور الحاسبات الآلية وتطور الإليكترونيات ودخولها ميدان الحسابات العلمية المتخصصة. و بدأ البعض يفكر في ربط معالجة اللغويات مع التحليل بالمقدرات الإليكترونية.
وفي 30حزيران1966 نزلت مركبة أمريكية على القمر و تم إطلاق أول قمر صناعي, أبولو 8 , أمريكي آهل حول القمر في 1968 , ووطأت قدم أمريكية سطح القمر في الواحد والعشرين من حزيران 1969.
وإن لم يكن لتأليل اللغويات والترجمة دور في ذلك فإن المرحلة صبغت بطابعها الدراسات في الميدان ومنحت للبحوث في الترجمة الآلية نفسا قويا. وخصصت الحكومة والشركات الكبرى مبالغ ضخمة للتجارب في الترجمة الآلية.
وكانت جامعة جورج تاون بواشنطن أولى الجامعات التي دخلت الميدان حيث بدأ طاقمها في اللسانيات قبل المهندسين بترميز المعارف اللسانية.
وأعطت تلك المجهودات : منظومات ترجمة روسية/إنجليزية مثل مارك1 ومارك 2 لـ إ.ب. م. التي وجهت للاستعمال في سلاح الجو الأمريكي وكذلك نظام جورج تاون الذي دخل الخدمة بمركز لجنة الطاقة الذرية ومركز الأبحاث الذري.
وكان للمهندس من أصل بلغاري بيتر توما دورا متميزا في مجال معالجة اللغة آليا, حيث اقتنع بضرورة التواصل من وإلى الروسية بحكم عمله كضابط اتصال خلال الحرب.
وبدأ بيتر توما في 1956 بتطوير فكرته وتطبيق معارفه عن اللغات في هندسة تقانة الحواسيب. هادفا ابتكار برنامج عملي للترجمة الآلية. عارضا عن اللسانيين فهو لم يتخيلهم أبدا بقادرين على حل المعضلة وحسب رأيه ـ وهي مدرسة في معالجة اللغات آليا ـ فإن على معالجة اللغات أن تنقاد للحاسوب وليس العكس.
وابتكر توما في معهد كاليفورنيا للتقنيات, في الستينات نظام أوتوتران autotran وبعدها تكنوتران technotran وأخيرا سيستران العامل على إ.ب.م. 360 في سنوات64- 1963 .
ولما ظهر أن البحوث في مجال تأليل اللغات لا يعطي النتائج المرتقبة أصدرت لجنة مراقبة تأليل اللغات في 1967 تقريرا منتقدا مطالبا بتقليص الاعتمادات المالية في الميدان ورغم أن التقرير لم يطالب بإلغائها فقد أثر التقليص على الكثير من برامج البحث.
إلا أن توما وكعادته فسر خلفيات التقرير بأنها راجعة لتقوقع أصحاب نظريات غير عملية وتطبيقية.
ونجح في نقل مشاريعه إلى شركة ألمانية والتي أخرجت في 1968 برنامجا عاملا على إ.ب.م. 3460-50.
بعدها مباشرة اعترفت مديرية التقانات الأجنبية في سلاح الجو الأمريكي بتميز منظومة سيستران على باقي الأنظمة واشترت أول نظام ترجمي منه في 1969 , . ومنذ ذلك الوقت ونظام سيستران يتطور بنجاح وفي 1973 دخل الخدمة في وكالة الفضاء الأمريكية في مشروع اتصالات سيوز-أبولو ومولت الوكالة برنامج ترجمة روسية إنجليزية. [ عد لما قلناه بخصوص الأزواج اللغوية].
وتوجه البحث في اتجاه الإنجليزية الفرنسية عام 1974 بتشجيع من مكتب الترجمات الرسمية بكندا وشركات فورد وجينرال موتورز.
و الجدير بالذكر أن البرامج الأولى المقتناة كانت بهدف التجسس العسكري.
حفريات منهجية
وصولا لهذه الفترة من تاريخ الترجمة الآلية نلاحظ:
أن كل البرامج كانت ثنائية اللغة ولم تظهر فكرة لغة محورية تدور حولها عدة لغات إلا لاحقا.
البرامج المعروضة هي برامج عملية وليست ذات تعمق نظري لساني موجهة لأهداف محصورة ومحددة فاعلة مما يغضب أصحاب التنظير الذين لا يرون في برامج سيستران إلا كشكولا ومن هذه الناحية يمكن اعتبار سيستران نقيضا على صعيد منهج العمل لأرورترا, مثلا , وغيره من البرامج التي تأخذ بعين الاعتبار مسألة تحديد مسبق لمواصفات اللغات بهدف الوصول لتحديد لغة محورية تكون قاعدة للترجمة. ومع هذه الانتقادات تبقى منظومة سيستران أكثر البرامج فعالية وإنتاجية في ميدان الترجمة الآلية.
حفريات
لم يكل بيتر توما من العمل وفتح الأسواق الجديدة, إذ أنه توجه للمنظومة الأوروبية عارضا عليها برامجه ومنهجيته. وتزامن ذلك مع دخول برنامج أورونيت euronet ميدان الخدمة في المديرية الثالثة عشرة في المنظومة الأوروبية ...... وهو برنامج يهدف إلى توحيد وسيلة استجواب قواعد المعلومات الوثائقية في عموم أوروبا ولذلك طورت المخازن متعددة اللغات. ولرفع المردودية فقد توجه التفكير إلى الترجمة الآلية.
واعتمدت المديرية برنامجي سيستران وتيتوس في 1976.
فالأول هو البرنامج الوحيد الذي يتعامل مع النصوص كاملة للترجمة من الإنجليزية إلى الفرنسية ويتوافق مع تجهيزات المديرية الحاسوبية. وقد يمكن من ترجمة كاملة لقاعدة معلومات وثائقية تهم المنظومة عامة, من الإنجليزية إلى الفرنسية وربما من الفرنسية إلى الإنجليزية لاحقا.
وتيتوس برنامج ذي تراكيب مختزلة عامل بين الإنجليزية والفرنسية والألمانية والإسبانية [عد للتعريفات] وخممت المديرية في توسيع تركيبه ولأسباب زمنية تخلت عن هذا البرنامج ليبقي سيستران البرنامج الوحيد المطلوب تطويره . وهكذا انطلقت مرحلة إعداد معاجم لترجمة ملخصات قاعدة علم التغذية والتقانة وهي قاعدة مرتبطة بأورونيت, و حقق البرنامج تطورا في ترجمة زوج اللغة إنجليزية/ فرنسية وبدأ تطوير أزواج أخرى.
ومع ذلك فلم يصبح برنامج سيستران عام التوظيف في المجموعة الأوروبية إلا في بداية الثمانينات.
يستعمل حاليا نظام سيستران في لجنة المجموعة الأوروبية وسلاح الجو الأمريكي وكبريات الشركات الدولية وغيرها من المواقع.
وحيث أن كل مجال وكل موقع له حاجته المختصة من المعجم فذلك يعني أن معاجم المنظومة الترجمية في تطور لأن كل مجال يتطلب تطوير معجم خاص, وأن آليات الوصول إليها يجب أن تتحسن لتدخل برامج المنظومة حيز الحواسيب الشخصية ومنصات العمل الترجمي الشخصية مع ما يعني ذلك من سعة الانتشار والاستعمال.
أما في ما يتعلق بالمنصات الكبرى ذات المراكز الحاسوبية الضخمة, فلا منافس لسيستران إطلاقا من حيث : سهولة الوصول إلى الهدف و إمكانية التجديد والتحيين والشمولية وهي ميزات مهمة لكل برنامج حاسوبي ويعزى هذا السبق لأقدمية تجربة المنظومة
المنهجية
أولى القائمون على مشروع سيستران منذ البداية أهمية لتعدد استعمالات المنظومة وتوافقها مع مختلف الحالات ولم يحصروا اهتمامهم في مجال عملي ضيق. وكان الهدف منذ البداية حسب بيتر توما اختزال عملية التأليل الترجمي إلى ما يمكنه منطق الرياضيات والمعلوميات من سبل.
ولم يضيق القائمون على المشروع على أنفسهم بقواعد نحوية محددة قاهرة. وحسب البعض من معارضي المشروع فإنه يستحيل الحصول على نتائج صحيحة في برنامج يعدم مثل تلك القواعد النحوية.
ثم أن توسيع المجال يمكن من الاستعمال في كل الحالات لنفس البرنامج الترجمي : محاضر اجتماعات ووثائق تقنية والبيانات التقنية... وطبعا ذلك يعني وقتا زائدا لاختيار الترجمة الموافقة لكل حالة على حدا من بين العديد من الترجمات المطروحة.
وبتلخيص شديد فإن منهجية المنظومة جمعت بين السطحية والعملية والفعالية. أليست العبرة بالنتيجة لا في ما يسبقها من كلام وتنظير؟.
والفرق بين المنهجيتين, ولنا عودة بتوسيع أكثر لهذه النقطة, يتلخص في موقف ينطلق من العملي وشروط ومتطلبات التقانة والمنطق الرياضي و منطلق يولي أسبقية لتصور نظري لساني شامل قبل الجانب التقاني وهذا لا يعني انعدام أرضية منطقية في هذا التصور كما سنرى فيما بعد.
والقضية, بتعبير أوضح مع شيء من الغلو, هي من يقهر أو ينصهر للآخر الإلكترونيات أم اللغويات؟
مكونات النظام
النظام الأساسي يتحكم ويدعم المكونات الأخرى. وكتب بلغات المجمع 360 و لغة س. تفوق قواعده المائة ألف غامضة. ويحوي بعض البرامج موحدة لكل الأزواج تجمع في:
برامج توسيط وتناول للنصوص
برامج تسيير وتحيين المعاجم
برامج خلق وصول إلى معاجم الترجمة
برامج مراقبة الترجمة والتأكد من المعجم
مكونات مختلفة
برامج الاستعمال الروتينية.
ووحدات الوصول إلى المعجم هي مكونات أساسية للبرنامج ولا تحتاج لنظام قاعدة معلومات مستقلة تستند إليها.
وهذا يعني أن المنظومة يمكن تثبيتها مباشرة على الحاسوب وخاصة إذا توافق مع منظمة ما بعد إ.ب.م. 360 وما بعدها, بدون حاجة إلى برامج توسيطية أخرى. ويصعب نقله إلى منصة عمل عاملة تحت مستغل يونكس أو دوس.
وأظهر النظام الأساسي صلابة ومسايرة ولم يحتاج طوال فترة استغلاله إلى تحسينات مهمة مسجلا قلة العطب مما يسند منهجه و مقولة حاجة الترجمة الآلية إلى الرضوح لمتطلبات المعلوميات الضيقة .
البرامج اللسانية,
ورغم أن البرامج اللسانية, أي جانب تحليل اللغة, في المنظومة كتبت بنفس اللغات البرمجية كبقية النظام, إلا أنها أكثر سهولة وتلائما من السابقة, وحيث أنها في أغلبها كتبت خصيصا لسيستران فإن لها ميزات تفوق بها لغات البرمجة العامة بتضمنها لأوامر برمجية موجهة خصيصا للترجمة مثل :
Cw= كلمة مستعملة , SKCAT = لصنف الدلالات وغيرها مما يجعل النظام في متناول المستعملين غير البرمجيين ويتطلب تشغيله دراية دنيا بأدغال البرمجيات.
ويتم الرجوع إلى البرامج اللسانية تراتبيا وتحلل لغة المنبع باستقلالية عن لغة الهدف بخطوات منها :
حل مشكل المتشابه النحوي, تحليل حدود الملفوظ, أعداد مختلف مستويات الترابط التركيبي.
واختزل برنامج التحويل إلى المعجمية الروتينية وتحل في هذا المستوى إشكاليات ثنائية اللغة والتراكيب والبنيات المعقدة. وعلى مستوى لغة الهدف تحل مسائل الصرف والتركيب وترتيب الكلمات.
وعكس ما قد نتخيل فإن هذه المسيرة معقدة.
المعاجم
سنعود لمسألة المعاجم في توسع خاص بالمعجمية الحاسوبية. ونحتفظ هنا بتقدم بعض خاصيات معاجم منظومة سيستران تقريبا للمعنى.
ميزة معاجم سيستران
السعة أي كير المعجم,
الوظيفية والعملية فلا يكفي أن يكون العجم واسعا كبيرا لكي يكون صالحا وسهلا ومفيدا في الاستعمال.
الشمولية ويقصد بها شمولية المجال المراد .
ومعاجم سيستران ذات مداخل إما على شكل كلمة وحيدة أو كلمات متعدد حين تتعدد الدلالات أو تتنوع السياقات .
وتحوي معاجم لغة المنبع معلومات صرفية ونحوية وتركيبية ودلالية وقسم الكلمة إذا كانت مشكلة.
والمداخل المتعددة تشمل تعابير لمختلف الأصناف وتقعيدا للسياق تتعلق بالترابط وخصائص كلمة أو كل كلمات العبارة.
وفي لغة الهدف فالمعنى المعطى لكل حالة يبدأ من المقابل العام لكلمة إلى الترجمات الخاصة الإلزامية لعبارة في سياق سابق التحديد أخذا بعين الاعتبار الملفوظ والظرف والمجال. وبتحديد المجال والسياق يمكن أن نمنح إلزاما, كصنف خاص, للتعبرة والكلمة مقابلا محددا يعوض المعنى العام والمقابل العام في كل المعجم إذا حددنا المجال في أوامر و طلبات الترجمة.
إحالة
قد يتساءل البعض عن جدوى النعوت التي تتابع في كتابتي حول المنظومة.
تلك الكلمات وما يتبعها من نعوت هي من صلب المصطلح وضرورة للدقة.
وفي حديثي عن الترجمة المؤللة تعترضني دائما مشكلة المقابل العربي. وقد اخترت كعادتي وكموقف شمولية التعريب فاستعملت ما هو معروف ومشهور, طبعا نعدم معجما موحدا, وابتكرت في الكثير من الحالات بما يساير المضمون والمجال.
وعلى سبيل التنكيت حضرت عرضا في اللسانيات قدمه أستاذ كبير من القاهرة فإذا هو يسمعنا كلمات البراجمتيك, والسيمانتك, والهيد ينطقها بفخامة وفي اللقاء الجانبي اكتشفت أن صاحبنا لم يؤتى من العلم شيئا في المجال وأن علمه بالــ hpsg و tag لا يزيد عن نطقه بها أعجمية ثقيلة. فكان بحق نعم الأستاذ الدكتور المفرخ.
ولمن يجد صعوبة في التتبع لا يزعج طرحه سؤالا, وقد يجد الجواب طي التعريفات العديدة التي أقدمها.
إحالة
كلمة الغموض بل مصطلح الغموض وقد وردت هنا كثيرا.
من هو المترجم الذي لم يتصارع مع الغموض في ترجماته.
وأصعب ما تتعرض له الترجمة الآلية والمؤللة قضية الغموض. وهو أنواع عديدة.
فهناك غموض المشترك اللفظي والأضداد كما يقول النحاة العرب وهي مسألة تحل بالمعاجم وبالمكانز السياقية.
وهناك غموض كتابي, أو المشترك الكتابي في اللغات الغربية.
والغموض الشكلي في الكتابة العربية الخالية من الحركات. فحين نكتب مثلا دخل الدولة السنة الماضية لا نعرف إلا بالسياق ما المقصود هل فعل الدخول أم المصدر.
وقد نعطي مثلا آخر: ضرب مصطفى موسى ولو لم تكن هناك قاعدة أسبقية الفاعل على المفعول في هذا النوع من الجمل لتعذر علينا معرفة من الضارب والمضروب. وطبعا فالترتيب يحل الكثير من الغموض والترتيب غير عام في اللغة العربية كما نعرف وحتى في اللغات الهندية الأوروبية ذات الترتيب المحدد تجد مع ذلك جملا غامضة.
وحيث أن نحاة العرب تكثر من فعل الضرب في أمثلتها لو كتبت سيرا على خطاهم: ضرب النساء واجب أو مذلة, لفهم أغلب قراء الجملة أنني أقصد ما ورد في القرآن الكريم في شأن بعض الزيجات. ولو قلت لهم أن فاعل الضرب هو النسوة لوجدتَ القراء بعد تردد قد ولجت باب الحديث عن طغيان النسوة في هذا الزمن الرديء. هذا الصنف من الجمل يعد غامضا. ولا يفهم إلا بالسياق أو بالذاكرة الثقافية والاجتماعية للفرد. وهي ذاكرة غربالة ومتغيرة وآنية مضطربة يتحكم فيها الظرف والمحيط.
وتختلف عن ذلك ذاكرة الحاسوب فهي مرتبة ممنهجة خارج المجتمع تتعامل بسيل من الأوامر المحددة وليست قط قضية بلادة الآلة أو تفوق البشر.
المسألة بطريقة أخرى كيف نكتب ونصيغ أوامر برمجية منطقية حاسوبية تحت محدد الرياضيات الحازم ليفهم الحاسوب المقصود. وهذا هو صلب مجال التأليل.
ويفسر ذلك في كثير من الحالات كيف تجيب برامج الترجمة المؤللة بطريقة غريبة على مسائل نعتبرها كبشر سهلة يسيرة.
قال الجاحظ : البياض كتابة
فتحت الحوسبة اللغوية أبوابا في النحو لم تكن معروفة.
وكان لمنطق الحوسبة الصارم دورا في إبراز ظواهر لغوية على الأقل في اللغات الغربية لم تكن في حساب النحو التقليدي. وظهر أن جداول وتصنيفات النحاة لا تشمل كل جوانب اللغة والكلام.
النحو التقليدي وصفي في هدفه يصف الكلمة ودورها ومكانتها في الجمل ويمنحها سمات العدد والجنس ومحلها من الأعراب والزمن وترتيب الفعل والفاعل والمفعول. هذا إذا كانت الكلمة واضحة لا تطرح مشكلة غموض وضبابية. وقد يزيد النحاة تفصيلأ وتحديدا لوصف اللغة, فنحن نقول مثلا في العربية [مع مصدر الأكل] أكل الخبز بجر ونصب الخبز معا ونقول مرة أنه مفعول وقام المصدر مقام الفعل ومرة مضافا على اعتبار أن المصدر فقد فعليته وأصبح اسما [وهي ظاهرة واسعة الانتشار في اللغات الأوروبية وتفرد لها أبواب في نحوها], ولك في كتب النحاة العرب من هذه الأعاجيب والحالات ما يخفف عنك وقع الشمس في الظهيرة يكفيك أن تفتح باب المنادى لتسافر عبر حالات واستثناءات طويلة ساعات وأيام طوال.
وهذا الجانب الوصفي لا يكفي في حوسبة اللغة.
تعد ما نسميه بمسألة التنازع النحوي والمشترك من أعقد القضايا في معالجة اللغات آليا.
وتعتبر اللغة الإنجليزية من أكثر اللغات إشكالا من هذه الناحية عكس ما قد نتخيل سلفا وأظهرت بعض المعطيات أن ما يقارب الخمسين بالمائة من كلمات جملها النمطية مشكلة متنازعة.
وتحل المعضلة بالرجوع إلى السياق وتحديد السياق ليس من السهولة كما قد نتخيل ويتطلب ذلك برمجة ضخمة وثقيلة. وهناك طريقتان لحل ولتحديد السياق : إما خطية أي أننا نقلص غموض الكلمة بمعلومات مستمدة من سابقها في الجملة ونستعمل الحاصل لمحو غموض ما يتبعها وهكذا دواليك إلى نهاية الجملة والطريقة الثانية انتقائية : نهتم بالسهل أولا ثم نرجع لما هو أعقد. وكل ذلك يتم بتطبيق نظرية تقاطع المجموعات أو نظرية المحتمل المشروط.
ولتقريب المعنى نورد بعض الأمثلة والقضية تحتاج إلى أكثر من أسطر.
نقول : جاء المطر وحين يقرأ برنامجي هذه السلسلة يبدأ بالكلمة الأولى وانطلاقا من معجمه يحدد أنها فعل غير متعد لا تنازع فيه ومن حلوله الممكنة أنه قد يعتبرها جملة قائمة من فعل وفاعل محذوف وينتظر أن يكون تابعها إما جملة جديدة أو حشوا أو فاعلا أو صفة , علما أن معجمه يأخذ بعين الاعتبار كون المطر اسما لأنه معرف. وقد تعرف البرنامج على الفعل بسهولة لأن الفعل هنا ينتمي إلى مجموعة محددة العناصر لا تسمح بالتنازع فيها. كما لا يتنازع اثنان في تحديد تالي حرف جر أ اسم أم فعل هو.
وقد يجد البرنامج عقدة في تحديد : أكل الرجل الأسد, فسلسلة أكل قد تكون فعلا معلوما أو مجهولا أ أو مصدرا أو اسما والأسد فاعل أو مفعول أو بدل.... ومكره أخوك لا بطل وجائني أسدا ودخل القاضي امرأة وغيرها من عجائب الدنيا السبع في لغتنا الجملية مما يسعد أخانا الكريم الأستاذ الليثي في منتداه سهرا ومتعة ويسهر من جراها أهل البرجمة في شركة سيستران ليالي غم و سهاد.
وما يلي نوع آخر من معضلات الترجمة الآلية:
خذ : في نص ما السلسلة 2.5 هل هي عدد كسري أم رقم ترتيبي أم شيء آخر؟ المشكلة في النقطة.
وفي بعض النصوص نكتب بدل الأرقام الهندية أو المغربية حروفا وهكذا نجد: اب و دن وغيرها من عجائب الكائنات وطبعا حاسوبي البليد لا يميز بين دن الخمر وقرابة الأبوة و بين الرقم المكتوب بحروف أبجدية.
ولنعقد المسألة بعض الشيء فنحن نكتب : واحد من عشرين وواحد في المائة وخمسة على عشرة وصفر على الهامش أو اليدين.... ولا نلاحظ أنها جمل تتطلب توقفا. فما أتعس هذه الآلة التي لا تفقه ما يفقه صغار التلاميذ !!! من يقول هذا لم يرى أن هذه المتواليات الرمزية غامضة وتحاج لتوضيح وبرنامج روتيني ليفهم حاسوبي المترجم متى يتعلق الأمر بنقطة الفصل والنهاية ورقم كسري وترتيب فصول ومتى يكون دني رقما أو وعاءا و... متى يكون الواحد صفة للخالق الجبار أو رقما ... وهذه محددات لا تجدها في النحو الوصفي التقليدي.
وبدأت كلامي بذكر الجاحظ وبياضه
النص وأي نص هو توال سلاسل رمزية من بداية المقال مثلا إلى آخره. ولكن النص يحوي سلاسل خاصة كالعنوان وعناوين الفقرات ونصوص مدخلية وهو إخراج منسق ومشكل ومزع ومهيكل فيه فراغات ورجوع إلى السطر.... كل هذه المشكلات يجب أن تكون مضبوطة قابلة للبرمجة.
التنقيط :
دخلت علامات التنقيط إلى بلاد العرب في ما دخل من المورد ولازال هناك من يعتبرها بدعة حرام. ومن شاء أن يسهر ليال في إعداد أطروحة للدكتورة أوجهه لدراسة استعمالات علامات التنقيط في اللغة العربية الحالية وأظنه أنه سينتحر قبل انتهاء بحثه. ولنفتح أي منشور عربي سنجد أن الفواصل والنقط ونقط الفاصلة تسير بما سارت به ركبان الإبل العمياء. وليسوا الوحيدين وأنا أسأل ــ دفاعا عن عروبتنا ــ العارفين باللغات الغربية ما هي القواعد المحددة المضبوطة في استعمال علامات التنقيط؟ طبعا ليس المطلوب جواب مستمد من كتب المبتدئين !!!
يقال أن الجملة تنتهي بنقطة ولكننا نقول أيضا على ذمة نحاتنا الكبار أنها تنتهي بتمام معناها ومتى ينتهي المعنى يا سادة النحو ؟ بنهاية النص, طبعا, هذا إذا كان للنص معنى.
والحلول البرمجية التي قدمت لهذه المسألة في سيستران حلول استمدت من التجارب العملية ومن سياقات النصوص ونوعيتها.
وللحديث بقية في انتظار ذلك هل فكرتم لماذا نكتب في العربية : وجاء ثم جاء مرة بإلحاق حرف العطف ومرة بفصله وأنا متأكد أن صاحبنا, وأنتم تعرفون من أقصد ابن مدينة الضباب, سيثقلني بإحالات من كتب النحو والإملاء لتعليل ذلك ولن يفهم حاسوبي الساذج شيئا من ذلك لأنني سبقت ودربته على معرفة الفراغ فإذا الفراغ هنا يتحول شيئا آخر, فكيف تريدونه أن يتصاحب معه, أقول ذلك وأنا أعلم بوسائلي الخاصة أنه لا يفارق حاسوبه ليل نهار وقد هددته زوجته بالخلع على ذلك. معذرة ودمتم بخير.
إحالة
المصطلح والاصطلاح دائما
يستعمل في الكثير من النشريات العربية مصطلح البرنامج الداعم للعربية في الحديث عن برامج الترجمة المؤللة. وللتذكير فقد بدأنا في استعمال هذه التعبرة وقت الحديث عن البرامج الحاسوبية التي تمكن من الكتابة بالحرف العربي. وهي ترجمة حرفية للتعبرة اللاتينية. فيقال مثلا برنامج ويندوز داعم للعربية. وهذا ليس بمزعج . ويختلف الوضع حين الحديث عن الترجمة.
مفهوميا ماذا يعني الدعم في حالة الترجمة؟ وقد نفترض أن الأمر يتعلق ببرامج تساعد في الترجمة إلى العربية. ومن خلال تقص بسيط نفهم أن المقصود بالدعم هو المساعدة والترجمة الآلية في نفس الوقت. ولا أفهم لماذا لا نتحدث عن برنامج مساعد وبرنامج مترجم. زد لذلك أن أغلب البرامج المقصودة أبعد ما تكون عن برامج مساعدة هي أقرب ما تكون برامج شبه مساعدة !!!
فلا يكفي أن يكون البرنامج متضمنا لمعجم بسيط وبعض القواعد ليفي بالغرض. وأعلب تلك البرامج المعروضة بخصوص العربية لا تملك من الزاد ما يكفي للحديث عن برنامج آلي للترجمة فهي لا تتضمن في غالبها قواعد قياس ومعاجمها ليست بقواعد معطيات علاقية مثلا.
إحالة
قضية المعجم
ولنا عودة إليها بشكل مطول لا حقا.
المعجم الحاسوبي المؤلل معجم من نوع خاص, جمعت مواده بطريقة أنظمة قواعد المعطيات العلاقية وهي تختلف عن أبناك المعلومات في نسقها وهندستها. وتحوي الكثير من المعلومات التي لا توجد في معجم ورقي عادي. وإن معجما شاملا وناجعا كفيل برفع نتائج برنامج ترجمة. وللأسف فأغلب ما يستعمل في المجال العربي لا يف بأقل شروط هذه المعاجم.
قد أسجل لسان العرب بكامله في البرنامج دون أن أحصل على برنامج معجمي عملي. والدراسات العربية في المجال قليلة أو عديمة الجدية.
أزواج اللغة
كيف اختيرت أزواج اللغة في منظومة سيستران؟ وما هي الصعوبات التي تعرضت كل تأليف وزوج؟ وما هي التعقيدات التي قد تتعرض سيستران عند زيادة زوج جديد؟
قلنا بداية أن سيستران تعامل مع الروسية إلى الإنجليزية وبدخوله الخدمة داخل المنظومة الأوروبية توجب توسيع أزواج اللغات العاملة. ومن البداية ظهر أن أزواج الإنجليزية ــ الفرنسية أزواج أساسية. فأول برنامج قدمته سيستران للجنة الأوروبية, للإنجليزية/ الفرنسية, كان برنامجا لم يتم فحسب تجريبه بل وسع للعديد من المجالات والنصوص. وزوج اللغة الفرنسية الإنجليزية تحول بسرعة إلى برنامج عملي تام بعد أن كان قد برمج أولا للبرهنة على فعالية منهجية سيستران.
انطلاقا من قواعد وثائقية متواجدة مختلفة في سياقاتها ومعطياتها عن ما هو متداول في اللجنة تم تكوين معاجم.
وتم إدخال الزوج إنجليزية/ إيطالية للبرهنة على إمكانية دمج لغة هدف جديدة أخرى في نظام سيستران ونظرا لعدد الناطقين بالإيطالية في المجموعة الأوروبية, وحيث أن اللغة الإيطالية شبيه باللغة الفرنسية كلغات لاتينية فقد تمت عملية الدمج بيسر مع الاحتفاظ بمعجم لغة المنبع للاثنين. ولم يتم اختيار الألمانية حينذاك لأن اللجنة تخليت أن برامج أوروترا سوف تحل هذه المسألة ولما ظهر أن برامج أوروترا لن تكون عملية في القريب, طلب من شركة سيستران تطوير برنامجها الإنجليزي الفرنسي وطلب من شركة توما تطوير برنامج فرنسي ألماني.
طرحت اللغة الألمانية الكثير من المعضلات نظرا لاختلافها من حيث ترتيب الكلمات في الجمل ونحوها وقواعد تركيبها, ولم تكن النتائج في مستوى الأزواج السابقة حتى بعد سنوات من العمل والتطوير.
وطلبت اللجنة الأوروبية تطوير الأزواج : الفرنسية الهولندية والإنجليزية الهولندية. علما أن سيستران لم تكن سبق لها وأن تعاملت بأي شكل مع هذه اللغة.. وقد أعطت العملية نتائج أحسن من نتائج جانب الألمانية.
كل هذا التوسع جرى وسط تجاهل شبه مطلق من المترجين داخل اللجنة لقضية الترجمة الآلية ــ ويلاحظ قلة المترجمين الذين شاركوا في عملية التطوير ــ وهو موقف لازال قائما لحد الساعة بين المترجمين الذين لا يرون في المترجم الآلي إلا مضيعة وقت أو منافسا خطيرا على لقمة عيشهم وربما فسر التجاهل وعدم التحمس لما هو آلي بكون الكثير في عالم الترجمة هم ممن يتخيلون الترجمة فنا ووحيا لا مجال فيه للبرمجة الآلية وقد برهنت السنوات التالية على جهلهم و غلطهم كما سنرى فيما بعد.
بتوسع حدود السوق الأوروبية إلى دول أخرى فقد تم دمج أزواج إنجليزية/أسبانية وإنجليزية /برتغالية لاستعمالات محصورة. ومن ترجمة بعض المتعاملين مع برامج سيستران داخل اللجنة الأوروبية وسعادتهم بنتائج الترجمة بين لغات مختلفة فقد شجعوا العمل على دمج أزواج لغات متقاربة كالفرنسية والإيطالية. وبالفعل فلم يتطلب هذا البرنامج وقتا طويلا ليصبح فعالا وتجاوز في نتائجه باقي أزواج اللغات وأعطى البرنامج في مجالات ولبعض النصوص نتائج تقارب نتائج الترجمة البشرية.
وتم دمج زوج إنجليزية / يونانية لا حقا.
ومن جانب اللغة الأسبانية فقد تم الاستفادة من برنامج الإسبانية/ الإنجليزية, ــ الذي كان قيد التجريب في سلاح الجو الأمريكي كما قلت عاليه ــ, وتوجه التفكير نحو تطوير أزواج الفرنسية/ الإسبانية مع الاستفادة من تجربة الإيطالية.
وبهذا نكون قد وصلنا في متابعتنا لاستعمال برنامج سيستران في اللجنة الأوروبية تاريخيا إلى 1990. وبذلك تنتهي الحفريات وندخل مرحلة مختلفة من تاريخ سيستران نفصل لها حيزا خاصا.
وأول ما يمكن أن نقول عن هذه الفترة السابقة أنها قصيرة 20 سنة !!! وما أشبه الليلة بالبارحة. أقول ذلك ثلاثا لأن الكثيرين من التراجمة أو أنصافهم يتجاهلون هذه الحقيقة البسيطة, وأن عجلة التاريخ تسير, كره من كره. وان ما حققه التأليل في هذه الفترة الزمنية القصيرة خيالي. زد لذلك أن عدد المبرمجين والعاملين في كل زوج لغة قليل وتحسب الفترات الزمنية ب سنة/شخص العمل على أصابع اليد الواحدة.
وأتذكر في بداية دراستي كيف كنا نتمنى وجود برنامج داعم للكتابة العربية, وكانت أول البرامج المعروضة علينا تعد ثورة وكانت لا تمكن إلا من القليل وأتذكر كيف كان يجيبني أحد الأساتذة كلما رأى ما أنقره : ’’لا تضيع وقتك في اللعب على ذلك التلفاز !!‘‘
أستاذي الكبير كان يعتبر كل ما خرج عن التقليد بدعة وأن ’’التلفاز‘‘ ما وجد إلا لفرجة الأشرار وأخال أنه لازال حاله.
أخي الفاضل العبيدي, جارنا سكنا ومجاورنا هما,
أشكرك على مداخلتك الوجيهة, ويتجلى من خلالها أنك ملم بخفايا المسألة. وكما تعلم فمن الناحية المنهجية فكل قضية وكل مسألة عندما تطرح بجلاء وتحدد في مراميها وتحصر أسسها تعتبر شبه محلولة أي أنه من الممكن وجود جواب لها. وبالعكس فإذا خلطنا المنطلقات والمنهجيات كما يفعل بعض أصحابنا جهلا وتطاولا على ميدان معطاء آنذاك لن تحصل على حريرة ولا هريسة بل خليطا غريبا.
وعاليه طرحت قضية البرنامج الداعم للعربية في الترجمة !!! وكما لا يخفى عليك فشعر رأسي ينتصب غضبا وغيرة حين أسمع كلاما عير مضبوط وتغذوا المسألة ليس وجود برنامج داعم للعربية بل شخص داعم للعربية.
ومرحبا بك على حريرة حقيقية ولحم بهريسة.
ودمت عزا
أخي الفاضل العبيدي, جارنا سكنا ومجاورنا هما,
أشكرك على مداخلتك الوجيهة, ويتجلى من خلالها أنك ملم بخفايا المسألة. وكما تعلم فمن الناحية المنهجية فكل قضية وكل مسألة عندما تطرح بجلاء وتحدد في مراميها وتحصر أسسها تعتبر شبه محلولة أي أنه من الممكن وجود جواب لها. وبالعكس فإذا خلطنا المنطلقات والمنهجيات كما يفعل بعض أصحابنا جهلا وتطاولا على ميدان معطاء آنذاك لن تحصل على حريرة ولا هريسة بل خليطا غريبا.
وعاليه طرحت قضية البرنامج الداعم للعربية في الترجمة !!! وكما لا يخفى عليك فشعر رأسي ينتصب غضبا وغيرة حين أسمع كلاما عير مضبوط وتغذوا المسألة ليس وجود برنامج داعم للعربية بل شخص داعم للعربية.
ومرحبا بك على حريرة حقيقية ولحم بهريسة.
ودمت عزا
حصيلة النتائج
إن كل برنامج لا يمكنه أن يتجاوز نقاط ضعفه إذا لم يقيم ويقوم.
فتقييم النجاحات إذا كان موضوعيا يقدم حلولا توجيهية وسوقية. ونظام سيستران لم يخرج عن القاعدة واستفاد من انتقادات ورد فعل المترجمين في تحسيناته وإصداراته التالية. وقد انصب التقييم في البداية على دراسة عدد الأخطاء وصنفها وفعالية الإخراج ووضوح النص الحاصل قراءة ومعنى.
ومن خلال هذا التقييم يتم وضع خطط سوقية إما لتحسين البرنامج داخليا [فترة ما بين 75-] و إما لتوسيع استعمالاته إلى مجالات أخرى . ونظرا لانتقادات بعض المترجمين لجدية التقييم من حيث شروطها ولتمكين غير المختصين في البرمجة من متابعة التقويم فقد طور برنامج خاص أقليديس يمكن من ترجمة لغة البرمجة الخاصة بسيستران إلى اللغة الطبيعية ليتمكن المنتقدون من غير المختصين بفهم هيكلة أوامر النظام مما خفف من حدة النقد وبرهن على تعقيد أوامر البرنامج .
و نتائج المتابعة الإحصائية في كارلسلو لــوضوح الفهم و أخطاء النقر وأخطاء الكلمات والمصطلحات والأخطاء النحوية و التركيب .... أوضحت أن نسبة الغلط في الترجمة الخامة انحصرت من ثلاثمائة إلى40 غلطا تقريبا بينما ارتفعت نسبة وضوح الفهم لتقارب نتائج الانتخابات العربية مما أدى في بعض المواقع إلى اعتماد الترجمة الخامة دون التدقيق النهائي.
موقف المترجمين من النظام
رغم أن لجنة الترجمة في المنظومة الأوروبية طلبت من مترجمين مهنيين تقييم البرنامج وتحديد مجالات استعمالاته الفعالة ورغم أن النتائج كانت مقبولة في الكثير من المجالات إلا أن غالبية المترجمين بقيت على هواها ونتيجة هذا التقييم قرر استعمال سيستران لترجمة دقائق اجتماعات رؤساء المديريات..
وقد طالب تقرير في 1990 بضرورة صياغة سيستران بلغة برمجة متطورة واستعمال قاعدة معلومات علاقية لتسيير المعجم وتقريبه من المستعمل.
أفتح قوسا جديدا إجابة على تدخل فخر الخضراء أعلاه,
مرة أخرى أؤكد على انعدام برنامج مترجم كامل الفعالية وناجح لعدة أسباب. وأننا حين نتحدث عن الترجمة الآلية يجب أن نضيف الحيز والمجال والنوعية فبدون هذا التحديد فإننا سنخبط خبط عشواء. الترجمة الآلية تضاهي الترجمة البشرية بل تتجاوزها حينما يتعلق الأمر بترجمة تقنية محددة المجال محصورة معجما وتركيبا. ويختلف الأمر حين يتعلق بنصوص حرة أو شبه حرة.
أقول ذلك لأن الكثيرين من المترجمين لهم مشكلة ليس فحسب مع الحاسوب والترجمة الآلية بل مع اللغويات بحد ذاتها. وأنا أطرح عليك أخي عبيدي سؤالا استفزازيا إذا سمحت وأنا متأكد أن ذلك لن يزعجك بل على العكس :
كم عدد المترجمين الذين تعرفهم, يقرؤون النص وأي نص بنظرة علمية لسانية؟
وأتحدى أي واحد ممن يكتبون حول لغة الصحافة أن يقدم لي هيكلة متكاملة لهذه اللغة؟ لا أريد أن يكرر لي ما يقرأه التلاميذ في المدارس الابتدائية بهذا الخصوص.
حين نقرأ جريدة عربية وأي جريدة فإننا نواجه عدة مستويات لغوية, وطبعا القارئ المتوسط أو العالي قد يمر من نص جاهلي إلى خبر رياضي دون أن يفطن أنه يتعامل مع تراكيب متنوعة وقد يقول البعض بلغات متنوعة.
المترجم البشري نفسه قد يجد صعوبة في ترجمة نصوص لم يتعود عليها فكيف نطلب من آلة قريبة الحدث أن تترجم ما لا تفهمه ويعجز الإنسان ذاته عن فهمه. ولكي تفهم الآلة يجب أن نقدم لها أوامر صريحة وواضحة ومضبوطة. وإلا فإننا نكرر قصة البدوي الذي لم يفهم كيف أن مذياعه خبره بأخبار بعيدة ولم يخبره بموت بقرته في جواره.
أتوقف هنا لكي لا أرجم.
شاركت: 15 فبراير 2006
نشرات: 285
ارسل: الاحد فبراير 26, 2006 10:22 am موضوع الرسالة: حول المعالجة الآلية للغات
--------------------------------------------------------------------------------
تعريفات1
توم TAUM
هو اسم مختزل للترجمة الآلية لجامعة مونريال . وكانت الحكومة الكندية في 1965 وراء المشروع . وكان المشروع في بدياته عاما للترجمة ولكن بعد سنوات العمل والبحث تخصص المشروع في متابعة أحوال الطقس كتطبيق أساسي ميداني للبرنامج. ولذلك أصبح اليوم معروفا باسم توم ــ طقس..
هذا البرنامج يترجم المعلومات الطقسية للحكومة الكندية منذ عام 1977 من الإنجليزية إلى الفرنسية ومنذ عام 1989 من الفرنسية إلى الإنجليزية. فالترجمات من الإنجليزية إلى الفرنسية فهي توجه لمناطق فانكوفر وإدمونتن وكالجري ورجينا وتورونتو وهاليفاكس أما الترجمة من الفرنسية إلى الإنجليزية فتهم منطقة مونريال. واليوم فإن كل التوقعات الطقسية الكندية أصبحت مترجمة.
البرنامج يعتمد على 2000 كلمة وتعبرة. ويترجم ساعة بعد ساعة كل التوقعات بمعدل 30000 ألف كلمة في اليوم.
وواقعيا توم ـ طقس هو نظام مستعمل منذ زمن وقد حاز على استحسان الجميع. وللتدقيق يجب التفريق بين استعمال عادي وشامل واستعمال الزبائن من حيث التخصص والتواتر.
ولأن البرنامج شديد التخصص والتميز فهو يحوي مصطلحات محصورة أي ذي معجم محدد وشامل للكلمات المراد ترجمتها وتركيبا جامدا يدور حول عدد قليل من التركيبات الجملية وهو ما يمنح تطابقا كاملا لكل تركيب وهيكلة تعبيرية متكررة, لدرجة أن المترجم الإنساني لن يصبر أمام ملل التكرار أكثر من أشهر. وقد خلت مصلحة الطقس الكندية مشكلتين : الملل البشري ومشكلة لغوية باختيارها وتطويرها لنظام توم ـ طقس.
تعريفات 2
Titus تيتوس
طور برنامج تيتوس في ظروف خاصة ولأهداف محددة.
وكان وراء ظهوره ذلك معهد النسيج الفرنسي. فقد تصور المعهد برنامج تيتوس لترجمة ملخصات المقالات التي تخص النسيج للمهندسين المتخصصين المحتاجين للمعلومات العلمية الجديدة.
يتعامل برنامج تيتوس مع أربع لغات عمل : الفرنسية والإنجليزية والألمانية والإسبانية وكل الأزواج اللغوية فعالة.
وكان من المفروض أن يكون المعجم الأساس صغيرا ولو أنه من غير سابق الحصر. والتركيب محصورا نسبيا والمقالات تساير في عمومها ضرورة الوضوح والبساطة والقصر. وبرمج تيتوس للعمل في إطار تركيب مراقب, وقد شهد عدة تغيرات وخاصة تنوع الجمل المقبولة. وعندما جرب العهد الفرنسي للأبحاث العلمية برنامج تيتوس لترجمة ملخصات المقالات العملية المنشورة ظهر أن محرري الملخصات لا يحترمون شروط الكتابة المرخصة في المعالجة الآلية. وطرح إشكال بشري هل يمكن فرض تركيب مراقب ملزم على المحرر؟ فضرورات المعالجة الآلية لم تغير من عادات التحرير. ويمكن استعمال البرنامج بموازاة بيانات سابقة الإعداد, وهذا يقلص إنتاجيته, فقد أعد تيتوس كبرنامج كامل الآلية. ويمكن استعماله كما هو إذا احترمت بعض الشروط : ترتيب العناصر في الجملة وزمن الأفعال المقبول والملحقات الممكنة. و شيئا فشيئا تحول إلى نظام تفاعلي مع إمكانية إصلاح على الشاشة للمشتركات اللفظية والكتابية.
تعريف 3
Spanam /Engspan
برنامج يترجم من اللغة الإنجليزية إلى اللغة الإسبانية والعكس. وقد أعد خصيصا لمنظمة الصحة لعموم أمريكة في واشنطن التي تنشر وتصدر العديد من الوثائق الطبية الموجهة لأمريكا اللاتينية. وفي البداية أعد البرنامج الموجه نحو اللغة الإسبانية لخدمة مصالح الصحة في القرى النائية ولمقاربة أكبر عدد من الساكنة. وحاليا يستعمل زوجي اللغة بنجاح في مجالات الصحة والتغذية والفلاحة.
وإذا كانت بداية البحث حول البرنامج قد بدأت في جامعة جوج تاون فإنها طورت في منظمة الصحة لعموم أمريكة. وحيث أن المجال محصور ونوعية النصوص محددة فقد سار العمل بوتيرة سريعة. وأول الإصدارت نحو الإسبانية ظهرت في 1976 ودخلت مجال العمل في 1979 وجددت في 1988.... أما النسخة نحو الإنجليزية فهي قريبة العهد ودخلت مجال التطبيق في 1984. والبرنامج من شاكلة برامج سيستران : الترجمة الخامة تتطلب تصحيحا لتغدو النصوص مقبولة. وفي دراسة للانعكاسات ظهر أن المستعملين يحبذون الترجمة المصححة الآلية على الترجمة البشرية اليدوية.
وإنتاجية البرنامج تقارب 6500 كلمة/يوم للمترجم المصحح وهناك محاولات لإصدار يتعامل مع أزواج لغات أخرى.
تعريفات 4
Weidner
كان لجامعة بريغام دور مهم في تطوير العديد من برامج الترجمة الآلية وكان الهدف الأول منذ 1970 ترجمة النصوص المقدسة الخاصة بجماعة المرمون. وتابعت العمل شركة ويدنر منذ تأسيسها في 1977 بمشاركة كوادر الجامعة وحرج أول برنامج من الإنجليزية إلى الفرنسية في 1980. وتبع ذلك أزواج لغات أخرى من الإنجليزية إلى الإسبانية والألمانية والبرتغالية والإيطالية والعربية... ومن الفرنسية إلى الإنجليزية والإسبانية والألمانية إلى الإنجليزية و. ويمكن تشغيل هذه البرامج على حواسيب شخصية إلا البرامج الخاصة بالإنجليزية/العربية والألمانية/الإنجليزية.
وأكبر عائق لهذه البرامج هو صغر المعجم الذي يلائم دائما نوع النص المراد ترجمته وعلى المشغل إعداد معجم وهذا مكلف وضد إنتاجية البرنامج.
وإنتاجية البرنامج العملية : 4000-8000 كلمة/ساعة.
ويستعمل للترجمة في شركات دولية ومنها ماترا موتورولا طومسون بول أيروسباس بيركينس إنجين رانكس كسيروكس ...
واليوم تتوجه المجموعة المنتجة لتطوير برامج موجهة للسوق اليايانية.
تعريفات 5
Alps
بدايات ألبس كانت في جامعة برغام وقد تأسست الشركة في 1980.
ويمتاز برنامج ألبس بمستوياته الثلاثة لترجمة الألفاظ : الاختيار والذاتية والتفاعلية. وتحوي المستويات العليا المستويات الدنيا. والمستوي الأعلى تفاعلي أي أنه يقدم ترجمات جملة لجملة ويطرح أسئلة لمحو الغموض. وعموما يعد المستوى الثاني ـ الذاتية أكثر نفعا غير أن حلف الأطلسي و إحصائيات كندا تستعملان المستوى الثالث مستوى التفاعلية.
ومن اللغات العاملة في البرنامج : من الإنجليزية إلى الفرنسية والألمانية والإسبانية والإيطالية.
من الفرنسية إلى الإنجليزية.
من الألمانية إلى الإنجليزية.
ومن الشركات الكبرى التي تستعمل البرنامج: تكساس أنسترمنت , ونرس داتا, واتحاد المصارف السويسرية, ورانك كسيروكس, وهناك شركات ترجمة تستعمل هذا البرنامج ك أنترلونجوا وملتيسكربت...
ومن عيوب البرنامج المعجم الصغير ويجب أن تكون النصوص المعروضة للترجمة تقنية مكررة مكتوبة بلغة سهلة وبسيطة. ويتعامل البرنامج مع نصوص من 30000كلمة وأكثر من ذلك تتقلص الإنتاجية.
وللبرنامج إصدارات للتشغيل على الحواسيب الشخصية.
تعريفات 6
Logos
تعد برامج لوجوس منافسة لبرامج سيستران من حث جودة الترجمة رغم أن الأخير له معجم واسع ويتعامل بلغات عدة.
ولوجوس شركة أمريكية تطورت في الستينات. وخرجت أول برنامج الترجمة في 1971 خاص بالترجمة من الإنجليزية إلى اللغة الفتينامية متخصص بترجمة وثائق تتعلق بالتجهيزات العسكرية. وطورت لوجوس في الثمانينات برنامجا للترجمة الألمانية/الإنجليزية. وظهرت إصدارت لاحقا خاصة باللغات الفرنسية والإسبانية والإيطالية ولغات أخرى. وطورت شركة لوكوس برامج ترجمة ملحقة لنشر متعدد اللغات.
يمكن تشغيل بعض برامج لوكوس على حواسيب شخصية باستعمال واجهة يونكس.
ويستعمل في عدة شركات عالمية.
تعريفات 7
Smart/ Seppli
تستعمل وزارة الهجرة والعمل الكندية برامج سمارت لترجمة طلبات التشغيل ما بين الفرنسية والإنجليزية, وتنشر النتائج مباشرة على شاشات 4000 حاسوب موزع على مجموع التراب الكندي ويمكن للموظف تدقيقها آنيا وأغلب التدقيقات مع قلتها تمس التركيب ولا يتطلب البرنامج مراقبة التركيب المسبقة وذلك راج لقصر النصوص مما يجعل تراكيبها بسيطة وإن تنوع التحرير, ويستفيد البرنامج من تعدد المعطيات ويدمجها.
وتمكن برامج سمارت ترانسليتر من ترجمة خامة بسرعة 200000ك/س مع حواسيب مركزية.
وطورت جامعة جنيف نظام سيبلي وهو قريب من السابق للتعامل مع الألمانية/الفرنسية والألمانية/الإيطالية لنشر عروض العمل الصادرة في عاصمة الفيدرالية بيرن باللغات الفرنسية والألمانية والإيطالية والتي كانت ترجمتها بشرية. وزيادة على الجانب الاقتصادي في القضية فإن البرنامج يهدف إلى تشجيع الطلاب على التعامل مع المعالجة الآلية للغات الطبيعية.
تعريف 8
Socatra
وسوكترا اختزال لأسم : الشركة الترجمة الكندية. ونظامها المطروح يتعامل ما بين الفرنسية والإنجليزية. ولا يوجد في السوق وتتم الترجمة الخامة أو المحققة داخل مكاتب الشركة
وتقول الشركة أن الطاقة الإنتاجية لنظامها تصل إلى 200000ك/س على الأقل ومولد مسردي ب 500000ك/س وهي أرقام ضخمة.
Metal
ميتال هي اختزال لعبارة : الترجمة وتحليل اللغات, وكانت بدايات المشروع في جامعة تكساس في 1961 للترجمة من الألمانية إلى الإنجليزية. وتخلت الجامعة عن المشروع لصالح شركة سيمنس الألمانية التي عرضت في الثمانينات أوائل منتوجها للترجمة في ما بين العديد من اللغات –الفرنسية الهولندية الألمانية الإسبانيةـ وهي برامج ناجحة في مجال الاتصالات.
وميزة النظام أنه مركب من وحدات قابلة للتغيير مع مجموعة من القواعد النحوية المحددة يمكن الرجوع إليها كلما دعت الضرورة وقت التحليل وهكذا نحصل على عدة تمثيليات مقبولة للجملة وترفض أقل التمثيليات قبولا. ورغم أن نظام الوحدات المستقلة يسمح بالتطوير الدائم والتحسين إلا الزيادة المعجمية والبرمجية تؤدي إلى نتائج سلبية.
PC-translator
الحاسوب المترجم قد تجدونه في الأسواق على شكل حواسيب جيبية : وهو نظام يختلف عن باقي الأنظمة الأخرى. فشركة المنتوجات اللغوية تعرض بثمن بخس برامج ثنائية اللغة ـ من وإلى الإنجليزية : الفرنسية/ الدنماركية/السويدية/النرويجية/الإسبانية/الهولندية/الألمانية/الإيطالية....
والبرنامج ليس مؤللا بالمعنى الدقيق فهو يكتفي ببعض المواصفات اللسانية وبعض الوحدات اللغوية وقلة من القواعد التركيبية فهو أقرب إلى برنامج مساعد منه لبرنامج آلي أو مؤلل.
Gigatext
مثل مدرسي لما يجب الابتعاد عنه : خسارة ملايين الدولارات الكندية في برنامج يترجم النصوص القانونية ما بين الفرنسية والإنجليزية ولكن النتيجة صفر.
Winger
نحت شركة وينجر للنسيج منحى الترجمة الآلية من الإنجليزية إلى الدنماركية مستغلة قاعدة معلوماتها الضخمة. والبرنامج يعوض نقص الجانب التركيبي بالتفاعلية إذ أنه يمنح المستعمل عدة حلول يختار منها أحسنها. وهو أقرب إلى برنامج ألي مساعد للترجمة. وتعرض الشركة حاليا عدة برامج للترجمة بين اللغات الإنجليزية والإسبانية والروسية.
PaTrans
نظام للترجمة بين اللغتين الإنجليزية والدنماركية متخصص.
Tovna
برنامج إسرائيلي لم يخرج للسوق إلا في 1985 للغتين الفرنسية والإنجليزية والروسية. وميزته التقنية أنه يستفيد من تدقيقات الترجمات الخامة ويستغلها في ترجمات لاحقة.
Lexi-Tech
برنامج كندي موجه لخدمات عسكرية محددة وبداية بهدف ترجمة 100000 صفحة ذات علاقة مع الترسانة البحرية. ويحوي معجمها 75000 عبارة ولفظة مع برامج توسط بني خاصة بالشركة.
البرامج اليابانية
ولنا معها عودة خاصة
متابعة للسوق التجاري الدولي وللتطور العلمي والتقاني فقد واجهت الشركات اليابانية مشكلة الترجمة بين اليابانية والإنجليزية. ولذلك أصبحت الترجمة الآلية مع الجيل الخامس من الحواسيب من المهمات الأولية منذ 1980 وقامت الحكومة اليابانية بمجهود ضخم وشجعت الأبحاث في المجال وكان للأستاذ ماكوتو نجاو ـ مشروع حكومي ـ تأثير في توجيه الأبحاث نحو تحليل تركيبي شجري.
وهناك توجه كبير لتوسيع البرامج إلى لغات أسيوية أخرى كالصينية والكورية وغيرها من اللغات العالمية.
ومن الشركات اليابانية ذات الباع العالي في المجال
توشيبا, و فيجيتسو, و ميتشوبيشي وهيتاتشي....
وكل مشاريعها واعدة على مستويات الترجمة ومعالجة الصوت {ترجمة المكالمات الهاتفية آليا}.
ورغم أن إنتاجية الكثير من برامج الترجمة المعروضة وتتطلب تدقيقا مكلفا إلا أن اليابان يعد من أكثر البلدان توسعا في التجهيز والاستعمال ويعتبر أن المستقبل هو للترجمة الآلية فلا خيار لها نظرا لانعزال اللغة اليابانية وقلة العارفين بها عالميا والمترجمين منها وإليها.
مراكز علمية
الصين حاولت الصين الشعبية تطوير برنامج jet لترجمة إلى الصينية من اللغات الإنجليزية والفرنسية والألمانية والروسية. ولكن المشروع لم يعطي لحد الساعة نتائج
مجموعة الدول المستقلة
PARS
هو نظام للترجمة بين الروسية والإنجليزية يخص النصوص العلمية والاقتصادية. وهو يعتمد على نتائج جامعة جورج تاون للترجمة لغة إلى لغة.
SPRINT
خاص بمجالات الحاسوبيات والاقتصاد وهو إنجليزي روسي اللغة وعرضته مجموعة الترجمة لعموم روسيا.
ASPERA
هو من نوعية الأنظمة المعجمية روسي إنجليزي اللغة.
ETAP
نظام إنجليزي روسي اللغة خاص للنصوص الحاسوبية و للعلوم المعلوماتية.
ولبقية المراكز سنعود إليها في موضع آخر.
GETA
Ariane & Callipe
جامعة جرونبل الفرنسية ومركزها للدراسات والترجمة المؤللة الذي أداره بجدارة الأستاذ فوكوا لسنوات وقد اهتم مركزه بأوجه متعددة للمعالجة الآلية للغات. وكانت الترجمة من الروسية أحد مرتكزات العمل في المعهد.
Susy
بدأ مشروع سيزي في 1972 في جامعة شروبروك الألمانية للترجمة من الألمانية إلى الروسية. وتوجه الاهتمام نحو إضافة لغات أخرى الفرنسية والإنجليزية والدنماركية والهولندية وأولى المركز أهمية للغة الإسبرنتو. واستعمل البرنامج للفهرست الوثائقية وتحليل النصوص وإدماج المصطلحات الخارجية..
DLT
برنامج هولندي. تفاعلي متعدد اللغات يمن من توليد نصوص في إطار شبكة حواسيب. مع بنك معلومات معرفية بين اللغات . وتتم الترجمة عبر لغة توسطية هي لغة الإسبرنتو التي تستعمل للتواصل بين الحواسيب النهائية. فهو إذن موجه للتواصل أكثر من توجهه للترجمة رغم ما يزعم واضعوه.
Rosetta
أول برنامج من القطاع الخاص في أروبا. من شركة فيليبس. وقد نتجت عنه تجارب بين الإنجليزية والأسبانية والهولندية.
LMT
هو برنامج لشركة إبم المعروفة وهو برنامج ذي هدف متواضع ويتعامل مع اللغات : الفرنسية والإنجليزية والألمانية والدنماركية وغيرها. والمعجم والمسارد معروضة على الشاشة وعلى المستعمل التعرف على الترجمات المعروضة.
Pangloss
من عمل جامعتي المكسيك وكاليفورنيا الجنوبية وهو موجه لمنصة عمل المترجم.
ArchTran
من نتائج تايوان.
Systran
سيستران هي اختزال للعبارة الإنجليزية الترجمة الآلية, نظام أمريكي من تصور بيتر توما, اعتمدته وطورته لجنة المجموعة الأوروبية في أواخر السبعينات لمصالحها الترجمية وصدرته للأسواق. ورغم ما يعاب عليه من حيث المستوى الجمالي واللساني هو أكثر البرامج في الوقت الراهن عمليا وظيفية التي تساير متطلبات الترجمة الآلية ويمكن ترجمة صالحة مباشرة دون تدقيق وإن كانت النصوص الخارجة غير صحيحة مائة في المائة على المستوى التركيبي والنحوي.
وقد خضع تطويره لعدة مراحل ولم يتم تصوره مباشرة كتطبيق لنظرية محددة وإنما تميز بتكون متنام مجزئ المراحل وهو ما يعيبه عن البرنامج أصحاب الموقف النظري .
ويتعامل سيستران في المجموعة الأوروبية مع أزيد من 14 زوج ـ لغة. بتفاوت في الإنتاجية بين الأزواج فأقدمها تعطي نتائج متميزة عن الأخرى.
وطورت الشركة صاحبة المشروع, كاشو, نظام مصلحة ترجمة مباشرة على الخط لعدة لغات.
وبلغت إنتاجية البرنامج لبعض الأزواج : 500000 ك/س أي 1000 ص/د وهو ما يقارب عشرين صفحة في الساعة.
وحاولت شركة كاشو في مراحل تطوير نظام عربي سنتطرق له في جانب البرامج الخاصة بالعربية. ولأن هذا برامج سيستران هي المعتمدة في المجموعة الأوروبية فسنعود إليها تفصيلا لاحقا.
Eurotra
اختزال لعبارة الترجمة وأوروبا. منتوج أوروبي خالص, بدأ التفكير فيه عام 1977 على المستوى الأكاديمي بعرض تشجيع البرامج الأوروبية, ودعمته المجموعة الأوروبية. وكان الهدف محاولة إيجاد مترجم آلي يتعامل مع كل اللغات الرسمية في المجموعة الأوروبية وهي كانت تقارب الثمانين زوجا آنئذ واليوم تفوق 300. وميزة البرنامج أنه بني انطلاقا من نظرية متميزة تعتمد على [تمثيل] تصوير وسطي ودلالي مجرد بين اللغة الأصل ولغة الهدف ونمط التحويل. عكس البرامج المطورة حول محور والتي تتطلب لغة ثالثة شديدة الهيكلة.
وفي برنامج أوروترا يتشكل التصوير من تراكيب اللغة الأصل مع معلومات معجمية عن الألفاظ و بنية النص مرفوقة أحيانا بتصوير لمعلومات دلالية. وتصوير اللغة الهدف هو منسوخ عن تصور لغة الأصل. ويتدخل التجريد في تصوير المرحلة الوسطية. ورغم أن نمط المحور هو أكثر اقتصادية إلا أن الاختيار وقع في هذا البرنامج على نمط التحويل وهو يتطلب لكل لغة ـ هدف كتابة ثلاث وحدات أنماط : نمط التحليل ونمط التحويل ونمط التوليد ـ عكس نمط , بل أنماط المحور التي تتطلب فقط كتابتين : التحليل والتوليد غير أنها عمليات صعبة تتطلب تعمقا كبيرا في النص الأصلي. وتوليدية معقدة وعلى العكس ففي نمط التحويل يكفي تطبيق قواعد التركيب النحوية.
وهناك أسباب أخرى تفسر هذا الاختيار راجعة لطبيعة اللغات المراد التعامل معها.
فأمام اللغات المتقاربة صنفا وتركيبيا كاللغات الأوروبية يستحسن استعمال نمط التحويل لتشابه المعجم وتقارب التركيب, أما إذا تعلق الأمر بمزج بين لغات متباينة الصنف كالإسبانية والصينية مثلا فيفضل نمط المحور لما يتطلب ذلك من تصور شديد التجرد مشترك بين اللغتين وكما قلنا فهذا البرنامج موجه أساسا لخدمة اللغات الأوروبية المتقاربة.
إحالة : الزوج اللغوي
للدقة يجب التمييز حين الحديث عن الأزواج اللغوية زوج ـ لغة يعني من لغة س إلى ص أما من ض إلى س فذلك زوج آخر والمابين لغتين تعني إذا زوجين.
وحين تسمع ببرنامج يتعامل : من س إلى ص
ومن س إلى ن
لا يعني أنه يتعامل من ص إلى ن
لأن هندسة اللغويات الحاسوبية تأخذ بعين الاعتبار تأثير النقل والانتقال للغوي فالقواعد المتحكمة في الانتقال من لغة إلى أخرى تخلف عن قواعد النقل المعاكس. ولذلك قد تجد برنامجا ذي إنتاجية عالية في الترجمة من لغة إلى أخرى وضعيف الانتاجية حين يتعلق الأمر بالترجمة المعاكسة لنفس اللغتين وقد تنعدم هذه الأخيرة في بعض البرامج أي تنجد مترجما آليا من لغة س إلى لغة ص حصرا وليس العكس.
إحالة : في الحدود بين الآلي والمساعد الآلي
أن هدف الترجمة الآلية هو الاغتناء عن العنصر البشري وبقدر ما قل تدخل هذا الأخير يعد البرنامج آليا وحين يتطلب تدخلا كبيرا يعد البرنامج مساعدا. وتتحدد الفروق أيضا إذا اعتبرنا نوعية وسعة المعجم وطريقة هندسة البرنامج ذاته. فإذا كان البرنامج يكتفي بترجمة كلمة إزاء كلمة فهو مساعد لا أكثر لأنه يفتقد آليات العمل المؤلل.
إحالة : المحورية أو التحويل
إن نمط المحور يتشكل من وحدتين نمطيتين : التحليل الذي ينتج عنة تصوير/ تمثيل للنص الأصلي في لغة جديدة مستقلة ونمط توليد يترجم هذه اللغة الجديدة إلى لغة الهدف, والعملية الوسطية تهتم بالمفاهيم المجردة والعلاقات بينها وليس بالتركيب الجملي وقد تحمل معلومات خالسانية. ففي نمط المحور يتجاوز التصوير حدود الجملة إلى النص حاملا معه معطيات خطابية وذلك يستحيل قي نمط التحويل الذي يتعامل مع كل جملة على حدا
ومنه يمكن أن نتخيل أن النمط المحوري أقرب إلى معنى النص وإن ابتعد عن هيكلة النص الأصلي. ومع يضل نمط التحويل أسهل لأنه في آخر المطاف يكتفي بالجانب اللساني من عملية الترجمة.
أن كل برامج الترجمة المؤللة تهدف في ما تهدف إلى مساعدة المترجم في :
الترجمة في للشركات الكبرى تتبعا لسوقها العابر للحدود من أجل محو هذه الحدود.
خدمة للتجسس الصناعي والتتبع التقاني, لتتبع واستباق ما قد يبدعه الخصم من جديد في حرب تنافسية.
من أسلحة الحرب باردة أو حامية.
هذه أبرز المشجعات على تطوير برامج الترجمة المؤللة وإن تم إدخال نتائج التطوير في مجالات أهلية وإلى استعمالات شخصية أو سلمية.
والملاحظ هو أن البلدان ذات التعدد اللغوي المؤسس هي التي تبنت وأنتجت أحسن البرامج.
سيستران حفريات تاريخية.
SYSTRAN
حفريات تاريخية
في الخمسينات وفي جو الحرب الباردة بدأت الولايات المتحدة تتخوف من التطور التقاني السوفياتي. وتخيل الأمريكان أنه لو تمت ترجمت خيرة الوثائق العلمية الروسية لتمكن خبراء الغرب من استباق تقدم الروس وتحديد قدراتهم.
وكان مصب همهم هو كل ما تعلق واقترب من القدرات والتقنيات العسكرية من وثائق بما فيها البحوث الروسية النووية والفضائية.
ولأن ترجمة بشرية لكم هائل من الوثائق و بالسرعة المطلوبة لم يكن ممكنا فقد انصب التفكير على آلية وآلة مترجمة.
وفي خضم الصراع على السبق الفضائي لم تعد ترجمة الوثائق الروسية قضية علمية فحسب بل مسألة مصير وبالتالي سياسية. ذلك أن الروس أطلقوا في الرابع من تشرين 1957 صاروخ سبوتنيك نحو الفضاء, ودار الملاح الروسي يوري جاجرين حول الكرة الأرضية في الثاني عشر من نيسان 1961. وبمجرد وصول الرئيس الأمريكي كيندي إلى البيت الأبيض طالب ببدل الجهد لمحو العار الذي لحق بالولايات المتحدة.
وتزامن ذلك مع تطور الحاسبات الآلية وتطور الإليكترونيات ودخولها ميدان الحسابات العلمية المتخصصة. و بدأ البعض يفكر في ربط معالجة اللغويات مع التحليل بالمقدرات الإليكترونية.
وفي 30حزيران1966 نزلت مركبة أمريكية على القمر و تم إطلاق أول قمر صناعي, أبولو 8 , أمريكي آهل حول القمر في 1968 , ووطأت قدم أمريكية سطح القمر في الواحد والعشرين من حزيران 1969.
وإن لم يكن لتأليل اللغويات والترجمة دور في ذلك فإن المرحلة صبغت بطابعها الدراسات في الميدان ومنحت للبحوث في الترجمة الآلية نفسا قويا. وخصصت الحكومة والشركات الكبرى مبالغ ضخمة للتجارب في الترجمة الآلية.
وكانت جامعة جورج تاون بواشنطن أولى الجامعات التي دخلت الميدان حيث بدأ طاقمها في اللسانيات قبل المهندسين بترميز المعارف اللسانية.
وأعطت تلك المجهودات : منظومات ترجمة روسية/إنجليزية مثل مارك1 ومارك 2 لـ إ.ب. م. التي وجهت للاستعمال في سلاح الجو الأمريكي وكذلك نظام جورج تاون الذي دخل الخدمة بمركز لجنة الطاقة الذرية ومركز الأبحاث الذري.
وكان للمهندس من أصل بلغاري بيتر توما دورا متميزا في مجال معالجة اللغة آليا, حيث اقتنع بضرورة التواصل من وإلى الروسية بحكم عمله كضابط اتصال خلال الحرب.
وبدأ بيتر توما في 1956 بتطوير فكرته وتطبيق معارفه عن اللغات في هندسة تقانة الحواسيب. هادفا ابتكار برنامج عملي للترجمة الآلية. عارضا عن اللسانيين فهو لم يتخيلهم أبدا بقادرين على حل المعضلة وحسب رأيه ـ وهي مدرسة في معالجة اللغات آليا ـ فإن على معالجة اللغات أن تنقاد للحاسوب وليس العكس.
وابتكر توما في معهد كاليفورنيا للتقنيات, في الستينات نظام أوتوتران autotran وبعدها تكنوتران technotran وأخيرا سيستران العامل على إ.ب.م. 360 في سنوات64- 1963 .
ولما ظهر أن البحوث في مجال تأليل اللغات لا يعطي النتائج المرتقبة أصدرت لجنة مراقبة تأليل اللغات في 1967 تقريرا منتقدا مطالبا بتقليص الاعتمادات المالية في الميدان ورغم أن التقرير لم يطالب بإلغائها فقد أثر التقليص على الكثير من برامج البحث.
إلا أن توما وكعادته فسر خلفيات التقرير بأنها راجعة لتقوقع أصحاب نظريات غير عملية وتطبيقية.
ونجح في نقل مشاريعه إلى شركة ألمانية والتي أخرجت في 1968 برنامجا عاملا على إ.ب.م. 3460-50.
بعدها مباشرة اعترفت مديرية التقانات الأجنبية في سلاح الجو الأمريكي بتميز منظومة سيستران على باقي الأنظمة واشترت أول نظام ترجمي منه في 1969 , . ومنذ ذلك الوقت ونظام سيستران يتطور بنجاح وفي 1973 دخل الخدمة في وكالة الفضاء الأمريكية في مشروع اتصالات سيوز-أبولو ومولت الوكالة برنامج ترجمة روسية إنجليزية. [ عد لما قلناه بخصوص الأزواج اللغوية].
وتوجه البحث في اتجاه الإنجليزية الفرنسية عام 1974 بتشجيع من مكتب الترجمات الرسمية بكندا وشركات فورد وجينرال موتورز.
و الجدير بالذكر أن البرامج الأولى المقتناة كانت بهدف التجسس العسكري.
حفريات منهجية
وصولا لهذه الفترة من تاريخ الترجمة الآلية نلاحظ:
أن كل البرامج كانت ثنائية اللغة ولم تظهر فكرة لغة محورية تدور حولها عدة لغات إلا لاحقا.
البرامج المعروضة هي برامج عملية وليست ذات تعمق نظري لساني موجهة لأهداف محصورة ومحددة فاعلة مما يغضب أصحاب التنظير الذين لا يرون في برامج سيستران إلا كشكولا ومن هذه الناحية يمكن اعتبار سيستران نقيضا على صعيد منهج العمل لأرورترا, مثلا , وغيره من البرامج التي تأخذ بعين الاعتبار مسألة تحديد مسبق لمواصفات اللغات بهدف الوصول لتحديد لغة محورية تكون قاعدة للترجمة. ومع هذه الانتقادات تبقى منظومة سيستران أكثر البرامج فعالية وإنتاجية في ميدان الترجمة الآلية.
حفريات
لم يكل بيتر توما من العمل وفتح الأسواق الجديدة, إذ أنه توجه للمنظومة الأوروبية عارضا عليها برامجه ومنهجيته. وتزامن ذلك مع دخول برنامج أورونيت euronet ميدان الخدمة في المديرية الثالثة عشرة في المنظومة الأوروبية ...... وهو برنامج يهدف إلى توحيد وسيلة استجواب قواعد المعلومات الوثائقية في عموم أوروبا ولذلك طورت المخازن متعددة اللغات. ولرفع المردودية فقد توجه التفكير إلى الترجمة الآلية.
واعتمدت المديرية برنامجي سيستران وتيتوس في 1976.
فالأول هو البرنامج الوحيد الذي يتعامل مع النصوص كاملة للترجمة من الإنجليزية إلى الفرنسية ويتوافق مع تجهيزات المديرية الحاسوبية. وقد يمكن من ترجمة كاملة لقاعدة معلومات وثائقية تهم المنظومة عامة, من الإنجليزية إلى الفرنسية وربما من الفرنسية إلى الإنجليزية لاحقا.
وتيتوس برنامج ذي تراكيب مختزلة عامل بين الإنجليزية والفرنسية والألمانية والإسبانية [عد للتعريفات] وخممت المديرية في توسيع تركيبه ولأسباب زمنية تخلت عن هذا البرنامج ليبقي سيستران البرنامج الوحيد المطلوب تطويره . وهكذا انطلقت مرحلة إعداد معاجم لترجمة ملخصات قاعدة علم التغذية والتقانة وهي قاعدة مرتبطة بأورونيت, و حقق البرنامج تطورا في ترجمة زوج اللغة إنجليزية/ فرنسية وبدأ تطوير أزواج أخرى.
ومع ذلك فلم يصبح برنامج سيستران عام التوظيف في المجموعة الأوروبية إلا في بداية الثمانينات.
يستعمل حاليا نظام سيستران في لجنة المجموعة الأوروبية وسلاح الجو الأمريكي وكبريات الشركات الدولية وغيرها من المواقع.
وحيث أن كل مجال وكل موقع له حاجته المختصة من المعجم فذلك يعني أن معاجم المنظومة الترجمية في تطور لأن كل مجال يتطلب تطوير معجم خاص, وأن آليات الوصول إليها يجب أن تتحسن لتدخل برامج المنظومة حيز الحواسيب الشخصية ومنصات العمل الترجمي الشخصية مع ما يعني ذلك من سعة الانتشار والاستعمال.
أما في ما يتعلق بالمنصات الكبرى ذات المراكز الحاسوبية الضخمة, فلا منافس لسيستران إطلاقا من حيث : سهولة الوصول إلى الهدف و إمكانية التجديد والتحيين والشمولية وهي ميزات مهمة لكل برنامج حاسوبي ويعزى هذا السبق لأقدمية تجربة المنظومة
المنهجية
أولى القائمون على مشروع سيستران منذ البداية أهمية لتعدد استعمالات المنظومة وتوافقها مع مختلف الحالات ولم يحصروا اهتمامهم في مجال عملي ضيق. وكان الهدف منذ البداية حسب بيتر توما اختزال عملية التأليل الترجمي إلى ما يمكنه منطق الرياضيات والمعلوميات من سبل.
ولم يضيق القائمون على المشروع على أنفسهم بقواعد نحوية محددة قاهرة. وحسب البعض من معارضي المشروع فإنه يستحيل الحصول على نتائج صحيحة في برنامج يعدم مثل تلك القواعد النحوية.
ثم أن توسيع المجال يمكن من الاستعمال في كل الحالات لنفس البرنامج الترجمي : محاضر اجتماعات ووثائق تقنية والبيانات التقنية... وطبعا ذلك يعني وقتا زائدا لاختيار الترجمة الموافقة لكل حالة على حدا من بين العديد من الترجمات المطروحة.
وبتلخيص شديد فإن منهجية المنظومة جمعت بين السطحية والعملية والفعالية. أليست العبرة بالنتيجة لا في ما يسبقها من كلام وتنظير؟.
والفرق بين المنهجيتين, ولنا عودة بتوسيع أكثر لهذه النقطة, يتلخص في موقف ينطلق من العملي وشروط ومتطلبات التقانة والمنطق الرياضي و منطلق يولي أسبقية لتصور نظري لساني شامل قبل الجانب التقاني وهذا لا يعني انعدام أرضية منطقية في هذا التصور كما سنرى فيما بعد.
والقضية, بتعبير أوضح مع شيء من الغلو, هي من يقهر أو ينصهر للآخر الإلكترونيات أم اللغويات؟
مكونات النظام
النظام الأساسي يتحكم ويدعم المكونات الأخرى. وكتب بلغات المجمع 360 و لغة س. تفوق قواعده المائة ألف غامضة. ويحوي بعض البرامج موحدة لكل الأزواج تجمع في:
برامج توسيط وتناول للنصوص
برامج تسيير وتحيين المعاجم
برامج خلق وصول إلى معاجم الترجمة
برامج مراقبة الترجمة والتأكد من المعجم
مكونات مختلفة
برامج الاستعمال الروتينية.
ووحدات الوصول إلى المعجم هي مكونات أساسية للبرنامج ولا تحتاج لنظام قاعدة معلومات مستقلة تستند إليها.
وهذا يعني أن المنظومة يمكن تثبيتها مباشرة على الحاسوب وخاصة إذا توافق مع منظمة ما بعد إ.ب.م. 360 وما بعدها, بدون حاجة إلى برامج توسيطية أخرى. ويصعب نقله إلى منصة عمل عاملة تحت مستغل يونكس أو دوس.
وأظهر النظام الأساسي صلابة ومسايرة ولم يحتاج طوال فترة استغلاله إلى تحسينات مهمة مسجلا قلة العطب مما يسند منهجه و مقولة حاجة الترجمة الآلية إلى الرضوح لمتطلبات المعلوميات الضيقة .
البرامج اللسانية,
ورغم أن البرامج اللسانية, أي جانب تحليل اللغة, في المنظومة كتبت بنفس اللغات البرمجية كبقية النظام, إلا أنها أكثر سهولة وتلائما من السابقة, وحيث أنها في أغلبها كتبت خصيصا لسيستران فإن لها ميزات تفوق بها لغات البرمجة العامة بتضمنها لأوامر برمجية موجهة خصيصا للترجمة مثل :
Cw= كلمة مستعملة , SKCAT = لصنف الدلالات وغيرها مما يجعل النظام في متناول المستعملين غير البرمجيين ويتطلب تشغيله دراية دنيا بأدغال البرمجيات.
ويتم الرجوع إلى البرامج اللسانية تراتبيا وتحلل لغة المنبع باستقلالية عن لغة الهدف بخطوات منها :
حل مشكل المتشابه النحوي, تحليل حدود الملفوظ, أعداد مختلف مستويات الترابط التركيبي.
واختزل برنامج التحويل إلى المعجمية الروتينية وتحل في هذا المستوى إشكاليات ثنائية اللغة والتراكيب والبنيات المعقدة. وعلى مستوى لغة الهدف تحل مسائل الصرف والتركيب وترتيب الكلمات.
وعكس ما قد نتخيل فإن هذه المسيرة معقدة.
المعاجم
سنعود لمسألة المعاجم في توسع خاص بالمعجمية الحاسوبية. ونحتفظ هنا بتقدم بعض خاصيات معاجم منظومة سيستران تقريبا للمعنى.
ميزة معاجم سيستران
السعة أي كير المعجم,
الوظيفية والعملية فلا يكفي أن يكون العجم واسعا كبيرا لكي يكون صالحا وسهلا ومفيدا في الاستعمال.
الشمولية ويقصد بها شمولية المجال المراد .
ومعاجم سيستران ذات مداخل إما على شكل كلمة وحيدة أو كلمات متعدد حين تتعدد الدلالات أو تتنوع السياقات .
وتحوي معاجم لغة المنبع معلومات صرفية ونحوية وتركيبية ودلالية وقسم الكلمة إذا كانت مشكلة.
والمداخل المتعددة تشمل تعابير لمختلف الأصناف وتقعيدا للسياق تتعلق بالترابط وخصائص كلمة أو كل كلمات العبارة.
وفي لغة الهدف فالمعنى المعطى لكل حالة يبدأ من المقابل العام لكلمة إلى الترجمات الخاصة الإلزامية لعبارة في سياق سابق التحديد أخذا بعين الاعتبار الملفوظ والظرف والمجال. وبتحديد المجال والسياق يمكن أن نمنح إلزاما, كصنف خاص, للتعبرة والكلمة مقابلا محددا يعوض المعنى العام والمقابل العام في كل المعجم إذا حددنا المجال في أوامر و طلبات الترجمة.
إحالة
قد يتساءل البعض عن جدوى النعوت التي تتابع في كتابتي حول المنظومة.
تلك الكلمات وما يتبعها من نعوت هي من صلب المصطلح وضرورة للدقة.
وفي حديثي عن الترجمة المؤللة تعترضني دائما مشكلة المقابل العربي. وقد اخترت كعادتي وكموقف شمولية التعريب فاستعملت ما هو معروف ومشهور, طبعا نعدم معجما موحدا, وابتكرت في الكثير من الحالات بما يساير المضمون والمجال.
وعلى سبيل التنكيت حضرت عرضا في اللسانيات قدمه أستاذ كبير من القاهرة فإذا هو يسمعنا كلمات البراجمتيك, والسيمانتك, والهيد ينطقها بفخامة وفي اللقاء الجانبي اكتشفت أن صاحبنا لم يؤتى من العلم شيئا في المجال وأن علمه بالــ hpsg و tag لا يزيد عن نطقه بها أعجمية ثقيلة. فكان بحق نعم الأستاذ الدكتور المفرخ.
ولمن يجد صعوبة في التتبع لا يزعج طرحه سؤالا, وقد يجد الجواب طي التعريفات العديدة التي أقدمها.
إحالة
كلمة الغموض بل مصطلح الغموض وقد وردت هنا كثيرا.
من هو المترجم الذي لم يتصارع مع الغموض في ترجماته.
وأصعب ما تتعرض له الترجمة الآلية والمؤللة قضية الغموض. وهو أنواع عديدة.
فهناك غموض المشترك اللفظي والأضداد كما يقول النحاة العرب وهي مسألة تحل بالمعاجم وبالمكانز السياقية.
وهناك غموض كتابي, أو المشترك الكتابي في اللغات الغربية.
والغموض الشكلي في الكتابة العربية الخالية من الحركات. فحين نكتب مثلا دخل الدولة السنة الماضية لا نعرف إلا بالسياق ما المقصود هل فعل الدخول أم المصدر.
وقد نعطي مثلا آخر: ضرب مصطفى موسى ولو لم تكن هناك قاعدة أسبقية الفاعل على المفعول في هذا النوع من الجمل لتعذر علينا معرفة من الضارب والمضروب. وطبعا فالترتيب يحل الكثير من الغموض والترتيب غير عام في اللغة العربية كما نعرف وحتى في اللغات الهندية الأوروبية ذات الترتيب المحدد تجد مع ذلك جملا غامضة.
وحيث أن نحاة العرب تكثر من فعل الضرب في أمثلتها لو كتبت سيرا على خطاهم: ضرب النساء واجب أو مذلة, لفهم أغلب قراء الجملة أنني أقصد ما ورد في القرآن الكريم في شأن بعض الزيجات. ولو قلت لهم أن فاعل الضرب هو النسوة لوجدتَ القراء بعد تردد قد ولجت باب الحديث عن طغيان النسوة في هذا الزمن الرديء. هذا الصنف من الجمل يعد غامضا. ولا يفهم إلا بالسياق أو بالذاكرة الثقافية والاجتماعية للفرد. وهي ذاكرة غربالة ومتغيرة وآنية مضطربة يتحكم فيها الظرف والمحيط.
وتختلف عن ذلك ذاكرة الحاسوب فهي مرتبة ممنهجة خارج المجتمع تتعامل بسيل من الأوامر المحددة وليست قط قضية بلادة الآلة أو تفوق البشر.
المسألة بطريقة أخرى كيف نكتب ونصيغ أوامر برمجية منطقية حاسوبية تحت محدد الرياضيات الحازم ليفهم الحاسوب المقصود. وهذا هو صلب مجال التأليل.
ويفسر ذلك في كثير من الحالات كيف تجيب برامج الترجمة المؤللة بطريقة غريبة على مسائل نعتبرها كبشر سهلة يسيرة.
قال الجاحظ : البياض كتابة
فتحت الحوسبة اللغوية أبوابا في النحو لم تكن معروفة.
وكان لمنطق الحوسبة الصارم دورا في إبراز ظواهر لغوية على الأقل في اللغات الغربية لم تكن في حساب النحو التقليدي. وظهر أن جداول وتصنيفات النحاة لا تشمل كل جوانب اللغة والكلام.
النحو التقليدي وصفي في هدفه يصف الكلمة ودورها ومكانتها في الجمل ويمنحها سمات العدد والجنس ومحلها من الأعراب والزمن وترتيب الفعل والفاعل والمفعول. هذا إذا كانت الكلمة واضحة لا تطرح مشكلة غموض وضبابية. وقد يزيد النحاة تفصيلأ وتحديدا لوصف اللغة, فنحن نقول مثلا في العربية [مع مصدر الأكل] أكل الخبز بجر ونصب الخبز معا ونقول مرة أنه مفعول وقام المصدر مقام الفعل ومرة مضافا على اعتبار أن المصدر فقد فعليته وأصبح اسما [وهي ظاهرة واسعة الانتشار في اللغات الأوروبية وتفرد لها أبواب في نحوها], ولك في كتب النحاة العرب من هذه الأعاجيب والحالات ما يخفف عنك وقع الشمس في الظهيرة يكفيك أن تفتح باب المنادى لتسافر عبر حالات واستثناءات طويلة ساعات وأيام طوال.
وهذا الجانب الوصفي لا يكفي في حوسبة اللغة.
تعد ما نسميه بمسألة التنازع النحوي والمشترك من أعقد القضايا في معالجة اللغات آليا.
وتعتبر اللغة الإنجليزية من أكثر اللغات إشكالا من هذه الناحية عكس ما قد نتخيل سلفا وأظهرت بعض المعطيات أن ما يقارب الخمسين بالمائة من كلمات جملها النمطية مشكلة متنازعة.
وتحل المعضلة بالرجوع إلى السياق وتحديد السياق ليس من السهولة كما قد نتخيل ويتطلب ذلك برمجة ضخمة وثقيلة. وهناك طريقتان لحل ولتحديد السياق : إما خطية أي أننا نقلص غموض الكلمة بمعلومات مستمدة من سابقها في الجملة ونستعمل الحاصل لمحو غموض ما يتبعها وهكذا دواليك إلى نهاية الجملة والطريقة الثانية انتقائية : نهتم بالسهل أولا ثم نرجع لما هو أعقد. وكل ذلك يتم بتطبيق نظرية تقاطع المجموعات أو نظرية المحتمل المشروط.
ولتقريب المعنى نورد بعض الأمثلة والقضية تحتاج إلى أكثر من أسطر.
نقول : جاء المطر وحين يقرأ برنامجي هذه السلسلة يبدأ بالكلمة الأولى وانطلاقا من معجمه يحدد أنها فعل غير متعد لا تنازع فيه ومن حلوله الممكنة أنه قد يعتبرها جملة قائمة من فعل وفاعل محذوف وينتظر أن يكون تابعها إما جملة جديدة أو حشوا أو فاعلا أو صفة , علما أن معجمه يأخذ بعين الاعتبار كون المطر اسما لأنه معرف. وقد تعرف البرنامج على الفعل بسهولة لأن الفعل هنا ينتمي إلى مجموعة محددة العناصر لا تسمح بالتنازع فيها. كما لا يتنازع اثنان في تحديد تالي حرف جر أ اسم أم فعل هو.
وقد يجد البرنامج عقدة في تحديد : أكل الرجل الأسد, فسلسلة أكل قد تكون فعلا معلوما أو مجهولا أ أو مصدرا أو اسما والأسد فاعل أو مفعول أو بدل.... ومكره أخوك لا بطل وجائني أسدا ودخل القاضي امرأة وغيرها من عجائب الدنيا السبع في لغتنا الجملية مما يسعد أخانا الكريم الأستاذ الليثي في منتداه سهرا ومتعة ويسهر من جراها أهل البرجمة في شركة سيستران ليالي غم و سهاد.
وما يلي نوع آخر من معضلات الترجمة الآلية:
خذ : في نص ما السلسلة 2.5 هل هي عدد كسري أم رقم ترتيبي أم شيء آخر؟ المشكلة في النقطة.
وفي بعض النصوص نكتب بدل الأرقام الهندية أو المغربية حروفا وهكذا نجد: اب و دن وغيرها من عجائب الكائنات وطبعا حاسوبي البليد لا يميز بين دن الخمر وقرابة الأبوة و بين الرقم المكتوب بحروف أبجدية.
ولنعقد المسألة بعض الشيء فنحن نكتب : واحد من عشرين وواحد في المائة وخمسة على عشرة وصفر على الهامش أو اليدين.... ولا نلاحظ أنها جمل تتطلب توقفا. فما أتعس هذه الآلة التي لا تفقه ما يفقه صغار التلاميذ !!! من يقول هذا لم يرى أن هذه المتواليات الرمزية غامضة وتحاج لتوضيح وبرنامج روتيني ليفهم حاسوبي المترجم متى يتعلق الأمر بنقطة الفصل والنهاية ورقم كسري وترتيب فصول ومتى يكون دني رقما أو وعاءا و... متى يكون الواحد صفة للخالق الجبار أو رقما ... وهذه محددات لا تجدها في النحو الوصفي التقليدي.
وبدأت كلامي بذكر الجاحظ وبياضه
النص وأي نص هو توال سلاسل رمزية من بداية المقال مثلا إلى آخره. ولكن النص يحوي سلاسل خاصة كالعنوان وعناوين الفقرات ونصوص مدخلية وهو إخراج منسق ومشكل ومزع ومهيكل فيه فراغات ورجوع إلى السطر.... كل هذه المشكلات يجب أن تكون مضبوطة قابلة للبرمجة.
التنقيط :
دخلت علامات التنقيط إلى بلاد العرب في ما دخل من المورد ولازال هناك من يعتبرها بدعة حرام. ومن شاء أن يسهر ليال في إعداد أطروحة للدكتورة أوجهه لدراسة استعمالات علامات التنقيط في اللغة العربية الحالية وأظنه أنه سينتحر قبل انتهاء بحثه. ولنفتح أي منشور عربي سنجد أن الفواصل والنقط ونقط الفاصلة تسير بما سارت به ركبان الإبل العمياء. وليسوا الوحيدين وأنا أسأل ــ دفاعا عن عروبتنا ــ العارفين باللغات الغربية ما هي القواعد المحددة المضبوطة في استعمال علامات التنقيط؟ طبعا ليس المطلوب جواب مستمد من كتب المبتدئين !!!
يقال أن الجملة تنتهي بنقطة ولكننا نقول أيضا على ذمة نحاتنا الكبار أنها تنتهي بتمام معناها ومتى ينتهي المعنى يا سادة النحو ؟ بنهاية النص, طبعا, هذا إذا كان للنص معنى.
والحلول البرمجية التي قدمت لهذه المسألة في سيستران حلول استمدت من التجارب العملية ومن سياقات النصوص ونوعيتها.
وللحديث بقية في انتظار ذلك هل فكرتم لماذا نكتب في العربية : وجاء ثم جاء مرة بإلحاق حرف العطف ومرة بفصله وأنا متأكد أن صاحبنا, وأنتم تعرفون من أقصد ابن مدينة الضباب, سيثقلني بإحالات من كتب النحو والإملاء لتعليل ذلك ولن يفهم حاسوبي الساذج شيئا من ذلك لأنني سبقت ودربته على معرفة الفراغ فإذا الفراغ هنا يتحول شيئا آخر, فكيف تريدونه أن يتصاحب معه, أقول ذلك وأنا أعلم بوسائلي الخاصة أنه لا يفارق حاسوبه ليل نهار وقد هددته زوجته بالخلع على ذلك. معذرة ودمتم بخير.
إحالة
المصطلح والاصطلاح دائما
يستعمل في الكثير من النشريات العربية مصطلح البرنامج الداعم للعربية في الحديث عن برامج الترجمة المؤللة. وللتذكير فقد بدأنا في استعمال هذه التعبرة وقت الحديث عن البرامج الحاسوبية التي تمكن من الكتابة بالحرف العربي. وهي ترجمة حرفية للتعبرة اللاتينية. فيقال مثلا برنامج ويندوز داعم للعربية. وهذا ليس بمزعج . ويختلف الوضع حين الحديث عن الترجمة.
مفهوميا ماذا يعني الدعم في حالة الترجمة؟ وقد نفترض أن الأمر يتعلق ببرامج تساعد في الترجمة إلى العربية. ومن خلال تقص بسيط نفهم أن المقصود بالدعم هو المساعدة والترجمة الآلية في نفس الوقت. ولا أفهم لماذا لا نتحدث عن برنامج مساعد وبرنامج مترجم. زد لذلك أن أغلب البرامج المقصودة أبعد ما تكون عن برامج مساعدة هي أقرب ما تكون برامج شبه مساعدة !!!
فلا يكفي أن يكون البرنامج متضمنا لمعجم بسيط وبعض القواعد ليفي بالغرض. وأعلب تلك البرامج المعروضة بخصوص العربية لا تملك من الزاد ما يكفي للحديث عن برنامج آلي للترجمة فهي لا تتضمن في غالبها قواعد قياس ومعاجمها ليست بقواعد معطيات علاقية مثلا.
إحالة
قضية المعجم
ولنا عودة إليها بشكل مطول لا حقا.
المعجم الحاسوبي المؤلل معجم من نوع خاص, جمعت مواده بطريقة أنظمة قواعد المعطيات العلاقية وهي تختلف عن أبناك المعلومات في نسقها وهندستها. وتحوي الكثير من المعلومات التي لا توجد في معجم ورقي عادي. وإن معجما شاملا وناجعا كفيل برفع نتائج برنامج ترجمة. وللأسف فأغلب ما يستعمل في المجال العربي لا يف بأقل شروط هذه المعاجم.
قد أسجل لسان العرب بكامله في البرنامج دون أن أحصل على برنامج معجمي عملي. والدراسات العربية في المجال قليلة أو عديمة الجدية.
أزواج اللغة
كيف اختيرت أزواج اللغة في منظومة سيستران؟ وما هي الصعوبات التي تعرضت كل تأليف وزوج؟ وما هي التعقيدات التي قد تتعرض سيستران عند زيادة زوج جديد؟
قلنا بداية أن سيستران تعامل مع الروسية إلى الإنجليزية وبدخوله الخدمة داخل المنظومة الأوروبية توجب توسيع أزواج اللغات العاملة. ومن البداية ظهر أن أزواج الإنجليزية ــ الفرنسية أزواج أساسية. فأول برنامج قدمته سيستران للجنة الأوروبية, للإنجليزية/ الفرنسية, كان برنامجا لم يتم فحسب تجريبه بل وسع للعديد من المجالات والنصوص. وزوج اللغة الفرنسية الإنجليزية تحول بسرعة إلى برنامج عملي تام بعد أن كان قد برمج أولا للبرهنة على فعالية منهجية سيستران.
انطلاقا من قواعد وثائقية متواجدة مختلفة في سياقاتها ومعطياتها عن ما هو متداول في اللجنة تم تكوين معاجم.
وتم إدخال الزوج إنجليزية/ إيطالية للبرهنة على إمكانية دمج لغة هدف جديدة أخرى في نظام سيستران ونظرا لعدد الناطقين بالإيطالية في المجموعة الأوروبية, وحيث أن اللغة الإيطالية شبيه باللغة الفرنسية كلغات لاتينية فقد تمت عملية الدمج بيسر مع الاحتفاظ بمعجم لغة المنبع للاثنين. ولم يتم اختيار الألمانية حينذاك لأن اللجنة تخليت أن برامج أوروترا سوف تحل هذه المسألة ولما ظهر أن برامج أوروترا لن تكون عملية في القريب, طلب من شركة سيستران تطوير برنامجها الإنجليزي الفرنسي وطلب من شركة توما تطوير برنامج فرنسي ألماني.
طرحت اللغة الألمانية الكثير من المعضلات نظرا لاختلافها من حيث ترتيب الكلمات في الجمل ونحوها وقواعد تركيبها, ولم تكن النتائج في مستوى الأزواج السابقة حتى بعد سنوات من العمل والتطوير.
وطلبت اللجنة الأوروبية تطوير الأزواج : الفرنسية الهولندية والإنجليزية الهولندية. علما أن سيستران لم تكن سبق لها وأن تعاملت بأي شكل مع هذه اللغة.. وقد أعطت العملية نتائج أحسن من نتائج جانب الألمانية.
كل هذا التوسع جرى وسط تجاهل شبه مطلق من المترجين داخل اللجنة لقضية الترجمة الآلية ــ ويلاحظ قلة المترجمين الذين شاركوا في عملية التطوير ــ وهو موقف لازال قائما لحد الساعة بين المترجمين الذين لا يرون في المترجم الآلي إلا مضيعة وقت أو منافسا خطيرا على لقمة عيشهم وربما فسر التجاهل وعدم التحمس لما هو آلي بكون الكثير في عالم الترجمة هم ممن يتخيلون الترجمة فنا ووحيا لا مجال فيه للبرمجة الآلية وقد برهنت السنوات التالية على جهلهم و غلطهم كما سنرى فيما بعد.
بتوسع حدود السوق الأوروبية إلى دول أخرى فقد تم دمج أزواج إنجليزية/أسبانية وإنجليزية /برتغالية لاستعمالات محصورة. ومن ترجمة بعض المتعاملين مع برامج سيستران داخل اللجنة الأوروبية وسعادتهم بنتائج الترجمة بين لغات مختلفة فقد شجعوا العمل على دمج أزواج لغات متقاربة كالفرنسية والإيطالية. وبالفعل فلم يتطلب هذا البرنامج وقتا طويلا ليصبح فعالا وتجاوز في نتائجه باقي أزواج اللغات وأعطى البرنامج في مجالات ولبعض النصوص نتائج تقارب نتائج الترجمة البشرية.
وتم دمج زوج إنجليزية / يونانية لا حقا.
ومن جانب اللغة الأسبانية فقد تم الاستفادة من برنامج الإسبانية/ الإنجليزية, ــ الذي كان قيد التجريب في سلاح الجو الأمريكي كما قلت عاليه ــ, وتوجه التفكير نحو تطوير أزواج الفرنسية/ الإسبانية مع الاستفادة من تجربة الإيطالية.
وبهذا نكون قد وصلنا في متابعتنا لاستعمال برنامج سيستران في اللجنة الأوروبية تاريخيا إلى 1990. وبذلك تنتهي الحفريات وندخل مرحلة مختلفة من تاريخ سيستران نفصل لها حيزا خاصا.
وأول ما يمكن أن نقول عن هذه الفترة السابقة أنها قصيرة 20 سنة !!! وما أشبه الليلة بالبارحة. أقول ذلك ثلاثا لأن الكثيرين من التراجمة أو أنصافهم يتجاهلون هذه الحقيقة البسيطة, وأن عجلة التاريخ تسير, كره من كره. وان ما حققه التأليل في هذه الفترة الزمنية القصيرة خيالي. زد لذلك أن عدد المبرمجين والعاملين في كل زوج لغة قليل وتحسب الفترات الزمنية ب سنة/شخص العمل على أصابع اليد الواحدة.
وأتذكر في بداية دراستي كيف كنا نتمنى وجود برنامج داعم للكتابة العربية, وكانت أول البرامج المعروضة علينا تعد ثورة وكانت لا تمكن إلا من القليل وأتذكر كيف كان يجيبني أحد الأساتذة كلما رأى ما أنقره : ’’لا تضيع وقتك في اللعب على ذلك التلفاز !!‘‘
أستاذي الكبير كان يعتبر كل ما خرج عن التقليد بدعة وأن ’’التلفاز‘‘ ما وجد إلا لفرجة الأشرار وأخال أنه لازال حاله.
أخي الفاضل العبيدي, جارنا سكنا ومجاورنا هما,
أشكرك على مداخلتك الوجيهة, ويتجلى من خلالها أنك ملم بخفايا المسألة. وكما تعلم فمن الناحية المنهجية فكل قضية وكل مسألة عندما تطرح بجلاء وتحدد في مراميها وتحصر أسسها تعتبر شبه محلولة أي أنه من الممكن وجود جواب لها. وبالعكس فإذا خلطنا المنطلقات والمنهجيات كما يفعل بعض أصحابنا جهلا وتطاولا على ميدان معطاء آنذاك لن تحصل على حريرة ولا هريسة بل خليطا غريبا.
وعاليه طرحت قضية البرنامج الداعم للعربية في الترجمة !!! وكما لا يخفى عليك فشعر رأسي ينتصب غضبا وغيرة حين أسمع كلاما عير مضبوط وتغذوا المسألة ليس وجود برنامج داعم للعربية بل شخص داعم للعربية.
ومرحبا بك على حريرة حقيقية ولحم بهريسة.
ودمت عزا
أخي الفاضل العبيدي, جارنا سكنا ومجاورنا هما,
أشكرك على مداخلتك الوجيهة, ويتجلى من خلالها أنك ملم بخفايا المسألة. وكما تعلم فمن الناحية المنهجية فكل قضية وكل مسألة عندما تطرح بجلاء وتحدد في مراميها وتحصر أسسها تعتبر شبه محلولة أي أنه من الممكن وجود جواب لها. وبالعكس فإذا خلطنا المنطلقات والمنهجيات كما يفعل بعض أصحابنا جهلا وتطاولا على ميدان معطاء آنذاك لن تحصل على حريرة ولا هريسة بل خليطا غريبا.
وعاليه طرحت قضية البرنامج الداعم للعربية في الترجمة !!! وكما لا يخفى عليك فشعر رأسي ينتصب غضبا وغيرة حين أسمع كلاما عير مضبوط وتغذوا المسألة ليس وجود برنامج داعم للعربية بل شخص داعم للعربية.
ومرحبا بك على حريرة حقيقية ولحم بهريسة.
ودمت عزا
حصيلة النتائج
إن كل برنامج لا يمكنه أن يتجاوز نقاط ضعفه إذا لم يقيم ويقوم.
فتقييم النجاحات إذا كان موضوعيا يقدم حلولا توجيهية وسوقية. ونظام سيستران لم يخرج عن القاعدة واستفاد من انتقادات ورد فعل المترجمين في تحسيناته وإصداراته التالية. وقد انصب التقييم في البداية على دراسة عدد الأخطاء وصنفها وفعالية الإخراج ووضوح النص الحاصل قراءة ومعنى.
ومن خلال هذا التقييم يتم وضع خطط سوقية إما لتحسين البرنامج داخليا [فترة ما بين 75-] و إما لتوسيع استعمالاته إلى مجالات أخرى . ونظرا لانتقادات بعض المترجمين لجدية التقييم من حيث شروطها ولتمكين غير المختصين في البرمجة من متابعة التقويم فقد طور برنامج خاص أقليديس يمكن من ترجمة لغة البرمجة الخاصة بسيستران إلى اللغة الطبيعية ليتمكن المنتقدون من غير المختصين بفهم هيكلة أوامر النظام مما خفف من حدة النقد وبرهن على تعقيد أوامر البرنامج .
و نتائج المتابعة الإحصائية في كارلسلو لــوضوح الفهم و أخطاء النقر وأخطاء الكلمات والمصطلحات والأخطاء النحوية و التركيب .... أوضحت أن نسبة الغلط في الترجمة الخامة انحصرت من ثلاثمائة إلى40 غلطا تقريبا بينما ارتفعت نسبة وضوح الفهم لتقارب نتائج الانتخابات العربية مما أدى في بعض المواقع إلى اعتماد الترجمة الخامة دون التدقيق النهائي.
موقف المترجمين من النظام
رغم أن لجنة الترجمة في المنظومة الأوروبية طلبت من مترجمين مهنيين تقييم البرنامج وتحديد مجالات استعمالاته الفعالة ورغم أن النتائج كانت مقبولة في الكثير من المجالات إلا أن غالبية المترجمين بقيت على هواها ونتيجة هذا التقييم قرر استعمال سيستران لترجمة دقائق اجتماعات رؤساء المديريات..
وقد طالب تقرير في 1990 بضرورة صياغة سيستران بلغة برمجة متطورة واستعمال قاعدة معلومات علاقية لتسيير المعجم وتقريبه من المستعمل.
أفتح قوسا جديدا إجابة على تدخل فخر الخضراء أعلاه,
مرة أخرى أؤكد على انعدام برنامج مترجم كامل الفعالية وناجح لعدة أسباب. وأننا حين نتحدث عن الترجمة الآلية يجب أن نضيف الحيز والمجال والنوعية فبدون هذا التحديد فإننا سنخبط خبط عشواء. الترجمة الآلية تضاهي الترجمة البشرية بل تتجاوزها حينما يتعلق الأمر بترجمة تقنية محددة المجال محصورة معجما وتركيبا. ويختلف الأمر حين يتعلق بنصوص حرة أو شبه حرة.
أقول ذلك لأن الكثيرين من المترجمين لهم مشكلة ليس فحسب مع الحاسوب والترجمة الآلية بل مع اللغويات بحد ذاتها. وأنا أطرح عليك أخي عبيدي سؤالا استفزازيا إذا سمحت وأنا متأكد أن ذلك لن يزعجك بل على العكس :
كم عدد المترجمين الذين تعرفهم, يقرؤون النص وأي نص بنظرة علمية لسانية؟
وأتحدى أي واحد ممن يكتبون حول لغة الصحافة أن يقدم لي هيكلة متكاملة لهذه اللغة؟ لا أريد أن يكرر لي ما يقرأه التلاميذ في المدارس الابتدائية بهذا الخصوص.
حين نقرأ جريدة عربية وأي جريدة فإننا نواجه عدة مستويات لغوية, وطبعا القارئ المتوسط أو العالي قد يمر من نص جاهلي إلى خبر رياضي دون أن يفطن أنه يتعامل مع تراكيب متنوعة وقد يقول البعض بلغات متنوعة.
المترجم البشري نفسه قد يجد صعوبة في ترجمة نصوص لم يتعود عليها فكيف نطلب من آلة قريبة الحدث أن تترجم ما لا تفهمه ويعجز الإنسان ذاته عن فهمه. ولكي تفهم الآلة يجب أن نقدم لها أوامر صريحة وواضحة ومضبوطة. وإلا فإننا نكرر قصة البدوي الذي لم يفهم كيف أن مذياعه خبره بأخبار بعيدة ولم يخبره بموت بقرته في جواره.
أتوقف هنا لكي لا أرجم.
تعليق