الترجمة الآلية عبر لغة وسيطة

تعد الترجمة الآلية عبر لغة وسيطة Interlingual machine translation إحدى الطرق الكلاسيكية لـ الترجمة الآلية. في هذا النهج، يتم تحويل اللغة المصدر، أي النص المراد ترجمته إلى لغة وسيطة، أي تمثيل تجريدي مستقل عن اللغة. ثم يتم إنشاء اللغة الهدف من اللغة الوسيطة. ضمن نموذج الترجمة الآلية القائم على القواعد، يعد النهج بين اللغات بديلاً عن النهج المباشر و نهج التحويل.

الشكل 1. شرح للغات المستخدمة في عملية الترجمة باستخدام لغة بردج.

في النهج المباشر، يتم ترجمة الكلمات مباشرة دون المرور عبر تمثيل إضافي. في نهج التحويل، يتم تحويل اللغة المصدر إلى تمثيل تجريدي أقل ارتباطاً باللغة. تقوم القواعد اللغوية الخاصة بزوج اللغة بتحويل تمثيل اللغة المصدر إلى تمثيل لغة هدف مجردة ومن هذا يتم إنشاء الجملة الهدف.

لنهج اللغة الوسيطة للترجمة الآلية مزايا وعيوب. تتمثل المزايا في أنها تتطلب مكونات أقل لربط كل لغة مصدر بكل لغة مستهدفة، وتتطلب مكونات أقل لإضافة لغة جديدة، وتدعم إعادة صياغة المدخلات في اللغة الأصلية، وتسمح لكل من المحللين والمولدين بأن تُكتب من قبل مطورو نظام أحادي اللغة، ويتعامل مع لغات مختلفة تماماً عن بعضها البعض (مثل الإنگليزية والعربية^[1]).العيب الواضح هو أن تعريف اللغة الوسيطة صعب وربما مستحيل بالنسبة لمجال أوسع. السياق المثالي للترجمة الآلية الوسيطة هو الترجمة الآلية متعددة اللغات في مجال محدد للغاية.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

تاريخ

ظهرت الأفكار الأولى حول الترجمة الآلية بين اللغات في القرن السابع عشر مع ديكارت و لايبنتس، اللذين توصلا إلى نظريات حول كيفية إنشاء القواميس باستخدام الرموز الرقمية العالمية. وقد عمل آخرون، مثل كيڤ بِك و أثناسيوس كيرشر و يوهان يواكيم بيكر على تطوير لغة عالمية لا لبس فيها على أساس مبادئ المنطق والأيقونات. في عام 1668، وصف جون ويلكنز اللغة الوسيطة في كتابه "مقال نحو شخصية حقيقية ولغة فلسفية". وفي القرنين الثامن عشر والتاسع عشر تم تطوير العديد من المقترحات الخاصة باللغات العالمية "الشاملة"، أشهرها الإسپرانتو.

ومع ذلك، فإن تطبيق فكرة لغة عالمية على الترجمة الآلية لم يظهر في أي من الأساليب المهمة الأولية. بدلاً من ذلك، بدأ العمل على أزواج من اللغات. ومع ذلك، خلال الخمسينيات والستينيات من القرن الماضي، كان باحثون في كامبريدج بقيادة مارگريت ماسترمان، في لينينگراد برئاسة نيكولاي أندرييڤ وقد بدأ سيلڤيو تشكاتو العمل في هذا المجال في ميلانو. وقد نوقشت الفكرة باستفاضة من قبل الفيلسوف الإسرائيلي يهوشوا بار هيليل في عام 1969.

خلال السبعينيات، تم إجراء بحث جدير بالملاحظة في گرينوبل من قبل الباحثين الذين حاولوا ترجمة نصوص الفيزياء والرياضيات من الروسية إلى الفرنسية، وفي [[[جامعة تكساس، أوستن|تكساس]] مشروع مماثل (METAL) كان مستمراً للروسية للإنگليزية. تم أيضاً بناء أنظمة الترجمة الآلية بين اللغات الأولية في ستانفورد في السبعينيات من قبل روجر شانك و يوريك ويلكس. أصبح الأول أساساً لنظام تجاري لتحويل الأموال، والبرنامج الأخير محفوظ في متحف الكمبيوتر في بوسطن كأول نظام ترجمة آلية بين اللغات.

في الثمانينيات من القرن الماضي، تجددت الصلة بالمناهج القائمة على اللغة الوسيطة والقائمة على المعرفة للترجمة الآلية بشكل عام، مع إجراء الكثير من الأبحاث في هذا المجال. كان العامل المشترك في هذا البحث هو أن الترجمة عالية الجودة تتطلب التخلي عن فكرة طلب الفهم الكامل للنص. بدلاً من ذلك، يجب أن تستند الترجمة إلى المعرفة اللغوية والمجال المحدد الذي سيُستخدم فيه النظام. أُجري أهم بحث في هذا العصر في الترجمة الموزعة للغات (DLT) في أوترخت، والتي عملت مع نسخة معدلة من الإسپرانتو، ونظام فوجيتسو في اليابان.

الخطوط العريضة

الشكل 2. أ) رسم بياني للترجمة مطلوب من أجل الترجمة الآلية القائمة على التحويل (مطلوب 12 قاموساً)؛ ب) رسم بياني للترجمة مطلوب عند استخدام لغة بردج (مطلوب 8 وحدات ترجمة فقط).

في طريقة الترجمة هذه، يمكن اعتبار اللغة الوسيطة كطريقة لوصف تحليل نص مكتوب بـ لغة مصدر بحيث يمكن تحويله الصرفي والنحوي والدلالي (وحتى الپراگماتي)، أي "المعنى" في اللغة الهدف. هذه اللغة الوسيطة قادرة على وصف جميع خصائص جميع اللغات التي سيتم ترجمتها، بدلاً من مجرد الترجمة من لغة إلى أخرى.

الشكل 3: رسم بياني للترجمة باستخدام اثنين من اللغات الوسيطة.

في بعض الأحيان يتم استخدام اثنين من اللغات الوسيطة في الترجمة. من الممكن أن تغطي أحدهما المزيد من خصائص اللغة المصدر، والأخرى تمتلك المزيد من خصائص اللغة الهدف. ثم تبدأ الترجمة بتحويل الجمل من اللغة الأولى إلى جمل أقرب إلى اللغة الهدف عبر مرحلتين. يمكن أيضاً إعداد النظام بحيث تستخدم اللغة الوسيطة الثانية مفردات أكثر تحديداً أقرب أو أكثر توافقاً مع اللغة الهدف، وهذا يمكن أن يحسن جودة الترجمة.

يعتمد النظام المذكور أعلاه على فكرة استخدام القرب اللغوي لتحسين جودة الترجمة من نص بلغة أصلية واحدة إلى العديد من اللغات الأخرى المشابهة هيكلياً من تحليل أصلي واحد فقط. يستخدم هذا المبدأ أيضًا في الترجمة الآلية المحورية، حيث يتم استخدام اللغة الطبيعية كـ "جسر" بين لغتين بعيدتين. على سبيل المثال، في حالة الترجمة إلى الإنگليزية من الأوكرانية باستخدام الروسية كلغة وسيطة.^[2]

عملية الترجمة

في أنظمة الترجمة الآلية للغات الوسيطة، هناك مكونان أحاديا اللغة: تحليل اللغة المصدر واللغةالوسيطة، و توليد اللغة الوسيطة واللغة الهدف. ومع ذلك، من الضروري التمييز بين الأنظمة بين اللغات التي تستخدم الأساليب النحوية فقط (على سبيل المثال، الأنظمة التي تم تطويرها في السبعينيات في جامعتي گرينوبل وتكساس) وتلك القائمة على الذكاء الاصطناعي (من عام 1987 في اليابان والبحث في جامعات جنوب كاليفورنيا وكارنيگي ميلون). يتوافق النوع الأول من النظام مع ذلك الموضح في الشكل 1. بينما يتم تقريب الأنواع الأخرى من خلال الرسم التخطيطي في الشكل 4.

الموارد التالية ضرورية لنظام الترجمة الآلية عبر لغة وسيطة:

الشكل 4. الترجمة الآلية في نظام قائم على المعرفة.

قواميس (أو معاجم) للتحليل والتوليد (خاصة بـ المجال واللغات المعنية).
مفردات مفاهيمية (خاصة بالمجال)، وهي قاعدة المعرفة حول الأحداث والكيانات المعروفة في المجال.
مجموعة من قواعد الإسقاط (خاصة بالمجال واللغات).
القواعد النحوية لتحليل وتوليد اللغات المعنية.

تتمثل إحدى مشكلات أنظمة الترجمة الآلية القائمة على المعرفة في أنه يصبح من المستحيل إنشاء قواعد بيانات لمجالات أكبر من مناطق محددة للغاية. أمر آخر هو أن معالجة قواعد البيانات هذه مكلفة للغاية من الناحية الحسابية.

الفعالية

تتمثل إحدى المزايا الرئيسية لهذه الاستراتيجية في أنها توفر طريقة اقتصادية لإنشاء أنظمة ترجمة متعددة اللغات. مع اللغة الوسيطة يصبح من غير الضروري عمل زوج ترجمة بين كل زوج من اللغات في النظام. لذلك بدلا من إنشاء زوج اللغات، $n(n-1)$ حيث $n$ هو عدد اللغات في النظام، من الضروري فقط إجراؤه $2n$ زوج بين $n$ لغة واللغة الوسيطة.

العيب الرئيسي لهذه الاستراتيجية هو صعوبة إنشاء لغة وسيطة مناسبة. يجب أن تكون مجردة ومستقلة عن لغة المصدر والهدف. كلما زادت اللغات المضافة إلى نظام الترجمة، وكلما كانت أكثر اختلافاً، يجب أن تكون اللغة الوسيطة أكثر فاعلية في التعبير عن جميع اتجاهات الترجمة الممكنة. مشكلة أخرى هي أنه من الصعب استخلاص المعنى من النصوص باللغات الأصلية لإنشاء التمثيل الوسيط.

أنظمة الترجمة الآلية الحالية للغات الوسيطة

Calliope-Aero
Carabao Linguistic Virtual Machine
Grammatical Framework
Number Translator
تستخدم ترجمة گوگل اللغة الإنگليزية داخلياً لغة محورية لبعض أزواج اللغات مثل الصينية واليابانية، وبشكل أكثر عمومية مع مترجمات الشبكة العصبية "عالية الجودة" مع الإنگليزية ولكن ليس بين بعضها البعض.

انظر أيضاً

ملاحظات

^ Abdel Monem, A., Shaalan, K., Rafea, A., Baraka, H., Generating Arabic Text in Multilingual Speech-to-Speech Machine Translation Framework, Machine Translation, Springer, Netherlands, 20(4): 205–258, December 2008.
^ Bogdan Babych, Anthony Hartley, and Serge Sharoff (2007) "Translating from under-resourced languages: comparing direct transfer against pivot translation". Proceedings of MT Summit XI, 10–14 September 2007, Copenhagen, Denmark. pp.29—35

وصلات خارجية

Interlingua Methods
- Slides
- Paper

الكلمات الدالة:

[1] Abdel Monem, A., Shaalan, K., Rafea, A., Baraka, H., Generating Arabic Text in Multilingual Speech-to-Speech Machine Translation Framework, Machine Translation, Springer, Netherlands, 20(4): 205–258, December 2008.

[2] Bogdan Babych, Anthony Hartley, and Serge Sharoff (2007) "Translating from under-resourced languages: comparing direct transfer against pivot translation". Proceedings of MT Summit XI, 10–14 September 2007, Copenhagen, Denmark. pp.29—35

[1]

[2]