الترجمة الآلية والترجمة بمساعدة الحاسوب

يناير 7, 2018 أ. فرج محمد صوان

ملخص

يهدف هذا الفصل إلى استكشاف الجديد في تقنية الترجمة الآلية والترجمة بمساعدة الحاسوب من أجل تحديد ما إذا كانت تغير العلاقة بين المترجم والنصوص، وإذا كان الأمر كذلك، فبأي طريقة. وسنحاول التطرق إلى المواضيع التالية:

  • ماهية الترجمة الآلية، وأهميتها، وأهدافها.
  • ماهية الترجمة بمساعدة الحاسوب.
  • بعض تقنيات الترجمة الآلية، ومقارنتها.
  • أثر التقنيات الجديدة على المترجمين.

 

 

ماهية الترجمة الآلية؟

الترجمة الآلية (Machine Translation) كما يعرفها قاموس أكسفورد للغة الإنجليزية هي الترجمة التي يقوم بها الحاسوب، وهي عملية يشار إليها أحيانا بمعالجة اللغة الطبيعية التي تستخدم مجموعة بيانات ثنائية اللغة وأصول لغوية أخرى لبناء نماذج لغوية تُستخدم لترجمة النصوص. وكلما أصبحت الأنشطة الحاسوبية أكثر انتشارا وفتحت الانترنت المجتمع العالمي متعدد اللغات على نطاق أوسع، فإن البحث والتطوير في الترجمة الآلية سيستمر في النمو بمعدل سريع.

هناك عدد قليل من أنواع مختلفة من الترجمة الآلية المتاحة في السوق اليوم، وأكثرها استخداما على نطاق واسع هما الترجمة الآلية الإحصائية (Statistical Machine Translation)، والترجمة الآلية المبنية على القواعد (Rule-Based Machine Translation)، والأنظمة الهجينة التي تجمع بين الاثنين.

لقد كانت ميكنة الترجمة واحدا من أقدم أحلام البشرية. وفي القرن الواحد والعشرين أصبحت حقيقة واقعة، في شكل برامج حاسوبية قادرة على ترجمة مجموعة واسعة من النصوص من لغة طبيعية إلى لغة أخرى. ولكن الواقع، كما هوا دائما، ليس مثاليا. فليس هناك آلات ترجمة التي يمكنها، بلمس بضعة أزرار، أن تأخذ أي نص بأي لغة وإنتاج ترجمة مضبوطة بأي لغة أخرى دون تدخل أو مساعدة الإنسان. يعتبر هذا هدفا للمستقبل البعيد، إذا أمكن حتى تحقيقه من حيث المبدأ، وهو ما يشكك فيه الكثيرين.

ما تم تحقيقه هو تطوير البرامج التي يمكن أن تنتج ترجمة “خام” لنصوص في مجالات متخصصة محددة نسبيا، والتي يمكن تنقيحها لإنتاج نصوص مترجمة ذات نوعية جيدة بمعدل اقتصادي معقول، أو التي يمكن في حالتها غير المحررة قراءتها وفهمها من قبل المتخصصين في الموضوع لأغراض معلوماتية. وفي بعض الحالات، مع الضوابط المناسبة على لغة النصوص المدخلة، يمكن أن تنتج ترجمة آلية ذات جودة أعلى تحتاج إلى مراجعة قليلة أو تكاد تكون معدومة.

هذه إنجازات قوية لما يسمى تقليديا بالترجمة الآلية، ولكن غالبا ما يلفها الغموض وسوء الفهم، حيث أن تصور الجمهور للترجمة الآلية تشوهه اثنين من المواقف المتطرفة. فمن ناحية، هناك أولئك الغير مقتنعين بأن هناك صعوبة في تحليل اللغة، حيث إن الأطفال الصغار قادرون على تعلم اللغات بسهولة؛ وأولئك المقتنعين بأن أي شخص يعرف لغة أجنبية يجب أن يكون قادرا على الترجمة بكل سهولة. وبالتالي، فإنهم غير قادرين على تقدير صعوبات المهمة أو ما تم تحقيقه. ومن ناحية أخرى، هناك من يعتقدون أنه بسبب عدم إمكانية الترجمة الآلية لشكسبير، جوثيه، تولستوي والمؤلفين الأدبيين الأقل مرتبة، فإنه ليس من الممكن أن يكون هناك أي دور لأي نوع من الترجمة القائمة على الحاسوب. إنهم غير قادرين على تقييم المساهمة التي قد تقوم بها الترجمة الأقل من الكاملة إما في عملهم أو في التحسين العام للتواصل الدولي.

 

أهمية الترجمة الآلية

إن موضوع الترجمة الآلية يعتبر مهم جدا لدرجة أنه يجعلنا نقضي معظم حياتنا المهنية نبحث فيه، ونأمل أن يشاركنا القارئ في ذلك، أو على الأقل يفهم هذه الاهمية. ولكن مهما كان تفكير المرء في فائدته الجوهرية، فإنه بلا شك موضوع مهم اجتماعيا وسياسيا وتجاريا وعلميا وفكريا أو فلسفيا، حيث ازدادت أهميته بانتهاء القرن العشرين، وبداية القرن الحادي والعشرون.

وتنشأ الأهمية الاجتماعية أو السياسية للترجمة الآلية من الأهمية الاجتماعية والسياسية للترجمة في المجتمعات التي يُتحدث فيها عموما بأكثر من لغة واحدة. البديل الوحيد هنا للاستخدام الواسع للترجمة هو اعتماد “لغة مشتركة” (lingua franca) واحدة، والتي (على الرغم مما يمكن للمرء أن يفكر فيه أولا) لا تعتبر بديلا جذابا بشكل خاص، لأنه ينطوي على هيمنة اللغة المختارة، وخسارة للمتكلمين باللغات الأخرى، ويثير احتمال أن تصبح اللغات الأخرى من الدرجة الثانية، وتختفي في نهاية المطاف. وبما أن فقدان لغة غالبا ما ينطوي على اختفاء ثقافة مميزة، وطريقة للتفكير، فإن هذه خسارة ينبغي أن تهم الجميع. لذلك فإن الترجمة ضرورية للتواصل، وللتفاعل البشري العادي، ولجمع المعلومات التي يحتاجها المرء ليلعب دورا كاملا في المجتمع. يبدو أن السماح للمرء بالتعبير عن نفسه بلغته الخاصة، وتلقي المعلومات التي تؤثر بشكل مباشر عليه بنفس الوسيلة، يعتبر حق مهم، رغم انتهاكه في كثير من الأحيان. وهو حق يعتمد على توافر الترجمة. المشكلة هي أن الطلب على الترجمة في العالم الحديث يفوق أي عرض ممكن. يكمن جزء من المشكلة في وجود عدد قليل جدا من المترجمين البشر، وأن هناك حدا لمدى امكانية زيادة إنتاجيتهم بدون الميكنة. وباختصار، يبدو أن ميكنة الترجمة ضرورة اجتماعية وسياسية للمجتمعات الحديثة التي لا ترغب في فرض لغة مشتركة على أعضائها.

غالبا ما تفوت هذه النقطة على الذين يعيشون في مجتمعات تطغى عليها اللغة واحدة، ويتكلمون اللغة المهيمنة مثل المتحدثون باللغة الإنجليزية في أماكن مثل بريطانيا، والولايات المتحدة الشمالية. ومع ذلك، فهم يبدؤون في تقدير ذلك بسرعة عندما يزورون مناطق لا تهيمن عليها اللغة الإنجليزية (على سبيل المثال، المناطق التي تتحدث الويلزية في بريطانيا، وأجزاء من الولايات المتحدة الأمريكية حيث لغة الأكثرية هي الإسبانية، ناهيك عن معظم البلدان الأخرى في العالم) . أما بالنسبة لبلدان مثل كندا وسويسرا، ومنظمات مثل المجتمع الأوروبي والأمم المتحدة، التي تعتبر فيها التعددية اللغوية مبدأ أساسيا وحقيقة من حقائق الحياة اليومية، فإن هذه النقطة واضحة.

إن الأهمية التجارية للترجمة الآلية تعتبر نتيجة عوامل مرتبطة. أولا، الترجمة نفسها مهمة تجاريا. فمثلا إذا ما واجه المشتري خيارا بين منتج بدليل تعليمات مكتوب باللغة الإنجليزية، وآخر دليله مكتوب باللغة العربية، فإن معظم المتحدثين باللغة العربية سيشترون الأخير. وفي حالة دليل إصلاح قطعة من آلات التصنيع أو دليل لنظام سلامة مهم، فإن هذا ليس مجرد مسألة ذوق. ثانيا، الترجمة مكلفة لأنها وظيفة مهارات عالية، وتتطلب أكثر بكثير من مجرد معرفة عدد من اللغات. وفي بعض البلدان على الأقل، نجد أن مرتبات المترجمين مماثلة لتلك التي يتقاضاها المهنيين المدربين تدريبا عاليا. وعلاوة على ذلك، فإن التأخير في الترجمة مكلف. وتختلف التقديرات، ولكن انتاج ترجمات عالية الجودة للمواد الصعبة، لا يمكن للمترجم المحترف أن يزيد عن معدل من 4 إلى 6 صفحات من الترجمة (ربما 2000 كلمة) في اليوم الواحد، ومن السهل جدا أن يسبب التأخير في ترجمة وثائق منتج جديد في تآكل زمن تصدر السوق. وتشير التقديرات إلى أن حوالي 40-45٪ من تكاليف تشغيل مؤسسات المجتمع الأوروبي هي “تكاليف لغوية”، والتي تشكل فيها الترجمة المكتوبة والشفوية الجزء الرئيسي. وهذا يمثل تكلفة تقدر بحوالي ثلاثمائة مليون جنيه استرليني سنويا. ويتعلق هذا الرقم بالترجمات التي تم القيام بها بالفعل، وهو جزء ضئيل من تكلفة القيام بجميع الترجمات التي يمكن، أو ينبغي القيام بها (Patterson, 1982).

أما علميا، فإن الترجمة الآلية مثيرة للاهتمام، لأنها تمثل تطبيق واضح وأرض اختبار لكثير من الأفكار في علوم الحاسوب، والذكاء الاصطناعي، وعلم اللغة، كما أن بعض أهم التطورات في هذه المجالات كانت قد بدأت في الترجمة الآلية. وكمثال على ذلك نذكّر بأن أصول لغة برولوغ (Prolog)، التي تعتبر أول لغة برمجة منطقية متاحة على نطاق واسع، والتي شكلت جزءا رئيسيا من برنامج الجيل الخامس للبحوث اليابانية في أواخر الثمانينات، يمكن تتبعها في لغة ’أنظمة كيو‘ (Q-Systems)، التي تم تطويرها أصلا لأجل الترجمة الآلية (Arnold, D. et al, 1994: 5).

ومن الناحية الفلسفية، فإن الترجمة الآلية مثيرة للاهتمام، لأنها تمثل محاولة لميكنة نشاط يتطلب مجموعة كاملة من المعرفة البشرية، أي بمعنى انه من الممكن أن نفكر لأي جزء من المعرفة البشرية في سياق تكون فيه المعرفة مطلوبة. على سبيل المثال، تعتمد الترجمة الصحيحة للعبارة الإنجليزية ‘negatively charged electrons and protons’ إلى العربية على معرفة أن البروتونات مشحونة إيجابيا، وبالتالي فإن الترجمة لا يمكن أن تكون شيئا مثل ‘الإلكترونات والبروتونات المشحونة بالسالب’. وبهذا المعنى، فإن المدى الذي يمكن به جعل الترجمة آلية يعتبر مؤشر على المدى الذي يمكن به جعل ‘التفكير’ آليا.

وعلى الرغم من هذا، فإن عدد قليل جدا من الناس، وحتى أولئك الذين يشاركون في إنتاج أو تفويض الترجمات، لديهم فكرة كبيرة عما تنطوي عليه الترجمة الآلية اليوم، سواء على المستوى العملي لما يعني امتلاك واستخدام نظام ترجمة آلية، أو على مستوى ما هو ممكن من الناحية التقنية، وما هو من الخيال العلمي. ففي جميع أنحاء المملكة المتحدة ربما لا زال يوجد عدد قليل من الشركات التي تستخدم الترجمة الآلية لإنتاج ترجمات تجارية على أساس يومي. وفي أوروبا، حيث أن الحاجة إلى الترجمة التجارية لأسباب تاريخية أكبر، فإن العدد أكبر، ولكنه لا يزال يمثل نسبة ضئيلة للغاية من مجمل جهود الترجمة التي يجري الاضطلاع بها فعلا. أما في اليابان، حيث هناك حاجة هائلة لترجمة اليابانية إلى اللغة الإنجليزية، فإن الترجمة الآلية قد أصبحت تستخدم على نطاق تجاري، كما أصبحت معرفة الترجمة الآلية جزءا قياسيا من تدريب المترجمين المحترفين. وبطبيعة الحال، يجب أن يكون المنظرين والمطورين والبائعين لأنظمة الترجمة الآلية هم المسؤولين أساسا عن هذا المستوى من الجهل وعدم وجود الاستيعاب، ونأمل أن يساعد هذا الفصل في ادراك أن فهم الترجمة الآلية يعتبر جزء أساسي من معدات المترجم المحترف.

 

 

أهداف الترجمة الآلية

معظم الترجمة في العالم ليست للنصوص التي لها مكانة أدبية وثقافية عالية. ويعمل الغالبية العظمى من المترجمين المحترفين لتلبية الطلب الهائل والمتزايد على ترجمة الوثائق العلمية والتقنية، والمعاملات المالية والتجارية، والمذكرات الإدارية، والوثائق القانونية، وأدلة التعليمات، والكتب الزراعية والطبية، والبراءات الصناعية، ومنشورات الدعاية، والتقارير الصحيفة، الخ. جزء من هذا العمل يبرز تحديات وصعب، ولكن أكثره ممل وتكراري، وفي الوقت نفسه يتطلب الدقة والاتساق. كما أن الطلب على هذه الترجمات قد ازداد بمعدل يتجاوز بكثير قدرة مهنة الترجمة، ولكن المساعدة التي يقدمها جهاز الحاسوب لها نقاط جذب واضحة وفورية. وتحدد الفائدة العملية لنظام الترجمة الآلية في نهاية المطاف بنوعية مخرجاتها. ولكن ما يعتبر ترجمة ‘جيدة’، سواء قام بها الإنسان أو الآلة، هو مفهوم يصعب جدا تحديده بدقة. ويتوقف الكثير على الظروف الخاصة التي تتم فيها وعلى المتلقي المحدد الذي تتم لأجله. الإخلاص، والدقة، والوضوح، والأسلوب والسجل المناسب تعتبر جميعها معايير يمكن تطبيقها، ولكنها تظل أحكاما ذاتية. إن ما يهم من الناحية العملية، فيما يتعلق بالترجمة الآلية، هو كم يجب أن يتغير من أجل جعل مخرجاتها ترقى إلى مستوى مقبول للمترجم أو القارئ البشري. ومع مفهوم زلق كالترجمة، لا يمكن لباحثي ومطوري أنظمة الترجمة الآلية إلا أن يطمحوا في نهاية المطاف إلى إنتاج ترجمات تكون ‘مفيدة’ في حالات معينة )والتي تلزمهم بتحديد أهداف بحثية واضحة) أو، بدلا من ذلك، يبحثون عن تطبيقات مناسبة للترجمات التي هم قادرين على إنتاجها فعلا.

ومع ذلك، لا يزال هناك المثل العليا الأعلى لمضاهاة الترجمة البشرية الأفضل. تعتبر الترجمة الآلية جزء من مجال أوسع من ’البحوث البحتة‘ في معالجة اللغة الطبيعية القائمة على الحاسوب في علم اللغة الحاسوبي والذكاء الاصطناعي، والذي يستكشف الآليات الأساسية للغة والعقل من خلال النمذجة والمحاكاة في برامج الحاسوب. ويرتبط البحث في الترجمة الآلية ارتباطا وثيقا بهذه الجهود، حيث يتم اعتماد وتطبيق الرؤى النظرية والتقنيات التشغيلية لعمليات الترجمة، وبالتالي تقديم رؤى وحلول من مشاكلها الخاصة. وبالإضافة إلى ذلك، يمكن أن توفر الترجمة الآلية “اختبار سريري” على نطاق أوسع للنظريات والتقنيات التي تم تطويرها في التجارب الصغرى في علم اللغة الحسابي والذكاء الاصطناعي.

إن العقبات الرئيسية التي تحول دون الترجمة بالحاسوب لازالت كما كانت عليه دائما، لغوية وليست حسابية. وتتمثل هذه في مشاكل الغموض المعجمي، والتعقيد النحوي، واختلافات المفردات بين اللغات، والحذف الإيجازي، والتراكيب ’غير الصحيحة‘، وباختصار، استخراج ’معنى ‘الجمل والنصوص من تحليل الإشارات المكتوبة وإنتاج الجمل والنصوص بمجموعة أخرى من الرموز اللغوية بمعنى مكافئ. ونتيجة لذلك، ينبغي أن تتوقع الترجمة الآلية الاعتماد بشكل كبير على التقدم المحرز في البحوث اللغوية، ولا سيما تلك الفروع التي تظهر درجات عالية من إضفاء الصبغة الرسمية، بل يجب عليها الاستمرار في ذلك. ولكن لا يمكن للترجمة الآلية تطبيق النظريات اللغوية مباشرة، لأن علماء اللغة مهتمين بتوضيح ’للآليات‘ الكامنة وراء إنتاج اللغة واستيعابها، فهم يركزون على السمات الأساسية ولا يحاولون وصف أو شرح كل شيء. وعلى النقيض من ذلك، يجب أن تتعامل أنظمة الترجمة الآلية مع النصوص الفعلية، ويجب أن تواجه المدى الكامل للظواهر اللغوية، وتعقيدات المصطلحات، والأخطاء الإملائية، والكلمات الجديدة، وجوانب ’الأداء‘ التي ليست دائما في نطاق اهتمام علم اللغة النظري المجرد.

وباختصار، فإن الترجمة الآلية ليست في حد ذاتها مجال مستقل من البحوث ‘النقية’. فهي تأخذ من علم اللغة، وعلوم الحاسوب، والذكاء الاصطناعي، ونظرية الترجمة، وأي أفكار وأساليب وتقنيات التي قد تخدم تطوير أنظمة محسنة. وهي أساسا بحوث ’تطبيقية ‘، ولكنها مع ذلك مجال قد بنى مجموعة كبيرة من التقنيات والمفاهيم التي يمكن تطبيقها في مجالات أخرى للمعالجة اللغوية القائمة على الحاسوب.

 

 

بعض التعاريف الأولية

إن مصطلح الترجمة الآلية (Machine Translation) هو الآن الاسم التقليدي والقياسي للأنظمة المحوسبة المسؤولة عن إنتاج الترجمات من لغة طبيعية إلى أخرى، مع أو بدون المساعدة البشرية. ونادرا ما تستخدم الأسماء السابقة مثل “الترجمة الميكانيكية (mechanical translation) و الترجمة الأوتوماتيكية (automatic translation) باللغة الإنجليزية؛ ولكن مكافئاتها لا تزال شائعة في لغات أخرى. ولا يشمل المصطلح أدوات الترجمة القائمة على الحاسوب التي تدعم المترجمين عن طريق توفير إمكانية الوصول إلى المعاجم وقواعد بيانات المصطلحات النائية، وتسهيل نقل واستقبال النصوص التي يمكن قراءتها آليا، أو التفاعل مع معالجات النصوص أو تحرير النصوص أو معدات الطباعة. ومع ذلك، فهي تتضمن الأنظمة التي يساعد فيها المترجمون أو غيرهم من المستخدمين الحواسيب على إنتاج الترجمات، بما في ذلك توليفات مختلفة من إعداد النصوص، والتفاعلات على الانترنت، والتنقيحات اللاحقة للمخرجات. وغالبا ما تكون الحدود بين الترجمة البشرية بمساعدة الآلة (Machine-Aided Human Translation) والترجمة الآلية بمساعدة الإنسان (Human-Aided Machine Translation) غير واضحة، ويمكن لمصطلح الترجمة بمساعدة الحاسوب (Computer-Assisted Translation) أن يغطي كلاهما أحيانا. ولكن جوهر الترجمة الآلية الأساسي هو جعل عملية الترجمة آلية بالكامل (ميكنتها كلها).

وعلى الرغم من أن المثالي يتمثل في إنتاج ترجمات عالية الجودة، إلا أنه عمليا يتم مراجعة ناتج معظم أنظمة الترجمة الآلية (التحرير البعدي). وفي هذا الصدد، فإنه لا يتم معاملة ناتج الترجمة الآلية بشكل مختلف عن ناتج معظم المترجمين البشر الذي يتم تنقيحه عادة من قبل مترجم آخر قبل النشر. ومع ذلك، فإن أنواع الأخطاء التي تنتجها أنظمة الترجمة الآلية تختلف عن تلك التي يقع فيها المترجمين البشر. ففي حين أن التحرير البعدي هو المعتاد، نجد أن هناك ظروف معينة يمكن فيها ترك ناتج الترجمة الآلية بدون تحرير (كترجمة خام) أو أن يتم تصحيحه بشكل طفيف فقط، كحين تكون موجهه خصيصا للمتخصصين الذين لهم دراية بموضوع النص. كما يمكن أن تُستخدم المخرجات أيضا كمسودة تقريبية للمترجم البشري، كترجمة مبدئية.

يمكن تحسين جودة الترجمة في أنظمة الترجمة الآلية (وبالطبع ليس فقط بتطوير طرق أفضل) بفرض قيود معينة على المدخلات. ويمكن تصميم النظام، على سبيل المثال، ليتعامل مع النصوص التي تقتصر على اللغة الفرعية (المفردات والقواعد) في مجال تخصصي معين (مثل كيمياء البوليمر) أو نوع الوثيقة (مثل براءات الاختراع). وبدلا من ذلك، يمكن كتابة نصوص الإدخال بلغة متحكم فيها، مما يقلل من الغموض المحتمل ويقيد تعقيد تراكيب الجمل. وغالبا ما يشار إلى هذا الخيار باسم التحرير المسبق، ولكن يمكن أن يستخدم المصطلح أيضا لوضع العلامات على نصوص الإدخال للإشارة إلى أسماء العلم، وتقسيمات الكلمة، والبادئات، واللواحق، وحدود العبارات، الخ. وأخيرا، قد يحيل النظام نفسه مشاكل الغموض والاختيار للمشغلين البشر(عادة ما يكونوا مترجمين، على الرغم من أن بعض النظم مصممة للاستخدام من قبل المؤلفين الأصليين) لاتخاذ القرار خلال عمليات الترجمة نفسها، أي في وضع تفاعلي.

يتم تصميم الأنظمة إما لزوج واحد معين من اللغات (أنظمة ثنائية اللغة) أو لأكثر من لغتين (أنظمة متعددة اللغات)، إما في اتجاه واحد فقط (أنظمة أحادية الاتجاه) أو في كلا الاتجاهين (أنظمة ثنائية الاتجاه). و هناك ثلاثة أنواع أساسية في التصميم العام للنظام. وعادة ما يشار إلى الأول (والأقدم تاريخيا) على أنه نهج الترجمة المباشرة: يتم تصميم نظام الترجمة الآلية بجميع تفاصيله خصيصا لزوج واحد معين من اللغات في اتجاه واحد، على سبيل المثال، ،اللغة الروسية كلغة النصوص الأصلية، لغة المصدر، واللغة الإنجليزية كلغة النصوص المترجمة، اللغة الهدف. ولا يتم تحليل النصوص المصدر أكثر من اللازم لتوليد النصوص في اللغة الأخرى. والنوع الأساسي الثاني هو نهج اللغة الوسيطة، الذي يفترض إمكانية تحويل النصوص من وإلى تمثيلات “معنى” مشتركة لأكثر من لغة واحدة. و بالتالي تكون الترجمة على مرحلتين، من لغة المصدر إلى اللغة الوسيطة، ومن اللغة الوسيطة إلى اللغة الهدف. كما أن برامج التحليل مستقلة عن برامج التوليد. ففي التكوين متعدد اللغات، يمكن ربط أي برنامج تحليل بأي برنامج توليد. أما النوع الثالث فهو نهج النقل الأقل طموحا. فبدلا من العمل على مرحلتين من خلال تمثيل معنى وسط لغوي واحد، هناك ثلاث مراحل تتضمن عادة التمثيل النحوي لكلا من النص المصدر والنص الهدف. وتقوم المرحلة الأولى بتحويل النصوص إلى تمثيلات وسيطة يتم فيها حل الغموض بصرف النظر عن أي لغة أخرى. و يتم في المرحلة الثانية تحويل هذه التمثيلات إلى تعبيرات مكافئة للغة الهدف؛ وفي المرحلة الثالثة، يتم توليد النصوص الهدف النهائية. وتعتبر برامج التحليل والتوليد محددة للغات معينة ومستقلة عن بعضها البعض. ويتم التعامل مع الاختلافات بين اللغات، في المفردات والتراكيب، في برنامج نقل وسيط.

وفي مراحل التحليل والتوليد، تُظهر معظم أنظمة الترجمة الآلية المكونات التي تتعامل مع مستويات مختلفة من الوصف اللغوي بوضوح، وهي الصرف (morphology)، والنحو (syntax)، والدلالة (semantics). وبالتالي، يمكن تقسيم التحليل إلى التحليل الصرفي (مثل تحديد نهايات الكلمات)، والتحليل النحوي (تحديد تراكيب العبارات، وما إلى ذلك) والتحليل الدلالي (حل الغموض المعجمي والهيكلي). وبالمثل، فإن التوليد (أو التوليف) قد يمر عبر المستويات التوليد الدلالية والنحوية والصرفية. وقد تكون هناك مكونات منفصلة في أنظمة النقل تتعامل مع النقل المعجمي (اختيار مكافئات المفردات) والنقل الهيكلي (تحويل تراكيب النص المصدر إلى مكافئاتها في النص الهدف).

لم تكن قواعد التحليل والنقل والتوليد دائما منفصلة بشكل واضح في العديد من النظم القديمة (وخاصة تلك التي من نوع الترجمة المباشرة). كما أن بعضها قد خلط أيضا البيانات اللغوية (القواميس والقواعد) وقواعد وإجراءات المعالجة الحاسوبية. وقد أظهرت الأنظمة اللاحقة درجات مختلفة من التقسيمات، بحيث يمكن تكييف مكونات النظام وبياناته وبرامجه وتغييرها بشكل مستقل عن بعضها البعض.

 

 

العمليات العقلية

لكي نفهم المبادئ الأساسية الكامنة وراء الترجمة الآلية سيكون من الضروري فهم كيفية عمل العقل البشري. تتمثل المرحلة الأولى في الترجمة البشرية في الاستيعاب التام لنص اللغة المصدر. وهذا الاستيعاب يشتغل على ثلاثة مستويات تتمثل في الآتي:

  • المستوى الدلالي: فهم الكلمات خارج السياق كما في القاموس.
  • المستوى النحوي: فهم الكلمات في الجمل.
  • المستوى البراجماتي: فهم الكلمات في السياق والمواقف .

وبالإضافة إلى ذلك، هناك على الأقل خمسة أنواع من المعرفة المستخدمة في عملية الترجمة نختصرها فيما يلي:

  • معرفة اللغة المصدر التي تسمح لنا بفهم النص الأصلي.
  • معرفة اللغة الهدف التي تمكن من انتاج نص متماسك ومترابط منطقيا باللغة المعنية.
  • معرفة المكافئات بين اللغة المصدر واللغة الهدف.
  • المعرفة بمجال التخصص والمعرفة العامة لأن كلاهما يساعد في فهم نص اللغة المصدر.
  • المعرفة بالنواحي الاجتماعية والثقافية، أي معرفة العادات والتقاليد في كل من الثقافة المصدر والهدف.

 

وبناءا على تعقيد الظاهرة التي تكمن وراء عمل المترجم البشري، سيكون من السذاجة الادعاء بأن الترجمة الآلية يمكنها أن تنتج نص هدف بنفس جودة النص الذي ينتجه الانسان. ومع ذلك، يبدو من الواضح أنه حتى المترجم البشري نادرا ما يكون قادرا على انتاج ترجمة مصقولة من المحاولة الأولى. ففي الواقع، تتكون عملية الترجمة من مرحلتين. تتمثل المرحلة الأولى في انتاج نص تقريبي أو نسخة مبدئية في اللغة الهدف يتم فيها حل معظم مشاكل الترجمة، ولكنها بعيدة عن أن تكون تامة. أما المرحلة الثانية، وهي مرحلة المراجعة، فتتباين من مجرد إعادة قراءة النص وإجراء تعديلات بسيطة إلى تطبيق تغييرات جذرية. يمكننا إذن القول أن الترجمة الآلية تهدف إلى أداء المرحلة الأولى من هذه العملية بطريقة آلية، وذلك لكي يستطيع الانسان بعدها الاستمرار مباشرة في المرحلة الثانية، حيث يقوم بتنفيذ مهمة المراجعة التدقيقية الصعبة. المشكلة هي أن المترجم يواجه الآن نص لم يترجمه عقل بشري وإنما آلة، الأمر الذي يغير النهج المطلوب لأن الأخطاء مختلفة. مما يستدعي ضرورة جعل نسخة الآلة متناغمة مع العمليات الفكرية، والأحكام، والخبرات البشرية. وبالتالي فإن الترجمة الآلية تعتبر مساعدة وفي نفس الوقت مصيدة للمترجمين. وتعتبر مساعدة لأنها تكمل مرحلة الترجمة الأولى، ومصيدة أو شرك لأنه ليس من السهل على المترجم دائما أن يحافظ على المسافة النقدية اللازمة من نص مترجم فعلا (على الأقل مبدئيا)، مما قد يسبب في عدم اكتشاف الأخطاء. ولا يجب اعتبار اي ترجمة تمت بطريقة آلية على أنها نهائية مهما كانت الظروف، حتى وإن بدت ظاهريا متماسكة وصحيحة.

 

 

قيود الترجمة الآلية

تتمثل حدود الترجمة الآلية ببساطة في أن الحواسيب هي حاسبات ولا تفهم اللغة أكثر مما تفهمه الآلة الحاسبة من معنى  الرمز باي (π)[1]. إن اللغة البشرية هي شكل من الاختزال لبيئتنا، وحالتنا الطبيعية والعاطفية. فبجملة واخدة، يمكن رسم صورة لما يحدث وكيفية استجابة المرء له. وحالما يفهم المرء الجملة، يقوم بتصوير هذه الأحداث في عقله. وعندما يترجم الحاسوب جملة، فهو ببساطة يقوم بمعالجة سلاسل من الأرقام.

تتمثل قوة الحواسيب في أن لديها أساسا ذاكرة لا محدودة وتذكّر تام. وهذا يمكنها من القيام بعمليات حسابية بقوة عمياء على الملايين من الجمل، واستعلام قواعد البيانات التي تحتوي على بلايين السجلات في جزء من الثانية، وكل الأشياء التي لا يمكن لأي بشر القيام بها. ومع ذلك، فإن الذكاء ليس مجرد ذاكرة.

ستستمر الترجمة الآلية في التحسّن، وخصوصا بالنسبة للغات التي يترجم فيها الناس كثيرا، لأن تلك الترجمات يمكن ادخالها باستمرار إلى محركات الترجمة لزيادة احتمالية وجود ترجمة لنص غير عادي تواجهه كان قد قام بها شخص آخر في مكان ما. وهذه النقطة هي في المقابل قيد جوهري على الحاسوب. يمكن للمرء أن يبني صورة مرئية لما تم وصفه في مشهد ما، وإذا كان ذلك الوصف غير مكتمل، فبإمكانه أن يقوم بتخمين مقبول عن الجزء الناقص. أما الحاسوب فليس لديه هذه القدرة.

وبوضع هذا في الاعتبار، فإن الترجمة الآلية تعتبر أداة عظيمة لقراءة النصوص التي لم يكن من الممكن فهمها خلاف ذلك. ولكنها ليست بديلا عن المترجمين البشر، مثلما لن نتوقع أبدا من حاسوب أن يكتب لنا رواية.

 

الترجمة البشرية مقابل الترجمة الآلية

في أي ترجمة، سواء كانت بشرية أو آلية، يجب أن ينقل معنى النص في لغة المصدر (الأصلية) بالكامل إلى معناه المعادل في ترجمة اللغة الهدف. وبينما يبدو هذا واضحا ظاهريا، فهو غالبا ما يكون أكثر تعقيدا. فالترجمة ليست مجرد استبدال كلمة بكلمة.

يجب على المترجم البشري تفسير وتحليل جميع العناصر داخل النص وفهم كيف يمكن لكل كلمة أن تؤثر على سياق النص. وهذا يتطلب خبرة واسعة في قواعد اللغة، وبناء الجمل (تراكيب الجمل)، والدلالات (المعاني)، وما إلى ذلك، في اللغتين، المصدر والهدف، بالاضافة إلى الخبرة في مجال النص.

كما أن لكل من الترجمة البشرية والآلية حصتهما من التحديات. على سبيل المثال، لن ينتج اثنين من المترجمين ترجمات متطابقة للنص نفسه في نفس اللغتين، كما أن الأمر قد يستغرق جولات تنقيح عديدة لتلبية متطلبات العميل. أما الترجمات الآلية فتواجهها صعوبات في ترجمة العناصر السياقية والثقافية للنص، وتعتمد جودتها على نوع النظام وكيفية تدريبه، إلا أنها فعالة للغاية بالنسبة لأنواع معينة من المحتوى وحالات الاستخدام، التي تشمل على سبيل المثال، المحتوى الميكانيكي المتعلق بمستخدمي السيارات، والنصوص المتكررة، واللغة المنظمة، وغيرها الكثير.

وفي حين تواجه الترجمة الآلية بعض التحديات، فإنها إذا نُفذت بشكل صحيح، سيتمكن مستخدميها من تحقيق فوائد وفورات الحجم عند الترجمة في المجالات التي تناسب الترجمة الآلية.

 

الترجمة الآلية مقابل الترجمة بمساعدة الحاسوب

هناك تمييز مهم بين الترجمة الآلية والترجمة بمساعدة الحاسوب. ففي حين أن هدف (ليس معلنا غالبا اليوم) الترجمة الآلية هو الترجمة الآلية الكاملة ذات الجودة العالية، يتم في مجال الترجمة بمساعدة الحاسوب بحث وتطوير الأدوات والطرق التي تساعد المترجمين البشر في عملية الترجمة. ومن الأمثلة المعروفة والمستخدمة على نطاق واسع في مجال الترجمة بمساعدة الحاسوب هو استخدام أنظمة ذاكرة الترجمة (translation-memory systems). و تجمع أنظمة ذاكرة الترجمة بين واجهة ودية للمستخدم المترجم وقاعدة بيانات تحفظ جميع الترجمات التي تم القيام بها في مشروع معين (ذاكرة الترجمة)، بالاضافة إلى مكون يحلل الوحدات التي سيتم ترجمتها للبحث عن التشابه مع تلك الموجودة في ذاكرة الترجمة. وإذا وجد تشابه يتجاوز أدنى مستوى، فإن النظام يتيح للمترجم تعديل الترجمة، أو في حالة التشابه بنسبة 100٪، يلصقها فقط. وبالتأكيد، فقد تبين أن هذا النوع من الأدوات مفيد بشكل لافت للمترجمين في مجالات الوثائق التقنية أو تعريب البرامج. ولكن بالطبع فإن الترجمة بمساعدة الحاسوب ليست مصممة لترجمة النصوص الأدبية، أما تعريب ألعاب الفيديو فيبدو أنه يقع بين هذه القطبين، لأن نصوصها غالبا ما تكون مزيج من الكتابة التقنية والأدبية. وقد تشتمل المكونات الإضافية لنظام ذاكرة الترجمة على الترجمة الآلية لوحدات ذات أوجه تشابه أقل، كالترجمة الآلية للأرقام، والتواريخ، والعناصر الموضعية الأخرى، أو تنفيذ قواميس المستخدم لإدارة المصطلحات (انظر Seewald-Heeg, 2002).

 

 

تقنية الترجمة الآلية القائمة على القواعد

تعتمد تقنية الترجمة الآلية القائمة على القواعد (Rule-Based Machine Translation Technology) على عدد لا يحصى من القواعد اللغوية المضمنة والملايين من القواميس ثنائية اللغة لكل زوج من اللغات. يقوم نظام الترجمة الآلية القائمة على القواعد بتحليل النص وينشئ تمثيلا انتقاليا يتم من خلاله إنشاء النص في اللغة الهدف. تتطلب هذه العملية معاجم موسعة مع المعلومات المورفولوجية والنحوية والدلالية، ومجموعة كبيرة من القواعد. يستخدم البرنامج مجموعات القواعد المعقدة هذه ومن ثم ينقل البنية النحوية للغة المصدر إلى اللغة الهدف.

يتم بناء أنظمة الترجمة الآلية القائمة على القواعد على قواميس عملاقة وقواعد لغوية معقدة. ويمكن للمستخدمين تحسين جودة الترجمة من خلال إضافة المصطلحات في عملية الترجمة من خلال إنشاء قواميس معرّفة من قبل المستخدم، والتي تتخطى الإعدادات الافتراضية للنظام.

وفي معظم الحالات، هناك خطوتان: استثمار أولي يزيد بشكل كبير من الجودة بتكلفة محدودة، واستثمار مستمر لزيادة الجودة تدريجيا. وفي حين أن الترجمة الآلية القائمة على القواعد قد تنقل شركة إلى مستوى معقول من الجودة، فإن عملية تحسين الجودة عموما تعتبر طويلة ومكلفة ويجب أن يتم تنفيذها من قبل خبراء مدربين. ولقد كان هذا عاملا مساهما في بطء اعتماد استخدام الترجمة الآلية في صناعة التعريب.

 

 

تقنية الترجمة الآلية الاحصائية

تستخدم الترجمة الآلية الإحصائية (Statistical Machine Translation) نماذج الترجمة الإحصائية الناتجة عن تحليل بيانات التدريب أحادية وثنائية اللغة. ويستخدم هذا النهج أساسا القدرة الحاسوبية لبناء نماذج بيانات معقدة لترجمة لغة مصدر إلى لغة أخرى. يتم اختيار الترجمة من بيانات التدريب باستخدام خوارزميات لتحديد الكلمات أو العبارات الأكثر تواترا.

يعتبر بناء نماذج الترجمة الآلية الاحصائية عملية سريعة وبسيطة نسبيا، حيث أنها تنطوي على تحميل ملفات لتدريب المحرك على زوج معين من اللغات في تخصص محدد. ويتطلب تدريب محرك لمجال معين ما لا يقل عن مليوني كلمة، ومع ذلك يمكن للوصول إلى مستوى جودة مقبول بأقل من ذلك بكثير. وتعتمد تقنية الترجمة الآلية الاحصائية على مدونات ثنائية اللغة كذاكرات الترجمة والمسارد لتدريبها على تعلم نمط اللغة، وتستخدم بيانات أحادية اللغة لتحسين طلاقتها. وسيتم اثبات أن محركات الترجمة الآلية الاحصائية لديها جودة إنتاج أعلى إذا تم تدريبها باستخدام بيانات تدريب خاصة بالمجال مثل المجالات الطبية أو المالية أو التقنية.

تستخدم تقنية الترجمة الآلية الاحصائية وحدة المعالجة المركزية بشكل مكثف، وتتطلب تكوين أجهزة واسعة لتشغيل نماذج الترجمة بمستويات أداء مقبولة. وبسبب ذلك، يتم تفضيل الأنظمة السحابية (cloud-base systems)، حيث يمكن أن توسع نطاقها لتلبية مطالب مستخدميها دون اضطرار المستخدمين إلى الاستثمار الضخم في تكاليف الأجهزة والبرمجيات.

 

مقارنة بين الترجمة الآلية القائمة على القواعد والترجمة الآلية الاحصائية

لكل نظام مزايا وعيوب وفقا للغات المستخدمة وتطبيقاته. وعند مقارنة النظامين فإن الاجابة الموجزة تتمثل في أن الترجمة الاحصائية تنتج ترجمات جيدة جدا عندما يكون النظام مدرب بكميات كبيرة بما فيه الكفاية من النصوص. وفي اللغات حيث الحالة كما أسلفنا (من الانجليزية إلى الاسبانية مثلا)، فإن هناك كميات ضخمة من البيانات التي يمكن استخدامها. وتكمن المشكلة في اللغات أزواج اللغات الأخرى حيث يصعب العثور على بيانات كافية، على الأقل في شكل يمكن قراءته آليا، والتي يمكن من خلالها تدريب محرك الترجمة.

 

تتطلب أنظمة الترجمة المبنية على القواعد الكثير من المعالجة لبرمجة المحرك بقواعد اللغة الأساسية، وأهم الأفعال والمفردات، ولكن يمكن أيضا تطويرها إجرائيا. وتعتبر محركات الترجمة المبنية على القواعد خيارا جيدا للغات وثيقة الصلة ببعضها التي لا يختلف فيها الشكل والمفردات جوهريا.

أما إذا وجد مجموعة بيانات لغوية كبيرة كافية، فإن الترجمة الاحصائية مقنعة، ولكن بالنسبة لمعظم أزواج اللغات، فإن البيانات غير موجودة. وفي هذه الحالة يكون الخيار الوحيد هو بناء نظام مبني على القواعد.

وفيما يلي نستعرض بعض مزايا وعيوب كلا النظامين، نظام الترجمة الاحصائي والمبني على القواعد:

  • يمكن للترجمة الآلية القائمة على القواعد تحقيق نتائج جيدة ولكن تكاليف التدريب والتطوير لإنشاء نظام ذو جودة جيدة عالية جدا. أما من حيث الاستثمار، فإن دورة التعديل اللازمة للوصول إلى مستوى الجودة يمكن أن تكون طويلة ومكلفة.
  • يتم بناء أنظمة الترجمة الآلية القائمة على القواعد ببيانات أقل بكثير من أنظمة الترجمة الآلية الاحصائية. وبدلا من ذلك، فهي تستخدم القواميس وقواعد اللغة لتقوم بالترجمة. وهذا يؤدي في بعض الأحيان إلى عدم وجود الطلاقة.
  • اللغة تتغير باستمرار، مما يعني وجوب إدارة القواعد وتحديثها عند الضرورة في أنظمة الترجمة الآلية القائمة على القواعد.
  • يمكن بناء أنظمة الترجمة الآلية الاحصائية في وقت أقل بكثير، وهي لا تتطلب خبراء لغويين لتطبيق قواعد اللغة على النظام.
  • تتطلب نماذج الترجمة الآلية الاحصائية قدرة معالجة حاسوبية حديثة وقدرة تخزينية لبناء نماذج ترجمة كبيرة وإدارتها.
  • يمكن أن تحاكي أنظمة الترجمة الآلية الاحصائية أسلوب بيانات التدريب لتوليد مخرجات مبنية على تواتر الأنماط التي تسمح لها بإنتاج ناتج أكثر سلاسة.

 

 

الأنظمة الهجينة

تحاول النهج الهجينة الجمع بين مزايا عدة أنظمة، وهذا خاصة في حالة الترجمة الآلية الاحصائية. هناك العديد من المقالات التي تصف جمع الترجمة الآلية الاحصائية مع المعالجة النحوية الأولية، وإزالة الغموض الدلالي أو تطبيقات مماثلة. وفي كثير من الأحيان يوسع المزج الطرق نطاق إمكانيات البحث لأزواج اللغات غير المواتية، حيث قد يكون ذلك بسبب الاختلاف القوي من حيث التصريف وترتيب الكلمات، أو بسبب حقيقة أن واحدة أو كلا اللغتين المعنيتين لها موارد أقل. ولكن على الرغم من أن هناك الكثير من الجهد في هذا الاتجاه البحثي، وأن معظم النهج قد حسّنت بالفعل جودة الترجمة (على الأقل قليلا)، لا يبدو أن هناك انفراج في الأفق.

إن قبول تقنية الترجمة الآلية الإحصائية في ازدياد، وهي إلى حد بعيد، الرائد الواضح بين كلا التقنيتين. كما أن توافر الحوسبة السحابية المتزايد يقدم حلا لقوة المعالجة الحاسوبية العالية وقدرات التخزين اللازمة لتشغيل تقنية الترجمة الآلية الإحصائية بشكل فعال، مما يجعل منها أداة لتغيير صناعة التعريب.

 

 

مترجم جوجل أو ميكروسوفت بنج: أيهما أفضل؟

إذا كان المرء يدير عملا تجاريا، فمن الضروري أن يلبي احتياجات كل زبون، وإلا فإن تحقيق الهدف المنشود قد يكون صعبا. ومن أجل الوصول إلى قاعدة أوسع من الزبائن، من المفيد إنشاء موقع يتألف من معلومات بلغات مختلفة. يمكن للمعلومات المقدمة بلغات متعددة أن تصل إلى عدد أكبر من المشاهدين. من الواضح أن تعيين مترجم هو خيار واضح ولكنه خيار مكلف أيضا.

وبالتالي، فإن الترجمة عبر الإنترنت التي يقدمها مترجمي جوجل و بنج (Google and Bing translators) تصبح خيارا ملائما. فهي فعالة وتقدم ترجمة مجانية. ومع ذلك، قبل اختيار أي واحدا منهما، من الأفضل معرفة إيجابياتهما وسلبياتهما ومقارنة وتباين ميزاتهما وأدائهما بحيث يمكن الحصول على فكرة عن جودة مخرجات ترجماتهما النهائية.

كلا خدمتي الترجمة تقدمهما اثنين من شركات التقنية الأكثر شهرة في العالم، وهما جوجل ومايكروسوفت. وكما ذكرنا سابقا، كلاهما مجاني وموجود على صفحة ويب فريدة خاصة به. هدفهما هو مساعدة المستخدمين في الترجمة أثناء عملهم على وثيقة أو عند تصفحهم للإنترنت. كما أنهما مفيدان عندما يحاول المرء فهم معنى أحد العبارات أو الكلمات.

ومع ذلك، يجب على المرء أن يفهم أن الترجمة الآلية تعطي جوهر الوثيقة، ولكن لا يمكن توقع النقاء من الترجمة. فهي قادرة على توصيل الكلمات معا ولكن ليست قادرة بما فيه الكفاية لفهم الجمل تماما. ويمكن أن تكون مفيدة إذا كان المرء يحاول فهم ما إذا كانت الوثيقة تحتوي على معلومات معينة، ولكن قد لا تكون مفيدة كثيرا إذا كان يحاول فهم كيفية ارتباط الموضوع بالوثيقة. ومن ثم لا يمكن لأي من خدمتي الترجمة أن تحل محل الترجمة المهنية البشرية. وكلاهما غير متماسك تماما وغير مقبول في أي ظرف رسمي أو قانوني.

الخدمتين لهما نفس الشكل تقريبا (أنظر شكل 1، 2)، حيث أن كلا شكليهما يتكون من إطارين مستطيلين بجانب بعضهما على موقعه على الانترنت. المستطيل الموضوع على اليسار هو لإدخال المحتوى المطلوب ترجمته، أما المستطيل الذي على اليمين فيعرض المحتوى المُترجم[2]. كما يمكن في كلا خدمتي الترجمة أيضا إدخال عنوان الموقع الذي يوجد به المحتوى الذي يريد المرء ترجمته. وبالإضافة إلى ذلك، يقدم مترجم جوجل للمستخدمين خيار ترجمة وثيقة كاملة عن طريق تحميلها من الرابط الموجود أسفل إطاري الترجمة.

شكل 1: صورة تبين مترجم جوجل

 

شكل 2: صورة تبين مترجم ميكروسوفت بنج

خدمة الترجمة الآلية ميكروسوفت بنج

يمكن لكلا  أداتي الترجمة المجانية الترجمة من عدة لغات وليس من الإنجليزية فقط. هذا يمنح المستخدم حرية ترجمة أي من اللغات المتاحة إلى أي من الترجمات المتوفرة. ومع ذلك، فإن مترجم جوجل مجهز لترجمة عدد كبير من اللغات، حيث أن له القدرة على ترجمة 63 لغة مختلفة. أما مترجم بنج، من ناحية أخرى، فهو قادر على الترجمة في 37 لغة مختلفة.

كما أن لخدمتي الترجمة على الانترنت ميزة خاصة تتمثل في الاكتشاف الذاتي للغة، حيث أنهما يمكّنان المستخدم من التعرف على اللغة التي تحتاج للترجمة آليا في حالة عدم تمكنه من التعرف على اللغة. وبغض النظر عن رؤية النسخة المترجمة، يمكن للمستخدم أيضا سماعها عن طريق خيار الاستماع. كما أنهما يعطيان للمستخدم سلطة اعطاء درجة للترجمات. وبالإضافة إلى ذلك، تسمح كلا الخدمتين للمستخدم بإضافتهما مجانا على موقعه على الانترنت لمساعدة زوّاره. وبينما يوفر بنج خدمة مجانية، فإن جوجل يقدم خدمة مدفوعة أيضا.

إن دقة وسرعة أداتي الترجمة المجانية هي نفسها تقريبا. كما أنهما متأخران كثيرا إذا ما تمت مقارنتهما بالمترجمين البشر، ومن المتوقع وجود أخطاء إذا كانت الجمل أو العبارات التي يتم ترجمتها معقدة. ويمكن في مترجم جوجل اختيار كلمات في الترجمة لرؤية ما إذا كانت هناك بدائل أخرى. هذا يمكن المستخدم من تعديل الترجمة إذا لم تبدو صحيحة في نظره. هذه الميزة مفيدة جدا وهي غير موجودة في مترجم بنج.

ووفقا لمقال في صحيفة نيويورك تايمز، فقد تم مقارنة دقة أشهر ثلاثة خدمات ترجمة آلية على الانترنت. وعند مقارنتها مع مترجمين بشر، وجد أنها بعيدة عن الصحة. ولكن مترجم جوجل كان الأقرب إلى الكمال في حالة الترجمات الاسبانية والفرنسية.

كما قام كل من ستيفن وكارمن هامبشاير وبورتا سالفيا (Hampshire, Porta and Salvia, 2010) بتقييم عشرة أدوات ترجمة آلية مجانية على الانترنت ليبينوا للمستخدمين ما يمكنهم توقعه منها من حيث جودة الترجمة حتى يتمكنوا من اختيار أفضل خدمة ترجمة آلية تتماشى مع نصهم المصدر، وبالتالي انتاج نص هدف بجودة أعلى. وقد تحصل مترجم جوجل في دراستهم على أفضل درجة أداء (20/25)، إلا أنهم وجدوا أنه لا يقوم بترجمة المصطلحات بشكل جيد. ولذلك فقد استنتج الباحثين أن مترجم جوجل هو الأفضل عندما يتعلق الأمر بترجمة النصوص غير المتخصصة، وهم ينصحون المستخدمين بمترجم ميكروسوفت بنج (من بين ثلاثة أخرى) لأنه الأفضل في ترجمة النصوص التي تحتوي على نسبة عالية من التعبيرات الاصطلاحية. ولكن مترجم جوجل كان الأفضل أيضا بالنسبة لمستوى اللغة الرسمي، ولذلك رأى الباحثين أن مترجم جوجل هو الأفضل من بين العشرة أدوات التي قاموا بتقييمها.

 

هناك اختلاف طفيف في واجهات مترجمي جوجل وبنج. تسمح كلتا أداتي الترجمة للمستخدم باختيار كلا من اللغة المصدر والهدف للمحتوى أو الموقع من القوائم المنسدلة الظاهرة أعلى الصفحة. ومن ثم يمكن للمستخدم لصق المحتوى أو عنوان موقع الصفحة في الإطار الذي على اليسار، وتظهر الترجمة في الاطار الأيمن. ولكن في مترجم جوجل، إذا قام المترجم بلصق رابط عنوان صفحة في المستطيل الأيسر، سيظهر رابط آخر في المستطيل الأيمن يوصل إلى صفحة الويب المترجمة.

وكما أسلفنا فإن شكلي الأداتين متشابهتين ويمكن استخدامهما بسهولة، ولكن يبدو أن مترجم جوجل لازال الأقرب إلى الترجمة البشرية.

 

لمحة تقييمية لأشهر أداتي ترجمة آلية على الانترنت

مترجم جوجل – الترجمة الاحصائية (Google Translate: http://translate.google.com)

  • لقد استخدم مترجم جوجل محرك سيتران[3] (SYSTRAN) حتى سنة 2007 عندما طور محرك الترجمة الاحصائية الخاص به.
  • يستخدم جوجل الترجمة الاحصائية التي توظف ارتباط العبارات بين أزواج معروفة من النصوص المتوازية المترجمة مسبقا.
  • هذا بسبب محرك بحث جوجل القوي والقدرة الحاسوبية الهائلة.
  • قام جوجل مؤخرا بتحميل ما يقارب عن 200 بليون كلمة من الوثائق المتوازية الترجمة من أرشيف الأمم المتحدة لتمرين نظامه، مما أدى إلى تحسّن كبير في دقة ترجمته.
  • المشكلة في النهج الاحصائي تكمن في عدم تطبيقه قواعد نحوية واضحة، وذلك لأن خوارزمياته تقوم على التحليل الاحصائي وليس على التحليل المشفر المبني على القواعد.
  • تكمن الفائدة الأساسية من النهج الاحصائي في أن أنظمة الترجمة المبنية على الترجمة تتطلب التطوير اليدوي للقواعد اللغوية التي لا يمكن تطبيقها على اللغات الأخرى، وهذا أمر مكلف جدا ماليا.
  • الأنظمة المبنية على الاحصاء ليست مخصصة لأي زوج معين من اللغات، فهي تحتاج ببساطة إلى كمية هائلة من النصوص المتوازية لتتدرب عليها، وهذا هو السبب في أن جوجل يترجم لأكثر من 60 لغة.

 

مترجم ميكروسوفت بنج – محرك ترجمة احصائية بقواعد خاصة باللغة (Microsoft Bing Translator: http://www.microsofttranslator.com/ )

  • يعتبر مترجم بنج محرك ترجمة آلية احصائي، وهو يعتمد أيضا على مكون مبني على قواعد خاصة باللغة لتفكيك وإعادة تجميع الجمل من لغة إلى أخرى. وتشير شركة ميكروسوفت إلى هذا النظام بالترجمة الآلية الاحصائية المتعلم لغويا (Linguistically informed statistical machine translation).
  • يتضمن هذا النظام الهجين أشجار تبعية محددة للغة لزيادة فعالية نماذج الترجمة الآلية الاحصائية القائمة على العبارات.
  • وبما أن محركات الترجمة الاحصائية تعتمد على مطابقة العبارات في طلب الترجمة مع العبارات الموجودة في قاعدة بياناتها، فهي تفشل عندما يتم استخدام تراكيب نحوية مختلفة، وهو ما يجعل العبارات تأخذ معاني جديدة بسبب أعادة ترتيب الكلمات.
  • وباستخدام الاعراب المحدد باللغة، والتبعية، وقواعد ترتيب الكلمات، فإن نهج محرك مترجم بنج له القدرة على تعميم ترتيب الكلمات لتسهيل معالجة محركات الترجمة الاحصائية، ومن ثم يعيد ترتيب المخرجات لتطابق القصد النحوي للعبارة الأصلية.

 

 

أثر التقنيات الجديدة على المترجمين

لقد كان هناك نقاش طويل حول موضوع ما إذا كانت الترجمة الآلية والترجمة بمساعدة الحاسوب قد تحول المترجمين إلى مجرد محررين، مما يجعلهم أقل أهمية من برامج الحاسوب. أدى الخوف من حدوث هذا إلى رفض معين للتقنيات الجديدة من قبل المترجمين، ليس فقط بسبب احتمال فقدان العمل والمكانة المهنية، ولكن أيضا بسبب القلق بشأن الانخفاض في جودة الإنتاج. ويرفض بعض المترجمين الترجمة الآلية بالكامل، لأنهم يربطونها مع وجهة نظر أن الترجمة هي مجرد منتج آخر يمكن تسويقه على أساس حساب الاستثمار مقابل الأرباح. ويعرفون الترجمة على أنها فن له معايير جمالية خاصة به لا علاقة لها بالربح والخسارة، ولكنها بالأحرى مرتبطة بالإبداع وقوة الخيال. لكن هذا ينطبق في الغالب على أنواع معينة من الترجمة، مثل النصوص الأدبية التي يلعب فيها تعدد المعاني والدلالات والأسلوب دورا حاسما. ومن الواضح أن الحواسيب لم تستطع حتى أن تبدأ في استبدال المترجمين البشريين مع مثل هذه النصوص. وحتى مع الأنواع الأخرى من النصوص، فإن تحليلنا لأدوار وقدرات كل من الترجمة الآلية والترجمة بمساعدة الحاسوب يبين أن كلاهما غير كفء أو دقيق بما فيه الكفاية للتخلص من ضرورة المترجمين البشر. وفي الواقع، فإننا سنكون أكثر دقة إذا وصفنا ما يسمى بالترجمة الآلية بأنها ترجمة بمساعدة الحاسوب أيضا. وينبغي أن يعرف المترجمون ويتعلموا استغلال إمكانات التقنيات الجديدة حتى تساعدهم على أن يكونوا أكثر صرامة واتساقا وإنتاجية بدون الشعور بأنهم مهددين.

يسأل بعض الناس عما إذا كانت التقنيات الجديدة قد أوجدت مهنة جديدة. ويمكن ادعاء أن الموارد المتاحة للمترجم من خلال تقنية المعلومات تنطوي على تغيير في العلاقة بين المترجم والنص، أي طريقة جديدة للترجمة، ولكن هذا لا يعني أن النتيجة هي مهنة جديدة . ومع ذلك، من الواضح أن هناك تطوير لقدرات جديدة، الأمر الذي يقودنا إلى الإشارة إلى عدد من الجوانب الأساسية للحالة الراهنة. إن الترجمة بمساعدة الحاسوب هي بالتأكيد ليست نفس العمل على الورق حصريا ومع المنتجات الورقية مثل القواميس التقليدية، لأن أدوات الحاسوب توفر لنا علاقة بالنص أكثر مرونة من القراءة الخطية البحتة. وعلاوة على ذلك، فقد أنشأت شبكة الإنترنت بوصولها الشامل إلى المعلومات والاتصالات الفورية بين المستخدمين حرية مادية وجغرافية للمترجمين، والتي لم يكن من الممكن تصورها في الماضي. ونحن مقتنعين بأن الترجمة لم تصبح مهنة جديدة، ولكن التغييرات باقية وسوف تستمر في التطور. ويحتاج المترجمون إلى قبول التقنيات الجديدة ومعرفة كيفية استخدامها بأقصى إمكاناتها كوسيلة لزيادة الإنتاجية وتحسين الجودة.

 

 

الخلاصة

لقد أصبحت بيانات التدريب الخاصة بمحركات الترجمة الآلية الإحصائية متاحة على نطاق أوسع، حيث يرجع الفضل في ذلك إلى شبكة الإنترنت والأحجام المتزايدة للمحتوى المتعدد اللغات الذي ينشئه كلا من شركات الإنترنت والمستخدمين من القطاع الخاص. لا تزال المدونات ثنائية اللغة المنظمة ذات الجودة العالية باهظة الثمن وإنشائها يستغرق وقتا طويلا، ولكن بمجرد تكوينها، تصبح أصولا قيمة لأي منظمة تنفذ تقنية الترجمة الآلية الإحصائية، حيث تستفيد الترجمات من وفورات الحجم مع مرور الوقت.

من المهم التأكيد على أن أنظمة الترجمة الآلية لازالت غير قادرة على انتاج نص يمكن استخدامه فورا، وذلك لأن اللغات تعتمد كثيرا على السياق وعلى دلالات ومعاني مختلفة للكلمات وتجمعات الكلمات. وبما أنه ليس من الممكن دائما توفير السياق الكامل داخل النص، فإن الترجمة الآلية مقيدة بمواقف معينة وهي تعتبر أساسا وسيلة لتوفير الوقت، وليس لاستبدال النشاط البشري. كما أنها تتطلب التحرير البعدي لكي تسفر عن نص هدف جيد.

 

 

المراجع

Arnold, D.J., Lorna Balkan, Siety Meijer, R. Lee. Humphreys and Louisa Sadler (19940. Machine Translation: an Introductory Guide. Blackwell Ltd.: UK.

Stephen Hampshire, S., Carmen Hampshire and Porta Salvia (2010). Translation and the Internet: Evaluating the Quality of Free Online Machine Translators. Quaderns. Rev. trad. 17, 2010, 197-209.

Patterson, B. (1982). Multilingualism in the European Community. Multilingua, 1(1):4–15.

[1] الحرف السادس عشر من الأبجدية اليونانية وهو الرمز الذي يمثل النسبة بين طول محيط الدائرة وقطرها (أي، 3.14159265).

[2] هذا يعتمد على لغة عرض الأداة. فإذا كانت العربية هي لغة العرض، فسيكون العكس، أي ان المستطيل الأيمن سيكون مخصص للنص المراد ترجمته والمستطيل الأيسر سيظهر ناتج الترجمة.

[3] نظام ترجمة تم تطويره لأغراض عسكرية في الولايات المتحدة لترجمة الروسية إلى الإنجليزية، وتم اعتماده من قبل الاتحاد الأوروبي في 1976، وله القدرة الآن على الترجمة من وإلى اللغات الآتية: الإنجليزية، الفرنسية، الألمانية، الإيطالية، الإسبانية، البرتغالية، واليونانية. كما أن له قدرة الترجمة أيضا إلى الهولندية، والفنلندية والسويدية. وتستخدمه أيضا منظمة الناتو، وقوات الطيران الأمريكية، وشركة سباشيال الفرنسية للطيران، وعدة شركات عالمية أخرى.

استاذ علم اللغة التطبيقي واللغة الانجليزية في الجامعات الليبية. حصل على الشهادة الجامعية والماجستير من ليبيا، وشهادة في تعليم اللغة الإنجليزية من جامعة سري والدكتوراه من جامعة اسيكس ببريطانيا. قام بنشر ثلاثة كتب والعديد من المقالات والدراسات والأبحاث.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *