ملخص
يستطلع هذا القصل طائفة مختارة من الأساليب الإحصائية التي تستخدم حاليا في الدراسات التجريبية والبحوث القائمة على الملاحظة في علم اللغة. ويغطي اختبارات حسن المطابقة (goodness -of-fit tests) وطرق اختبار الفرضيات الأحادية والمتعددة العوامل (mono-factorial and multifactorial hypothesis testing methods)، وتقنيات توليد الفرضيات. وبالإضافة إلى ذلك، سنناقش في القسمين الرئيسيين لاختبار الأهمية الاحصائية والطرق الاستكشافية، مجموعة واسعة من الطموحات الإحصائية (statistical desiderata)، أي وجهات النظر والطرق التي سيفيد انتشارها أو تبنيها علم اللغة كتخصص.
مقدمة
على مدى العشرين سنة الماضية أو أكثر ، اتخذ علم اللغة منعطفا كميا محددا. ففي حين أن فروعه مثل علم الصوتيات، علم اللغة الاجتماعي، وعلم اللغة النفسي التجريبي قد استخدمت الأساليب الإحصائية لفترة طويلة، فإن العمل في معظم الفروع الأخرى المركزية (علم الكلمات (morphology)، علم بناء الجمل (syntax)، وعلم المعاني (semantics)، على سبيل المثال لا الحصر) لم تستخدم تلك الاساليب الاحصائية إلا منذ تسعينيات القرن العشرين تقريبا. ومما لا شك فيه فإن هذا التحول قد تيسّر بفضل مجموعة متنوعة من التطورات.
على سبيل المثال، لقد تضاءلت هيمنة علم اللغة التوليدي بموقفه الذي لا يشترط حقيقة الأدلة التجريبية أو الاثبات بالملاحظة لأحكام المرء، وأصبحت النظريات الوظيفية والمعرفية، وتلك القائمة على نماذج الاستعمال هي المعتمدة على نطاق أوسع. ولأن هذه النظريات تعتمد كثيرا على البيانات التجريبية، فإن الزيادة في استخدام الأدوات الإحصائية كان نتاج طبيعي لهذه التطورات النظرية.
بالإضافة إلى التحولات النظرية الرئيسية الأخرى في علم اللغة، فإن هناك أيضا تزايد في ميول شاملة إلى (1) دراسة الظواهر اللغوية من منظور كمي بما في ذلك، ولكن ليس على سبيل الحصر، نظرية الاحتمالات، نظرية المعلومات، وغيرها، و (2) حدود متعددة التخصصات، وبالتالي الاهتمام بالتخصصات المجاورة التي تستخدم فيها النمذجة الإحصائية كثيرا مثل علم النفس وعلم الاجتماع، والاتصالات.
وكمثال آخر، فإن التقدم التكنولوجي (أجهزة الكمبيوتر بمعالجات أسرع، والمزيد من ذاكرة الوصول العشوائي، والأقراص الصلبة الكبيرة وكذلك اختراع الشبكة العالمية الواسعة WWW) جعل من الاسهل بكثير تجميع ومعالجة قواعد البيانات اللغوية الكبيرة (corpora) وأنواع أخرى من البيانات الكبيرة. قواعد البيانات اللغوية الكبيرة تكشف بدورها عن بيانات التردد العالي، والتي لا يمكن دراستها بمجرد مشاهدتها بالعين. ولذلك فإن هذا أيضا أدى إلى ازدهار استخدام الإحصاء في جميع مجالات علم اللغة التي يتم فيها دراسة ا قواعد البيانات اللغوية الكبيرة.
ونتيجة لهذه الاتجاهات المتقاربة، فقد تم الآن تأسيس الطرق الكمية في علم اللغة وخلق مجال منهجي نشط. ومع ذلك، نظرا لطبيعة مجال الإحصاء الدائم التطور وحداثة اعتماد الطرق الكمية على نطاق واسع في علم اللغة الذي لا يزال هو الآخر مجال متدفق لأن أفضل الممارسات المعمول بها فيه ما زالت هي الأخرى قيد التطور والتأسيس. يوفر هذا الفصل لمحة عامة عن كيفية استخدام الأدوات الإحصائية في علم اللغة (نظرا لاتساع وتنوع علم اللغة وكذلك جميع الطرق التي يمكن بها استخدام الأساليب الإحصائية. ولذلك، لا يمكننا إلا أن نكون انتقائيين للغاية ونقدم للقراء لمحة بعين الطير. يغطي قسم “طرق اختبار الفرضيات” الأساليب الكمية التي في طبيعتها تختبر الفرضيات، أي أن ذلك يرجع، من بين أمور أخرى، للقيم الاحتمالية[1] (p-values) من اختبارات الأهمية الاحصائية. أما قسم “طرق توليد الفرضيات”، فيتعامل مع مناهج توليد الفرضيات، أي الأساليب التي تهدف إلى كشف أو افتراض الهياكل في البيانات بدون الحاجة لاختبار أهميتها إحصائيا. سيوفر كلا من هذه الأقسام لمحة عامة عن ما يمكن اعتباره الأحدث قبل أن يناقش مجموعة متنوعة من الطموحات (desiderata)، أي الطرق أو التطورات. وفي النهاية سنقوم بتخليص عدد قليل من التطورات العامة التي سيستفيد منها علم اللغة كتخصص.
طرق اختبار الفرضيات
تعتبر الأدوات الإحصائية التي تنتمي إلى مجال اختبار الأهمية الاحصائية للفرضية العدم (null -hypothesis significance testing) هي الأكثر انتشارا في علم اللغة. ويحتاج المرء ضمن هذه المجموعة من الأدوات إلى أن يميز بين اختبارات حسن المطابقة (goodness -of-fit tests) واختبارات الاستقلالية والاختلافات. تتعلق الأولى باختبار ما إذا كانت خصائص مجموعة معينة من البيانات (المتوسط، والانحراف المعياري، التوزيع العام) تختلف عن تلك التي لدى مجموعة بيانات أخرى (على سبيل المثال، بيانات من دراسة سابقة) أو توزيع معروف (على سبيل المثال ، التوزيع الطبيعي بشكل الجرس). أما الأخيرة فيمكن تقسيمها إلى اختبارات أحادية العامل واختبارات متعددة العوامل، حيث ينطوي كلاهما على متغير تابع واحد (أو استجابة أو تأثير)، ولكن التصاميم أحادية العامل تحتوي على متغير واحد مستقل فقط (أو السبب أو الذي يمكن من خلاله التنبؤ) بينما التصاميم متعددة العوامل فتحتوي على أكثر من متغير مستقل واحد. وإن لم تكن هذه مصطلحات إحصائية قياسية، فهي في بعض الأحيان مفيدة كوسيلة ارشادية للتمييز بين نوعين من تعدد العوامل. باعتماد هذا التمييز، يشير تعدد العوامل₁ إلى تصاميم تحتوي على متغيرات مستقلة متعددة ولكن بدون تفاعلات، أما تعدد العوامل₂ فيشير إلى التصاميم التي يوجد بها متغيرات مستقلة متعددة قد تتفاعل مع بعضها البعض.
سنقوم في الأقسام التالية بمسح الطرق الأحادية العوامل والمتعددة العوامل، ولكن نظرا لحقيقة أنه ليس هناك أي ظاهرة لغوية وحيدة العامل حقا في الطبيعة، ووفقا لهذه الحقيقة فإن الحقل يتحرك باتجاه الاختبار متعدد العوامل، ولذلك فسيكون تركيزنا على هذا النوع الأخير من الطرق.
اختبارات حسن المطابقة الشائعة الاستعمال
يمكننا تقريبا القول أن جميع الاختبارات الإحصائية تنطوي على واحد من الإحصائيات الخمسة التالية:
• التوزيعات
• الترددات
• المتوسطات (مثل المتوسط الحسابي أو الوسيط)
• التشتت (مثل الانحرافات المعيارية أو نطاقات الشرائح الربعية)
• الارتباط (مثل اختبار معامل كارل بيرسون للارتباط أو معامل كندال).
وهكذا، فيمكن لكل من هذه الإحصاءات تصور اختبارات حسن المطابقة[2]. وربما يشمل الاختبار الأكثر شيوعا للتناسب الجيد اختبار التوزيعات، وبشكل أكثر تحديدا ما إذا كانت البيانات موزعة بشكل طبيعي، أي ما إذا كان الرسم البياني على شكل جرس متماثل. يتكرر هذا السيناريو لأن العديد من الاختبارات الإحصائية تتطلب أن أن تكون البيانات التي يتم اختبارها تظهر هذا الشكلـ وإلا فإن اختبارات أهميتها الاحصائية ستسفر عن نتائج ليس لديها موثوقية ولا يمكن الاعتماد عليها. يجسد الشكل رقم 1 هذا السيناريو، حيث ربما يكون الباحث قد جمع البيانات التي يمثلها الرسم البياني ومنحنى الكثافة المتقطع، ويحتاج الباحث الآن إلى تحديد ما إذا كانت البيانات مشابهة بما فيه الكفاية للمنحنى الطبيعي الثقيل حتى يتأكد أن بياناته موزعة بشكل طبيعي.
ومع ذلك، فإن هناك اختبارات للمطابقة الجيدة متاحة للإحصاءات الأربعة الأخرى أيضا. يتضمن أحد الأمثلة للترددات اختبار ما إذا كانت الترددات التي يختار بها متعلمي اللغة الأجنبية ثلاثة أفعال مساعدة في تجربة لتعبئة الفراغات تختلف اختلافا كبيرا عن خيارات الناطقين الأصليين في دراسة سابقة. وكمثال عن المتوسطات فربما ينطوي ذلك على اختبار ما إذا كانت متوسطات متعلمي اللغة الأجنبية في حكمهم على قبول عدد من الجمل يختلف كثيرا عن متوسط أحكام قبول الناطقين الأصليين بها في بيانات سبق دراستها. وكمثال لعلاقات الارتباط، فربما يتضمن ذلك اختبار ما إذا كانت العلاقة بين عمر الطفل ومتوسط طول كلام الطفل بالكلمات في قاعدة بيانات هو نفسه لأطفال آخرين من قاعدة بيانات مشابهة.
اختبارات الاستقلالية والاختلافات الشائعة الاستخدام
يتضمن النوع الأكثر شيوعا للسيناريو الإحصائي كل من المتغيرات التابعة والمستقلة، وعادة ما يكون الاختبار الإحصائي للمتغير التابع واحدا من الخمسة المذكورة أعلاه.
التصاميم أحادية العامل Monofactorial Designs
في اختبارات الفرضية أحادية العامل، يكون المرء عادة مهتم بما إذا كانت قيمة الاختبار الإحصائي للمتغير التابع معتمدة على قيمة المتغير المستقل. بعبارة أخرى، فإن السؤال هو: هل قيم المتغير المستقل تسبب اختلافا في تلك الخاصة بالمتغير التابع؟ أحد الأمثلة لاختبار الاستقلالية والاختلافات للتوزيعات سيكون السؤال عما إذا كان يتم توزيع أوجه التشابه في مصدر الكلمات الممزوجة (على سبيل المثال، brunch في الانجليزية عن breakfast and lunch) بشكل مختلف عن أوجه الشبه في مصدر كلمات القصاصات المعقدة (على سبيل المثال، sysadmin في الانجليزية بدلا عن system and administrator). إذا كان المرء ليس مهتما بما إذا كان متوسط أوجه التشابه للكلمة المصدر مختلفا، ولكنه مهتما فقط بالتوزيعات الإجمالية لأوجه الشبه للكلمة المصدر (هل القيم الأكبر أكثر هي للكلمات الممزوجة؟)، فعندها يمكن للمرء أن يجري اختبار كولموجوروف – سميرنوف (Kolmogorov–Smirnov test). أما إذا كان المرء مهتم بالاختلاف في متوسط أوجه تشابه الكلمة المصدر للكلمات الممزوجة والقصاصات المعقدة، فعندئذ ربما يمكن للمرء إجراء اختبار ت (t-test) للعينات المستقلة. إذا كانت أوجه الشبه للكلمة المصدر غير موزعة طبيعيا ولديها تباينات مختلفة، فيمكن للمرء اجراء اختبار يو (U-test).
وكمثال على اختبار الاستقلالية والاختلافات للتشتت هو السؤال ما إذا كانت مجموعتين من المشاركين (متعلمي اللغة الأجنبية الناطقين الأصليين بها) ينتجون جمل بطول مختلف (لأنه، ربما، القدرة العالية للناطقين بها تسمح لهم باستعمال جمل أطول أكثر بسبب وسائل أسلوبية وتعبيرية)؛ يمكن اختبار هذا السؤال، إذا تم استيفاء شروط معينة، بإجراء اختبار ف (F-test) لتجانس التباين.
وأخيرا، غالبا ما يتم تطبيق اختبار الترددات من أجل الاستقلالية والاختلافات على الجداول التكرارية مثل الجدول رقم 1. إذا سئلنا 100 مشارك “في أي وقت يغلق متجركم؟” وسئلنا 100 مشارك آخرين “أي وقت يغلق متجركم؟” ولاحظ المرء الترددات التي تلقى بها المرء الإجابات التي تحتوي على حرف الجر “في الخامسة” وبدون حرف جر “الخامسة”، فعندها يمكن للمرء اختبار الجدول الناتج رقم 1 بإجراء اختبار مربع كاي، الذي سيؤدي هنا لنتيجة ذات دلالة إحصائية تشير إلى أن المشاركين الذين يفضلون استخدام حرف الجر “في” عند تقديم السؤال لهم بحرف الجر “في”.
تشترك كل الاختبارات المذكورة أعلاه في أن البيانات التي يتم تقييمها كلها مستقلة. على سبيل المثال، لا يوجد مشارك أو أي كلمة توفر أكثر من نقطة بيانات واحدة. في الحالات التي ليست هكذا، كما هو الحال عندما يأخذ المشاركين اختبار قبل وبعد المعالجة، فهناك بدائل للعديد من الاختبارات المذكورة أعلاه.
التصاميم متعددة العوامل Multifactorial Designs
وكما ذكرنا أعلاه، فإن التصاميم الإحصائية في العديد من فروع علم اللغة تعتبر الآن أكثر إنصافا لحقيقة أن الخيارات اللغوية هي حتما دائما ستكون متأثرة بأسباب متعددة. ونتيجة لذلك، أصبحت الطرق متعددة العوامل الآن شائعة أكثر من أي وقت مضى. تتعلق معظم مثل هذه الدراسات تنطوي على أنواع مختلفة من نماذج الانحدار[3]، التي يمكن اعتبارها أحدث التوصل إليه في هذه المرحلة:
• النمذجة الخطية (linear modeling)، وهو نوع من الطرق يمكن أن تكون فيه المتغيرات المتنبئة فئوية أو رقمية بحيث يكون المتغير التابع هو الرقمي. في المراجع التقليدية، يمكن معالجة مثل هذه النماذج تحت اسم تحليل التباين[4] (analysis of variance) أو تحليل التباين المشترك (analysis of covariance).
• النمذجة الخطية المعممة، وهو نوع من الطرق تكون فيه المتغيرات المتنبئة فئوية أو رقمية وحيث يمكن للمتغير التابع أن يكون من أشكال مختلفة: ثنائي، ترتيبي، فئوي، اسمي متعدد، أو ترددات، مما يُبرز الحاجة إلى الانحدار اللوجستي الثنائي (binary logistic regression)، الانحدار اللوجستي الترتيبي (ordinal logistic regression)، الانحدار متعدد الحدود (multinomial/ polytomes regression)، وانحدار بويسون (Poisson regression) على التوالي (بالمعنى الدقيق للكلمة، الانحدار متعدد الحدود[5]ليس نوعا من النمذجة الخطية المعممة، ولكن من أجل التبسيط ولأنه يرتبط ارتباطا وثيقا بسلسلة من الانحدارات اللوجستية الثنائية، فقد تم تضمينه هنا في هذه النقطة). لاتزال هذه العملية تنطوي على النمذجة الخطية بعد تطبيق ما يسمى دالة الربط على المتغير التابع (وهو ما يضمن أن النموذج لا يولد سوى التوقعات المعقولة، على سبيل المثال، لا يمكن توقع قيم سلبية للترددات).
النوع الثاني من النمذجة هو أكثر تحديا إحصائيا، ولكنه غالبا ما يكشف أكثر أيضا لأن العديد من الدراسات أظهرت أن المتغيرات المستقلة يمكنها أن تتفاعل بطرق معقدة جدا. غالبا ما يبدأ الباحثين بنماذج أكبر ثم يستخدمون آليات إحصائية مختلفة مثل اختبارات الأهمية أو معايير المعلومات لخفض النموذج الأكبر في عملية تسمى اختيار النموذج أو بما يسمى نموذج الحد الأدنى الملائم، وهو النموذج الذي، مع بعض التبسيط، يحتوي على كل المتغيرات المتنبئة فقط التي ترتبط احصائيا بشكل كبير مع المتغير التابع.
تعتبر تحليلات الانحدار أدوات متنوعة قوية جدا ويتم تطبيقها الآن على العديد من مجموعات البيانات التجريبية وبيانات الملاحظة (ولكن انظر أدناه). على سبيل المثال، يتم تحليل المتغيرات التابعة التي هي عدد مرات لرد فعل أو أحكام قبول بنماذج الانحدار الخطي. لقد تم دراسة المتغيرات الثنائية في الكثير البدائل النحوية (مثل اختلاف صيغة المجرور، وموقع الأداة، وجنوح حرف الجر، والتحليل مقابل المقارنات الاصطناعية، وغيرها) باستخدام الانحدار اللوجستي الثنائي. أما المتغيرات التابعة بأكثر من مستويين فقد تمت دراستها بالانحدار المتعدد الحدود. فعلى سبيل المثال، التحليل الدلالي الذي تكون فيه عدة مرادفات متقاربة هي الخيار الأكثر احتمالا نظرا لسياق معين، والسبب في ذلك.
يفترض نوعي النمذجة المذكورين أعلاه أن كل نقاط البيانات مستقلة عن بعضها البعض. ولكن نادرا ما يكون هذا هو الحال، لا سيما في البيئات متعددة العوامل. فمثلا قد يقدم المتكلمين أكثر من واحدة استجابة في التجربة، وربما يستجيب أكثر من مشارك واحد للأفعال ، ويمكن أن يوفر المؤلف أكثر من خيار لتركيب واحد في ملف قاعدة البيانات، وما إلى ذلك. وفي الوقت نفسه، فإن هذه المتغيرات الثلاثة (المتكلم، الفعل، والمؤلف) مختلفة نموذجيا عن متغيرات مثل زمن الاختبار (الاختبار القبلي مقابل الاختبار البعدي)، جنس المتكلم (ذكر مقابل أنثى)، أو الحياة أيضا (حي مقابل جماد). تغطي مستويات المتغيرات الأخيرة (غالبا ما تسمى الآثار الثابتة) كل الاحتمالات التي يتوقع وجودها المرء في مجتمع الدراسة، أما مستويات المتغيرات السابقة (غالبا ما تسمى الآثار العشوائية) فلا تغطي سوى (مثاليا عشوائية) عينة من المتكلمين، والأفعال، أو المؤلفين الذين تم تضمينهم في الدراسة على الرغم من أن الباحث قد يريد على الارجح أن يعمم إلى ما وراء مجموعة من المتحدثين، والأفعال، أو المؤلفين الذين قام باختبارهم.
التعامل مع هذا النوع من السيناريو يتطلب تعديلات على هذا النوع من النمذجة الخطية (المعممة) التي تتطلب استقلالية نقاط البيانات. منذ فترة من الزمن، تأثرت الدراسات التجريبية في علم اللغة النفسي تأثرا كبيرا بعمل كلارك (Clark, 1973) وفورستر وديكنسون (Forster and Dickinson, 1976)، اللذان يعتبران من المناقشات الأولى المُستشهد بهما على نطاق واسع في هذه المشكلة في علم اللغة النفسي. لكن النهج الحالي في علم اللغة ينطوي على ما يسمى نمذجة الآثار المختلطة (الخطية المعممة)، أو النمذجة متعددة المستويات (multilevel modeling). تتناول هذه النماذج التابعية بالأخذ في الاعتبار التباين المرتبط بالآثار العشوائية. لنأخذ مثلا سيناريو يتم فيه نمذجة متغير تابع واحد كدالة لمتغير مستقل واحد على أساس عشرة نقاط من البيانات من ثلاثة متحدثين لكل منها. يمثل الشكل 2 النموذج الخطي العادي لبعض البيانات في الجزء الأيسر (الأرقام 1، 2، و 3 تمثل نقاط بيانات المتكلمين)، ومن الواضح أن النموذج الخطي لا يمكن أن يفسر البيانات بشكل جيد. في الجزء الأيمن، يتم تطبيق نموذج الآثار المختلطة الخطي على نفس البيانات حيث يحصل كل متكلم على جزئه الخاص ولكنهم جميعا يشتركون في نفس المنحدر. في هذا الجزء، يعكس الخط المتقطع الاتجاه العام والخطوط الثلاثة المستقيمة هي خطوط الانحدار المنفصلة لكل متكلم، حيث تم تمثيل الفرق بين الاتجاه العام وخط الانحدار للمتكلم 3 بالسهم. ومرة أخرى، نجد أنه من الواضح أن هذا النموذج، والذي يأخذ العلاقة بين نقاط البيانات من أحد المتحدثين في الاعتبار، يفسر البيانات تفسيرا جيدا.
هناك نسخ معقدة أكثر لنموذج الآثار المختلطة متوفرة، على سبيل المثال، النماذج التي لا يحصل فيها المتكلمين على قراءتهم الخاصة فقط، بل على المنحدرات الخاصة بهم أيضا، كما يمكن تضمين هذه التعديلات للمتغيرات العابرة والمتداخلة مما يجعله أسلوب قوي جدا و شائع في طائفة واسعة جدا من الدراسات التجريبية وبحوث الملاحظة. وبينما ما يزال العمل جاريا حاليا على بعض التفاصيل (كيفية حساب القيم ف p-valueللمتغيرات المتنبئة في بعض النماذج، وكيفية القيام باختيار نموذج بتأثيرات مختلطة، وكم من الآثار العشوائية المختلفة يمكن تضمينها، وما إلى ذلك) فإن نمذجة الآثار المختلطة ستصبح حتما واحدة من أهم أدوات المهنة.
وفي حين أنه قد تكون نماذج الانحدار الأداة الأكثر انتشارا للتحليل الإحصائي المتعدد العوامل، هناك طريقة أخرى آخذة في الانتشار تسمى أشجار الانحدار والتصنيف (classification and regression trees) أو الطرق ذات الصلة، ولكنها أكثر تقدما، مثل الغابات العشوائية (random forests). تقوم هذه الأشجار على فكرة تقسيم البيانات تباعا بطريقة ثنائية بحيث يقوم كل قسم بتنسيق البيانات على أساس متغير مستقل واحد إلى مجموعتين يمكنها التنبؤ بسلوك المتغير التابع بشكل أفضل. مخرجات هذا التحليل هو عادة دقة التنبؤ والتصنيف وقرار يشبه هيكل الشجرة تشبه والمحلل يترجم الشجرة بطريقة من أعلى إلى أسفل لمعرفة أي انقسامات للمتغير تفسر المتغير التابع. تُستخدم هذه الطريقة أحيانا كاستباق استكشافي لنمذجة الانحدار، ولكنها قد تكون أيضا توضيحية في حد ذاتها.
الطموحات
لقد تطور مجال علم اللغة بشكل كبير فيما يتعلق بعدد وتعقيد تقنيات اختبار الفرضيات التي يتم استخدامها الآن بانتظام. ومع ذلك، نظرا لحداثة هذا التطور، فإن العديد من التقنيات المذكورة أعلاه تحتاج إلى بلورة أكثر في كيفية تطبيقها على البيانات اللغوية ولكي تترسخ أكثر بين عدد أكبر من الممارسين. وبالإضافة إلى هذه التطورات، هناك أيضا حاجة إلى أن يتعرف علماء اللغة على العديد من التقنيات التي يتم تطبيقها بالفعل بانتظام في المجالات التي تكافح مع بيانات تشكل نفس التحديات التوزيعية الدقيقة التي تواجه علماء اللغة كل يوم. يتم ذكر علم النفس نموذجيا كواحد من أقرب الحقول المجاورة التي قد تلهم أدواته الإحصائية علماء اللغة (على الرغم من أن مجال البيئة ربما قد يكون أحد أفضل المنافسين (راجع Zuur et al., 2007, 2009 للحصول على أمثلة). سيرسم هذا القسم الخطوط العريضة لعدد قليل من الطرق التي يجب أن يوليها علماء اللغة مزيدا من الاهتمام، نظرا للكيفية التي يمكن أن تساعد بها في معالجة البيانات والأسئلة التي يصعب في بعض الأحيان معالجتها بالأدوات التي تم توطيدها حاليا.
أحد التحسينات البسيطة جدا ولكنها لا تزال مفيدة للغاية تنطوي على إدراك علماء اللغة العميق لقوة طرق الانحدار. على سبيل المثال، إذا ما أجرى باحث دراسة على قاعدة بيانات نصية وعرض بياناته في جدول ترددي 2 x 2 ثم أراد مقارنة هذه النتائج بجدول ترددي 2 x2 آخر من دراسة سابقة لشخص آخر، فإنه قد يلجأ إلى اختبار مربع كاي[6] لعدم التجانس لمعرفة ما إذا كانت كلا مجموعتي البيانات تمثل نفس مجتمع الدراسة. ولكن هذا ليس مرهق إلى حد ما فقط، بل أن اختبار مربع كاي لعدم التجانس لا يعمم أيضا إلى الجداول التكرارية (أو الترددات) التي يوجد بها أكثر من صفين وعمودين > 2 x c 2 > r. بدلا من ذلك، قد يكون الحل الطبيعي هو مجرد تحليل البيانات بالانحدار واختبار ما إذا كان المتغيرين الين تم اختبارهم باختبار مربع كاي يتفاعلان أيضا مع متغير ثالث الذي يشير إلى الدراسة التي منها البيانات. إذا لم يكن هناك تفاعل ثلاثي له أهمية احصائية، فعندها يمكننا القول أن مجموعتي البيانات تمثل نفس مجتمع الدراسة، وإلا فهي لا يمكن أن تمثله. وهكذا، في حين أن المرء قد يشعر كأن الأمر مبالغ فيه بإجراء الانحدار اللوجستي الثنائي عندما يكون اختبار مربع كاي مناسبا تماما، فإن اعتماد منظور الانحدار يسمح للمرء بمتابعة مجموعة واسعة من المسائل بنهج واحد من النمذجة الموحدة. (انظر أدناه للحصول على مثال آخر مشابه).
بينما يكون فهم بعض مجموعات البيانات بالانحدارات مفيد بالفعل، هناك بالطبع ملحقات وطرق إضافية أيضا. بعض من هذه الملحقات والطرق تعتبر وثيقة الصلة بطرق الانحدار. يسمح أحد أنواع هذه الملحقات المفيدة للباحثين بالتعامل مع الانحناء في البيانات أو التأثيرات اللا خطية. ومن الأمثلة على ذلك هو شمل المصطلحات الاسمية المتعددة في تحليلات الانحدار، والمثال الآخر هو نمذجة الاضافة المعممة (generalized additive modeling). أنظر في الشكل رقم (3) للبيانات عن تكرار أحد تراكيب اللغة الانجليزية (keep V-ing construction) في قاعدة بيانات تايم (TIME) (من Hilpert, 2011). في حين يظهر الجزء الأيسر أنه من الممكن أن يلائم الانحدار الخطي البسيط لهذه البيانات (وحتى الحصول على نتيجة مهمة احصائيا)، يظهر الجزء الأيمن أن الاسمي المتعدد حتى الدرجة الثالثة يوفر ملائمة أفضل بكثير مع البيانات ويشير إلى اتجاه النمو بعد عام 1995 يبدو بشكل أفقي.
التقنية الأخرى التي قد ينظر علماء اللغة في استخدامها أكثر هي اختبار الفرضية الخطي العام (general linear hypothesis test). هذا هو الاختبار التي يمكن استخدامه كتحليل متابعة لنموذج الانحدار الذي ينطوي على الأقل على متغير فئوي مستقلة واحد مع ثلاثة أو أكثر من المستويات. حتى إذا كان هذا المتغير الفئوي يساهم كثيرا في المتغير التابع، فإن هذا لا يعني الحاجة للحفاظ على جميع مستوياته. على سبيل المثال، قد يميز الباحث خمسة مستويات من الحياة في ترميزه لبيانات قاعدة البيانات النصية (على سبيل المثال، الإنسان والآلهة، حي ولكن ليس إنسان، والنباتات، والأشياء الملموسة، والكيانات المجردة) و قد يكون متغير الحياة مهم كثيرا. عندها يمكن للمرء استخدام اختبارات الفرضية الخطية العامة لتحديد ما إذا كانت كل مستويات الحياة الخمسة تختلف عن بعضها البعض أو ما إذا كان قانون أوكام[7] (Occam’s Razor) يتطلب في الواقع الخلط بين الأولين والاثنين اللذان بعدهما، والذي من شأنه أن ينتج نسخة جديدة من الحياة بثلاثة مستويات فقط.
ومن المثير للاهتمام، كما ذكر أعلاه، هذا المنطق لا ينطبق أو سيفيد نماذج الانحدار المتعدد المعقدة فقط، بل على العكس، فمثلا بدلا من اختبار جدول تكراري 4 x2 باختبار مربع كاي، يمكن للمرء تحليل هذه البيانات بانحدار بويسون[8]ومتابعته باختبارات الفرضية الخطية العامة لتحديد ما إذا كانت جميع المستويات الأربعة للمتغير المستقل ضرورية أو مبررة في الواقع.
إذن، هناك العديد من الأدوات الإحصائية التي لديها امكانات هائلة يمكن الاستفادة منها في علم اللغة. احدها هو التعلم التمييزي البسيط (naïve discriminative learning) كما ناقش باين (Baayen, 2010). الهدف العام مشابه جدا لتلك التي لنمذجة الآثار المختلطة (المعممة)، ولكن على عكس نماذج الانحدار، تستند هذه الخوارزمية على نموذج التعلم البشري الاحتمالي والمعادلات المتجذرة في البحث حول التعلم الترابطي. وكما يوضح باين بينما يكون التعلم التمييزي البسيط متجذر معرفيا أفضل من نماذج الانحدار التقليدية، فهو ينجز تصنيفات دقيقة مقارنة بالنماذج الأخرى، ويمكنه حتى التعامل مع التأثيرات العشوائية بطرق ثاقبة.
تشمل المجموعة الأخرى من الأدوات المتعلقة بالطرق المصممة لمعالجة مسألة العلاقات السببية بين المتغيرات المتنبئة والاستجابات. بالمعنى الدقيق للكلمة، تتعامل نماذج الانحدار من النوع المذكور أعلاه فقط عما إذا كان هناك ارتباط مهم احصائيا بين العامل المتنبئ من جهة والاستجابة من جهة أخرى. ولكن التقنيات مثل نمذجة المعادلة الهيكلية[9] (structural equation modeling) أو شبكات النظرية الافتراضية[10] (Bayesian networks) تساعد على دراسة العلاقات السببية بطريقة أفضل عن طريق إجبار الباحث على صياغة توقعات صريحة حول الكيفية التي ترتبط بها العوامل المتنبئة مع بعضها البعض وارتباطها مع المتغير التابع. على سبيل المثال، من المعروف أن العديد من بدائل التراكيب النحوية مثل اختلاف صيغة المجرور أو موضع الأدوات ترتبط مع المتنبئات الصوتية (على سبيل المثال، التشديد وطول المقطع الصوتي)، والمتنبئات النحوية (على سبيل المثال، الوضوح والتعقيد)، والمتنبئات الخطابية الوظيفية (على سبيل المثال، الإشارة إلى الأسماء والضمائر). ومع ذلك، كل هذه العوامل المتنبئة مرتبطة مع بعضها البعض، مما يسبب مشاكل ليس لمعظم نماذج الانحدار فقط، ولكن يجعل من الصعب أيضا فصل العلاقات بين السبب والنتيجة. إن تطبيق أنواع الأدوات المذكورة أعلاه يتطلب من الباحث افتراض، مثلا، أن خصائص الخطاب الوظيفية هي أسباب للنتائج الصوتية والنحوية، والتي بدورها أسباب للخيارات البنائية التراكيبية، وليس التعامل مع كل المتنبئات على أنها مجرد أسباب واعتبار أن الخيارات البنائية النحوية هي النتيجة. وبما أننا عادة مهتمين بالعلاقات السببية فقط فإن هذه التقنيات تعتبر واعدة.
أخيرا، فإن التوصية العامة هي أن علماء اللغة قد يريدون أن يصبحوا على دراية أكثر بمجال الإحصاء القوية[11](راجع Wilcox, 2012). بما أن البيانات اللغوية نادرا ما تتصرف بشكل جيد من حيث التوزيع الطبيعي (بدلا من ذلك، العديد من الظواهر لها توزيع زيبف[12])، ومن حيث القيم المتطرفة (غالبا ما يكون للعديد من المتغيرات اللغوية مثل الأطوال والترددات قيم متطرفة)، ولأن البيانات المصنفة غالبا ما تختلف في توزيعها، الخ، فإن الاحصاء القوية توفر طرق لتحليل البيانات بمثل كل هذه الخصائص التي تقوض استخدام الأدوات الإحصائية العادية المنتشرة حاليا.
طرق توليد الفرضيات
كل التقنيات التي ناقشناها حتى الآن يتم توظيفها عادة لإخضاع الفرضيات لاختبار الأهمية الاحصائية وتحديد الفرضية التي سنتبناها وفقا للقيمة الاحتمالية (p-value). هناك مجموعة مختلفة من التقنيات تعتني بتوليد الفرضيات في المقام الأول. أي أن هذه التقنيات تخدم مهام استطلاعية وغالبا ما يتم تطبيقها على مجموعات البيانات التي يتحدى حجمها وتعقيداتها عيون المحلل ومهاراته في مطابقة الأنماط. وكما فعلنا أعلاه، سوف نبدأ هذا القسم بمناقشة ما يمكن أن نعتبره الطرق الأكثر استخداما حاليا، وبعدها سنتحول إلى بعض التحسينات والطموحات التي من شأنها أن تعود بالنفع على مجال علم اللغة. وكما ذكرنا من قبل، نظرا إلى أن عدد التقنيات كبير، فإن اللمحة التي سنقدمها تستوجب أن تكون انتقائية جدا.
الطرق الاستكشافية الشائعة الاستخدام
ربما تكون التقنية الاستكشافية الأكثر انتشارا هي التحليل العنقودي الهرمي[13] (hierarchical cluster analysis). مثل معظم الطرق الاستكشافية، فإن هذه أيضا تطبق عادة بنية تحديد الكيفية التي يمكننا بها تصنيف عدد من الكيانات ن (جمل، عبارات اسمية، كلمات، فاعل، الخ) في مجموعة أو عنقود م < ن التي تظهر تشابه كبير في نفس المجموعة وأوجه شبه أقل مع المجموعات الأخرى.
يتضمن التحليل العنقودي الهرمي عدة خطوات: أولا، يتم حساب مدى التشابه بين كل عنصر من العناصر ن لكل عنصر آخر على أساس معيار التشابه الذي يحدده الباحث أو المحلل. عادة ما يتم عرض نتائج هذه الخطوة في مصفوفة للتشابه والاختلاف. على عكس الأدوات الاستكشافية الأخرى، يمكن مقارنة العناصر حتى لو كانت تنطوي على كلا من الخصائص الفئوية والرقمية (على الرغم من أن الخصائص الرقمية هي الأكثر شيوعا). ثانيا، يتم بواسطة عملية تكرارية تحديد أزواج من العناصر وفقا لأعلى قيم التشابه ودمجها في مجموعات.
حالما يدخل عنصر ما في مجموعة، فإنه لا يمكن بعدها النظر إليه كعنصر منعزل (الذي ينظر إليه في الاندماج المقبل هو إذن المجموعة الجديدة التي تشكلت). في النوع الأكثر شيوعا من التحليل العنقودي الهرمي، تتكرر هذه العملية حتى يتم دمج جميع العناصر في مجموعة واحدة. ثالثا، يتم عرض هذه العملية فيما يسمى الشجرة البيانية[14] (dendrogram) وعلى الباحث أن يقرر كم من المجموعات (العناقيد) تعكسها الشجرة البيانية بوضوح أكثر. ويعرض المثال في الشكل (4)، والذي هو نتيجة لتجميع سبعة أسماء على أساس ترددات الكلمات التي تقع معا في قاعدة بيانات نصية. كلا من الاعتبارات الدلالية (العنقود الأيسر يحتوي على أسماء المعادن النفيسة، والأيمن يحتوي على اسماء لها علاقة بالطعام) والتشخيصات المتابعة التي سنذكرها أدناه تشير إلى افتراض أن العنقودين المحاطين بالمربعين الرماديين هما الأكثر فائدة هنا.
إن التحليل العنقودي الهرمي يعتبر أداة مرنة جدا، وهي مناسبة لعدد كبير جدا من الأنواع المختلفة لكل من البيانات التجريبية وبيانات الملاحظة، وغالبا ما يكون تفسيره بسيط نسبيا، كما أنه أصبح يتكرر على نحو متزايد في البحوث اللغوية.
التقنيات الأخرى المتكررة هي تحليل المركبات الرئيسية ((principal component analysisوتحليل العوامل الرئيسية (principal factor analysis). تحليل المركبات الرئيسية أو تحليل العنصر الرئيسي هو عبارة عن عملية رياضيّة لتحليل البيانات تتمثل في تحويل عدد من المتغيرات المترابطة إلى عدد أقل من المتغيرات غير المترابطة. تسمى المتغيرات الناتجة عن عملية التحويل بالمركبات (أو المكونات أو المحاور) الرئيسية. القيمة المضافة للعملية هي تسهيل تأويل المعطيات المعقدة، عبر تمكين الباحث والإحصائي من تحقيق أمثل توافق بين التقليل من عدد المتغيرات الواصفة للمعطيات، و فقدان المعلومة الأصلية (التباين) الناتج عن اختزال الأبعاد الأصلية. الهدف العام لتحليل المركبات الرئيسية مشابه تماما لهدف التحليل العنقودي الهرمي ، ولكن الرياضيات الأساسية مختلفة تماما، حيث يتم تطبيق تحليل المركبات الرئيسية لجميع البيانات الرقمية فقط. إدخال البيانات هو نفسه في التحليل العنقودي الهرمي ولكن تحليل المركبات الرئيسية يتقدم بحساب كل العلاقات البينية (intercorrelations) الممكنة بين عدد ن من العناصر (الأعمدة) التي تجري دراستها. ثم، يقوم تحليل المركبات الرئيسية بدمج ( ضغط) العناصر ن (الأعمدة) في مكونات رئيسية م < ن ، بحيث تكون العناصر (الأعمدة) ضمن المكونات الرئيسية مرتبطة فيما بينها كثيرا، ولكن عادة ما تكون كل المكونات الرئيسية متعامدة مع بعضها البعض، أو مستقلة عن بعضها البعض. هذا يمكن أن يعني، على سبيل المثال، أن تحليل المكونات الرئيسية سيقوم بتحويل مجموعة من البيانات التي تصنف الأسماء وفقا للخصائص ن ¼ 20 في مجموعة بيانات جديدة بحيث، مثلا، لا تحتفظ سوى أربعة مكونات رئيسية بأكثر من 90٪ من المعلومات من أصل العشرين (20) عمود. هذا النوع من النتائج هو السبب في تسمية تحليل المكونات الرئيسية والطرق الأخرى المماثلة (القياس المتعدد الأبعاد أو تحليل المراسلات، مثلا) بطرق الحد من الأبعاد. يمكن للباحث بعد ذلك تحليل طبيعة المكونات الرئيسية فقط (ما هي الخصائص اللغوية التي تشكل المكونات الرئيسية ولماذا؟)، وغالبا ما يتم تسهيل هذه المهمة التفسيرية بعرض مرئي ثنائي الأبعاد للنتائج مثلما يتضح في الشكل (5)، حيث يتم تجميع الأسماء السبعة بطريقة مشابهة لنتائج التحليل العنقودي الهرمي المذكورة أعلاه.
بدلا من ذلك، يمكن للمجموعة البيانات المضغوطة أن تستخدم أيضا كمدخلات لطرق اختبار الفرضية، والتي من المحتمل الآن أن تؤدي إلى نتائج مفيدة أكثر، حيث أنه بدلا من عشرين (20) من المتغيرات المرتبطة فيما بينها، يمكننا الآن دراسة أربعة (4) فقط من المتغيرات غير المترابطة، وهي المكونات الرئيسية. لقد كانت تحليلات العوامل مؤثر للغاية في علم اللغة الذي مجموعات البيانات اللغوية الكبيرة (corpus linguistics)، على سبيل المثال، في عمل بايبر (Biber’s, 1995) حول على تبديل اللهجة الخاصة / النوع الأدبي، ولكن العديد من الدراسات في علم المعاني الحاسوبي يستخدم أساليب رياضية مشابهة جدا.
الطموحات
تماما كما سبق فإن الطموحات المتعلقة بالطرق الاستكشافية تنقسم إلى نوعين. الأول يأتي كامتداد أو متابعة للطرق التي ناقشناها أعلاه، أما الثاني فهي عبارة عن طرق إضافية إلى تلك التي تمت مناقشتها أعلاه.
أما بالنسبة للأول، فبينما تحظى التحليلات العنقودية ببعض الاستخدام الآن، فإن النتائج التي توفرها لا يتم تحليلها بأقصى درجة ممكنة. على سبيل المثال، ليس من السهل تفسير كل الشجيرات البيانية من حيث عدد العناقيد التي يجب أن يفترضها الباحث، لكن هناك دراسات قليلة جدا ناقشت السبل المبدئية للوصول إلى مثل هذه القرارات. أحد الحلول لهذه المسألة ينطوي على إحصائية تسمى متوسط عرض الصورة الظلية (average silhouette widths)، الذي يحدد مدى تشابه العناصر من المجموعات (العناقيد) القريبة في تشابهها من المجموعات الأخرى. هذا المتوسط عبارة عن عرض رسومي لتقنيات التقسيم يتم فيه تمثيل كل مجموعة بما يسمى خيال (ظل) يقوم على أساس المقارنة بين الالتصاق والانفصال. توضح هذه الصورة الظلية الأشياء التي تقع ضمن المجموعة بشكل جيد، وتلك التي تقع يكون مكانها ما بين المجموعات (العناقيد). يتم عرض التجميع الكلي من خلال الجمع بين الصور الظلية في رسم واحد، مما يسمح بتقدير الجودة النسبية للمجموعات ونظرة عامة على تكوين البيانات. يوفر متوسط عرض الصورة الظلية تقييم لصلاحية المجموعات، ويمكن أن يستخدم لتحديد العدد المناسب من المجموعات[15]. في الحالة المذكورة أعلاه من الشكل (4)، توصي هذه الإحصائية بافتراض المجموعتين المبينتين. وثمة نهج آخر لنفس المشكلة ينطوي على إعادة أخذ العينات، وجوهريا يقوم بتعيين قيمة احتماليو (p-value) لكل مجموعة ممكنة بحيث يمكن للباحثين اختيار أقوى المجموعات المدعومة من أجل التفسير. وعلى الرغم من توافر مثل هذه الطرق، إلا أنها لا تزال نادرة جدا، والتي يمكن أن تجعل نتائج التحليل العنقودي الهرمي أقل تبصرا مما يجب أن تكون عليه. وأخيرا، نادرا ما يرى المرء قرارات حول صلاحية عدد معين من المجموعات بواسطة تقنية إحصائية أخرى. على سبيل المثال، إذا كان التحليل العنقودي يكشف حقا عن مجموعتين، فعندها ينبغي أن يكون الانحدار اللوجستي الثنائي (أو تقنية أخرى غير تقنية العنقودية) قادرا على التعرف على هاتين المجموعتين في البيانات. في الحقيقة، لا يزال من الصعب العثور على محاولات التحقق من الصلاحية كهذه.
هناك مجموعة مختلفة من الملحقات تنطوي على تفسير المجموعات، فمثلا ما الذي في البيانات هو المسؤول عن مجموعة معينة، وما الذي يبرز الهياكل، وما هي المتغيرات التي تنعكس أكثر في التجمع (أو العنقود)؟ هناك إحصاءات تشخيصية متاحة للإجابة على هذه الأسئلة، ولكنها حتى الآن لم تشق طريقها إلى أدبيات البحوث ذات العلاقة.
أما بالنسبة للنوع الثاني من الطموحات، فيتعلق بوجود العديد من الطرق الجديدة نسبيا والتي ينبغي أن تكون مفيدة للغاية للبحوث اللغوية. احدها في الواقع هو خوارزمية عنقودية أخرى، ولكن خصائصها غير مستغلة كما ينبغي. يسمح هذا النهج، الذي يسمى التجميع الغامض (fuzzy clustering)، للعناصر بأن يكونوا أعضاء في أكثر من مجموعة واحدة وبدرجات مختلفة، والذي غالبا ما يُعتبر افتراضا أكثر واقعية من تقسيمات العناصر إلى مجموعات محددة المقترحة بالشجيرات البيانية التقليدية. هناك أسلوب آخر قد يكون مفيدا جدا يسمى قواعد تكوين التجمعات (association rules)، وهو إجراء لاستخراج البيانات مناسب للكشف عن تزامن العلاقات الشرطية (إذا…، إذن….) الميزات الأكثر جاذبية لقواعد التجميع هي بساطتها المفاهيمية، كما أن هذه الطريقة يمكنها التعامل مع مجموعات البيانات الكبيرة جدا التي تتألف من المتغيرات الفئوية التي لم تعد قابلة للجدولة المتعددة. وبالتالي، ربما قد نستفيد من هذه الطريقة في تحليل بيانات قواعد البيانات النصية الكبيرة.
ملاحظات ختامية
من المفيد أن أختتم بذكر بضعة طموحات (أو أمنيات) أعم، والتي إذا ما تم تنفيذها على نطاق أوسع أو تم الالتزام بها، من شأنها أيضا أن تساعد الى حد كبير على تقدم حقل علم اللغة. أولها يعلق بحقيقة أننا لا نحتاج فقط إلى توسيع وتعميق معرفتنا بالأساليب الإحصائية في حد ذاتها، ولكننا بحاجة أيضا الى مزيد من الوعي بالافتراضات التوزيعية التي تأتي مع العديد من الأساليب. العديد من الدراسات المنشورة المتعجرف جدا عندما يتعلق الأمر هذه، ولكن، كما ناقشنا باستفاضة دراسة ويلكوكس أعلاه (Wilcox, 2012)، فإن الفشل في التعامل مع انتهاكات لمثل هذه الافتراضات يمكن أن يؤدي إلى نتائج غير محافظة (anticonservative) بشكل كبير.
وبالإضافة إلى ذلك، يحتاج الحقل أيضا إلى مبادئ توجيهية أكثر صرامة حول ما هو مهم في التحليل الإحصائي، وما هو المهم الذي يجب عرضه (على سبيل المثال، التحقق من الافتراضات التوزيعية)، والكيفية التي ينبغي بها الإبلاغ عن الطرق والنتائج. هناك مناقشات طويلة ومكثفة في المجالات الأخرى حول هذه القضايا في حين أن علم اللغة، في أغلبه، لم يفعل ذلك. علينا أن نكون مستعدين لنستلهم من التخصصات الأخرى التي تتعامل مع أنواع مماثلة من الأسئلة والبيانات ونبدأ في التعامل مع هذه التحديات، كما أن التوصيات التي يقدمها ويلكنسون وفرقة العمل حول الاحصاء الاستدلالي (Wilkinson and the Task Force on Statistical Inference, 1999) توفر الكثير من النصائح الأساسية (على سبيل المثال، أن نشمل دائما أحجام التأثير حتى نميز الأهمية الاحصائية من حجم التأثير وأن نجعل تحليلاتنا قابلة للمقارنة).
وأخيرا، هناك مجالين في الإحصاء ينبغي على علماء اللغة السعي لمعرفة المزيد عنهما: (1) التطورات في طرق اعادة أخذ العينات (resampling approaches) مثل (bootstrapping)، الذي يمكن أن يكون مفيد جدا لتعزيز دقة نتائجنا وتعميمها. (2) إحصاء النظرية الافتراضية، التي تتبنى وجهة نظر حول التحليل الإحصائي تختلف كثيرا عن نهج اختبار الأهمية الاحصائية لفرضية العدم السائد، ولكنها جوهريا أكثر انسجاما مع ما نهتم به نحن كباحثينـ وهو تأكيد الفرضيات المعقولة و تحويل التأثيرات إلى كمية بناءا على المعرفة المتراكمة. ونظرا لتنوع وتعقيد البيانات اللغوية، فإن أي نوع من الأدوات لا يمكن إلا أن يكون إضافة مرحب بها في صندوق أدواتنا.
المراجع
Baayen, R. Harald, 2008. Analyzing Linguistic Data: A Practical Introduction to Statistics Using R. Cambridge University Press, Cambridge.
Baayen, R. Harald, 2010. Corpus linguistics and naïve discriminative learning. Brazilian Journal of Applied Linguistics 11 (2), 295–328.
Biber, Douglas, 1995. Dimensions of Register Variation. Cambridge University Press, Cambridge.
Clark, Herbert H., 1973. The language-as-fixed-effect fallacy: a critique of language statistics in psychological research. Journal of Verbal Learning and Verbal Behavior 12 (4), 335–359.
Forster, Kenneth I., Dickinson, R.G., 1976. More on the language-as-fixed-effect fallacy: Monte Carlo estimates of error rates for F1, F2, F0 , and min F0 . Journal of Verbal Learning and Verbal Behavior 15 (2), 135–142.
Gries, Stefan Th, 2013. In: Statistics for Linguistics Using R: A Practical Introduction, second rev. & ext. ed. De Gruyter Mouton, Berlin & New York.
Hilpert, Martin, 2011. Diachronic collostructional analysis: how to use it and how to deal with confounding factors. In: Allan, Kathryn, Robinson, Justyna (Eds.), Current Methods in Historical Semantics. Mouton de Gruyter, Berlin & New York, pp. 133–160.
Johnson, Keith, 2008. Quantitative Methods in Linguistics. Blackwell, Malden, MA & Oxford.
Oakes, Michael P., 1998. Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh.
Peter J. Rousseeuw (1987). “Silhouettes: a Graphical Aid to the Interpretation and Validation of Cluster Analysis”. Computational and Applied Mathematics 20: 53–65. A www document found at: http://www.sciencedirect.com/science/article/pii/0377042787901257
Rietveld, Toni, Hout, Roeland van, 2005. Statistics in Language Research: Analysis of Variance. Mouton de Gruyter, Berlin & New York.
Theijssen, Daphne, Louis ten, Bosch, Lou, Boves, Bert, Cranen, Hans van, Halteren.to appear. Choosing Alternatives: Using Bayesian Networks and Memory-based Learning to Study the Dative Alternation. Corpus Linguistics
Theory 9 (2), 227–262.
Wilcox, Rand, 2012. Introduction to Robust Estimation and Hypothesis Testing, third ed. Elsevier, Amsterdam.
Wilkinson, Leland, The Task Force on Statistical Inference, 1999. Statistical methods in psychology journals: guidelines and expectations. American Psychologist 54 (8), 594–604.
Woods, Anthony, Fletcher, Paul, Hughes, Arthur, 1986. Statistics in Language
Studies. Cambridge University Press, Cambridge.
Zuur, Alain F., Ieno, Elena N., Smith, Graham M., 2007. Analysing Ecological Data. Springer, Berlin & New York.
Zuur, Alain F., Ieno, Elena N., Walker, Neil, Saveliev, Anatoly A., 2009. Mixed
Effects Models and Extensions in Ecology with R. Springer, Berlin & New York.
[1] القيمة الاحتمالية أو قيمة P هي مصطلح إحصائي بحت، وهو عبارة عن رقم (عدد) يستخدم لتأويل (تقييم) المقاييس الاحصائية. تخبرنا القيمة الاحتمالية عن حجم الاحتمال بأن الاختلاف المقاس يوافق الصدفة. إن أيّة قيمة احتمالية أصغر من 0.05 تعني بأن الاحتمال أقل من %5 بأن يكون الاختلاف المقاس بين مجموعتين يقوم على الصدفة، وبالتالي يوجد فرق ذو مغزى إحصائي.
[2] اختبار حسن المطابقة هو نموذج إحصائي يصف مدى تناسب مجموعة من الملاحظات، ونموذجيا فإن اختبارات حسن المطابقة تلخص التناقض بين القيم المرصودة والقيم المتوقعة في إطار النموذج قيد الدراسة.
[3] النمذجة تعتبر وسيلة معالجة تُظهر تأثير المتغيرات في النتائج من خلال العلاقات. أما الانحدار فهو أداة احصائية تتكهن بنتائج ترتكز على نتيجة متغير واحد (تابع) وعلى متغير متوقع (مستقل). ولكن تحليل الانحدار المتعدد فهو آلية احصائية تستخدم متغيرات مستقلة متعددة وذلك للتكهن بالمتغير الناتج عنها (المتغير التابع).
[4] اختبار استدلالي إحصائي ذو أهمية في القياس المستمر للمتغيرات التابعة بالمقارنة مع مجموعات عديدة لمتغيرات مستقلة.
[5] الانحدار متعدد الحدود هو شكل من أشكال الانحدار الخطي الذي يتم فيه نمذجة العلاقة بين المتغير المستقل س والمتغير التابع ص باعتبارها متعدد الحدود لأقصى درجة.
[6] الاختبار الاستدلالي الاحصائي لتحديد أهمية البيانات الفئوية (اسميا أو ترتيبيا).
[7] قانون أوكام رازر: عندما يكون لديك اثنين من النظريات المتنافسة التي تنتج نفس التوقعات بالضبط ، فأبسطها هو الأفضل.
[8] انحدار بويسون هو شكل من أشكال تحليل الانحدار يستخدم لنمذجة بيانات العد والجداول التكرارية. يعرف نموذج انحدار بويسون أحيانا بأنه نموذج سجل خطي، وخاصة عندما يستخدم لنمذجة الجداول التكرارية.
[9] يشير نمذجة المعادلة الهيكلية إلى مجموعة متنوعة من النماذج الرياضية، وخوارزميات الكمبيوتر، والأساليب الإحصائية التي تناسب شبكات مكونات البيانات.
[10] شبكات النظرية الافتراضية هي نموذج رسومي احتمالي (وهو نموذج إحصائي) يمثل مجموعة من المتغيرات العشوائية وتوابعها المشروطة في رسم بياني حلقي موجه.
[11] الإحصاء القوية هي إحصاءات ذات أداء جيد للبيانات المُستقاة من مجموعة واسعة من التوزيعات الاحتمالية، وخاصة للتوزيعات غير الطبيعية. وقد تم تطوير طرق إحصائية قوية لكثير من المشاكل الشائعة، مثل تقدير المواقع، وعومل المقاييس والانحدار المتغيرة.
[12] توزيع زيبف، ويشار إليه أحيانا بتوزيع بيتا، وهو توزيع منفصل يشيع استخدامه في اللغويات، والتأمين، ونمذجة الأحداث النادرة.
[13] في استخراج البيانات والإحصاءات، التحليل العنقودي الهرمي(ويسمى أيضا المجموعات الهرمية) هو وسيلة للتحليل العنقودي الذي يسعى لبناء التسلسل الهرمي للمجموعات. لكي نقرر أي مجموعات يجب أن تكون مجتمعة، أو متى يجب أن يتم تقسيمها، لا بد من قياس الاختلاف بين مجموعات الملاحظات أو البيانات.
[14] الشجرة البيانية هو مخطط يشبه الشجرة يستخدم لتوضيح ترتيب المجموعات التي تنتجها المجموعات الهرمية.
[15] Peter J. Rousseeuw (1987). “Silhouettes: a Graphical Aid to the Interpretation and Validation of Cluster Analysis”. Computational and Applied Mathematics 20: 53–65.