Applied Statistics (4)
Testing of Statistical Hypotheses Outline
اختبار الفرضيات الإحصائية
4.1 Introduction (المقدمة)
4.2 Fundamental Concepts (المفاهيم الأساسية)
4.3 Methods and Steps in Testing a Statistical Hypothesis
الأساليب والخطوات في اختبار الفرضية الإحصائية
4.4 Hypothesis Testing about One Parameter
اختبار الفرضية حول معلمة واحدة
4.4.1 Hypothesis Testing about One Proportion
اختبار الفرضية حول نسبة واحدة
4.4.2 Hypothesis Testing about One Mean
اختبار الفرضية حول متوسط واحد
4.5 Hypothesis Testing about Two Parameters
اختبار الفرضية حول معلمتين
4.5.1 Tests About Two Proportions
اختبارات حول نسبتين
4.5.2 Tests About Two Means
اختبارات حول متوسطين
(تمارين) Exercises
Introduction (مقدمة)
Testing a statistical hypothesis is the second main and major part of inferential statistics.
يعد اختبار الفرضية الإحصائية الجزء الرئيسي الثاني من الإحصاء الاستدلالي
A statistical hypothesis is an assumption or a statement, about one or two parameters and involving one or more than one population.
الفرضية الإحصائية هي افتراض أو بيان حول معلمة أو معلمتين ويشمل مجتمعًا واحدًا أو أكثر.
A statistical hypothesis may or may not be true.
قد تكون الفرضية الإحصائية صحيحة أو غير صحيحة
We need to decide, based on the data in a sample, or samples, whether the stated hypothesis is true or not.
نحتاج إلى اتخاذ قرار بناءً على البيانات الموجودة في عينة أو عينات ما إذا كانت الفرضية المذكورة صحيحة أم لا
If we knew all the members of the population, then it is possible to say with certainty whether or not the hypothesis is true.
إذا عرفنا جميع أعضاء المجتمع فمن الممكن أن نقول بيقين ما إذا كانت الفرضية صحيحة أم لا
However, in most cases, it is impossible, and impractical to examine the entire population.
ومع ذلك، في معظم الحالات من المستحيل وغير العملي فحص المجتمع بأكمله
Due to scarcity of resources, lack of time, and tedious calculations based on a population, we can only examine a sample that hopefully represents that population very well.
نظرًا لندرة الموارد ونقص الوقت والحسابات المملة القائمة على المجتمع لا يمكننا فحص سوى عينة نأمل أن تمثل هذا المجتمع جيدًا
So, the truth or falsity of a statistical hypothesis is never known with certainty.
لذا فإن حقيقة أو زيف الفرضية الإحصائية لا يمكن معرفتها على وجه اليقين
Testing a statistical hypothesis is a technique, or a procedure, by which we can gather some evidence, using the data of the sample, to support, or reject, the hypothesis we have in mind.
اختبار الفرضية الإحصائية هو تقنية أو إجراء يمكننا من خلاله جمع بعض الأدلة، باستخدام بيانات العينة، لدعم أو رفض الفرضية التي لدينا في الاعتبار
Fundamental Concepts (المفاهيم الأساسية)
Any field, and statistics is not an exception, has its own definitions, concepts and terminology.
أي مجال والإحصاء ليس استثناءً له تعريفاته ومفاهيمه ومصطلحاته الخاصة
These items make the basic building stones in any subject.
هذه العناصر تشكل أحجار البناء الأساسية في أي موضوع
Knowing these three things, and connecting among them, will make the subject coherent, and more at the will of the reader.
معرفة هذه الأشياء الثلاثة والربط بينها سيجعل الموضوع متماسكًا وأكثر حسب إرادة القارئ
Based on this, we like to present some definitions, and terminology for some concepts that will be used in the text.
بناءً على هذا نود أن نقدم بعض التعريفات والمصطلحات لبعض المفاهيم التي سيتم استخدامها في النص
A) The Null and Alternative Hypotheses (الفرضيات الصفرية والبديلة)
The first step, in testing a statistical hypothesis, is to set up a null hypothesis and an alternative hypothesis.
الخطوة الأولى في اختبار الفرضية الإحصائية هي إعداد فرضية صفرية وفرضية بديلة
When we conjecture a statement, about one parameter of a population, or two parameters of two populations, we usually keep in mind an alternative conjecture to the first one.
عندما نفترض عبارة حول معلمة واحدة من المجموعة أو معلمتين من المجموعة فإننا عادة ما نضع في الاعتبار تخمينًا بديلًا للأول
Only one of the conjectures can be true.
يمكن أن يكون أحد التخمينين فقط صحيحًا
So, in essence we are weighing the truth of one conjecture against the truth of the other.
لذا، في الأساس نزن صحة تخمين واحد مقابل صحة الآخر
This idea is the first basic principle in testing a statistical hypothesis.
هذه الفكرة هي المبدأ الأساسي الأول في اختبار الفرضية الإحصائية
For example, an experimenter may think that a newly discovered drug is either as effective as, or better than, a currently used one.
على سبيل المثال قد يعتقد المجرب أن عقارًا تم اكتشافه حديثًا إما أنه بنفس فعالية أو أفضل من عقار مستخدم حاليًا
The experimenter wants to weigh the truth of the hypothesis that the new drug is as effective as the old drug against the hypothesis that the new drug is actually better than the old one.
يريد المجرب أن يزن حقيقة الفرضية القائلة بأن العقار الجديد بنفس فعالية العقار القديم مقابل الفرضية القائلة بأن العقار الجديد أفضل بالفعل من العقار القديم
In statistical terminology, the first hypothesis is called the “Null Hypothesis”, i.e. no change, no effect, or no difference, and it is denoted by (H0), (H-Naught) or (H-zero).
في المصطلحات الإحصائية تسمى الفرضية الأولى الفرضية الصفرية أي عدم وجود تغيير أو تأثير أو عدم وجود فرق ويرمز لها بـ (H0) أو (H-Naught) أو (H-zero).
The second hypothesis is called the “Alternative hypothesis”, i.e., there is a change, and it is denoted by (Ha) or (H1), and it will be a statement regarding the value of a population parameter.
تسمى الفرضية الثانية الفرضية البديلة أي وجود تغيير ويرمز لها بـ (Ha) أو (H1) وستكون عبارة عن بيان يتعلق بقيمة معلمة السكان
In this text, we will be using (H0) and (H1) as our Null Hypothesis and Alternative Hypothesis respectively
في هذا النص، سوف نستخدم (H0) و(H1) كفرضية الصفرية والفرضية البديلة على التوالي
B) Possible Decisions (القرارات المحتملة)
The test procedure will lead to either one of the following decisions
ستؤدي عملية اختبار الاجراء إلى أحد القرارات التالية
1. Reject the Null Hypothesis, (H0), i.e., conclude that (H0) is a false statement and this will lead to take, or accept, that the alternative hypothesis (H1) as a true statement.
رفض الفرضية الصفرية (H0) أي استنتاج أن (H0) عبارة خاطئة، وهذا سيؤدي إلى اخذ أو قبول الفرضية البديلة (H1) باعتبارها عبارة صحيحة
2. Do not reject the Null hypothesis, (H0). This means that there is no evidence from the sample, to disprove the null hypothesis. The non-rejection of (H0) should not imply that it is true.
عدم رفض الفرضية الصفرية (H0). وهذا يعني أنه لا يوجد دليل من العينة لدحض الفرضية الصفرية. إن عدم رفض (H0) لا يعني أنها صحيحة.
This is because the objective of testing a statistical hypothesis is to disprove, or reject, the null hypothesis with a high certainty, rather than to prove it.
هذا لأن الهدف من اختبار الفرضية الإحصائية هو دحض الفرضية الصفرية أو رفضها بدرجة عالية من اليقين وليس إثباتها
Thus, if the statistical test rejects (H0) then we are highly certain that it is false.
وبالتالي إذا رفض الاختبار الإحصائي (H0) فإننا نكون على يقين تام من أنها خاطئة
However, if the test does not reject (H0), then we interpret the non-rejection as that the sample does not give enough evidence to disprove the null hypothesis.
ومع ذلك إذا لم يرفض الاختبار (H0) فإننا نفسر عدم الرفض على أنه لا تقدم العينة أدلة كافية لدحض الفرضية الصفرية
In other words, the rejection of the null hypothesis is the decisive conclusion that we can depend on.
بعبارة أخرى فإن رفض الفرضية الصفرية هو الاستنتاج الحاسم الذي يمكننا الاعتماد عليه
Based on the decision, whether to “Reject H0” or “Do Not Reject H0”, we should be careful in stating the null and alternative hypotheses.
بناءً على القرار سواء رفض H0 أو عدم رفض H0 يجب أن نكون حذرين في تحديد الفرضية الصفرية والبديلة
This is due to the fact that originally, we have two statements to be examined against each other, and we may call either one of them the null hypothesis.
هذا يرجع إلى حقيقة أنه في الأصل لدينا بيانان يجب فحصهما ضد بعضهما البعض ويمكننا أن نطلق على أي منهما الفرضية الصفرية
But since we are only highly confident about the conclusion of rejecting the null hypothesis, we take (H0) as the statement that the sample will reject.
ولكن بما أننا واثقون للغاية فقط من استنتاج رفض الفرضية الصفرية فإننا نعتبر (H0) البيان الذي سترفضه العينة
On the other hand, the alternative hypothesis will be that statement which we hope that the data will support.
من ناحية أخرى ستكون الفرضية البديلة هي البيان الذي نأمل أن تدعمه البيانات
In the drug example above, the experimenter wants to prove that the new drug is better than the old one.
في مثال الدواء أعلاه، يريد المجرب إثبات أن الدواء الجديد أفضل من الدواء القديم
So, the experimenter wants to disprove the statement that the new drug is as effective as the old one.
لذا، يريد المجرب دحض مقولة أن الدواء الجديد فعال مثل الدواء القديم
Based on that, he should set the hypotheses as
وبناءً على ذلك، يجب عليه وضع الفرضيات على النحو التالي
H0: The new drug is as effective as the old one.
الدواء الجديد فعال مثل الدواء القديم
H1: The new drug is more effective than the old drug.
الدواء الجديد أكثر فعالية من الدواء القديم
C) Types of Errors (أنواع الأخطاء)
The procedure, in testing a statistical hypothesis, either rejects the null hypothesis or not.
إن الإجراء المتبع في اختبار الفرضية الإحصائية إما أن يرفض الفرضية الصفرية أو لا يرفضها
Of course, the truth is never known, i.e.
وبالطبع فإن الحقيقة لا تُعرف أبدًا أي
we do not know whether H0 is true or not. The “true state of nature” may then be that H0 is true or H0 is false.
إننا لا نعرف ما إذا كانت H0 صحيحة أم لا. وقد تكون "الحالة الطبيعية الحقيقية" حينئذ أن H0 صحيحة أو H0 خاطئة.
We make the decision of rejecting the null hypothesis or not rejecting it, without knowing the true state of nature.
إننا نتخذ قرار رفض الفرضية الصفرية أو عدم رفضها دون معرفة الحالة الطبيعية الحقيقية
In making a decision about testing a statistical hypothesis, two types of errors may be committed:
وفي اتخاذ قرار بشأن اختبار الفرضية الإحصائية، قد نرتكب نوعين من الأخطاء
Type I Error (خطأ من النوع الأول)
A Type I error has been committed if the test rejects the null hypothesis when in fact it is true.
يُرتكب خطأ من النوع الأول إذا رفض الاختبار الفرضية الصفرية بينما هي صحيحة في الواقع
The probability of making such an error will be denoted by α, (The Greek letter Alpha).
وسيتم الإشارة إلى احتمال ارتكاب مثل هذا الخطأ بواسطة α (الحرف اليوناني ألفا)
For sure, it is clear that 0 ≤α≤ 1.
من المؤكد أنه من الواضح أن
Type II Error (خطأ من النوع الثاني)
A Type II error has been committed if the test does not reject H0 when H0 is false.
يحدث خطأ من النوع الثاني إذا لم يرفض الاختبار H0 عندما تكون H0 خاطئة.
The probability of making such an error will be denoted by β (the Greek letter Beta)
with 0 ≤β≤ 1.
سيتم الإشارة إلى احتمالية ارتكاب مثل هذا الخطأ بواسطة β (الحرف اليوناني بيتا)
What is more important is that we do not like to make such errors with high probabilities.
الأمر الأكثر أهمية هو أننا لا نحب ارتكاب مثل هذه الأخطاء ذات الاحتمالات العالية
In either one of the other two cases, there is no error committed, as shown by Table I.
في أي من الحالتين الأخريين، لا يتم ارتكاب أي خطأ، كما هو موضح في الجدول الأول
Each type of error has a certain probability of being committed.
لكل نوع من أنواع الخطأ احتمال معين لارتكابه
These probabilities are given specific names, and values, due to their importance and the severity of the decision
تعطى هذه الاحتمالات أسماء وقيم محددة وذلك بسبب أهميتها وخطورة القرار
Level of Significance (مستوى الأهمية)
The probability of committing a type I error is denoted by (Alpha) α.
يتم الإشارة إلى احتمال ارتكاب خطأ من النوع الأول بواسطة (ألفا) α
It is called the theoretical level of significance for the test.
ويطلق عليه مستوى الأهمية النظري للاختبار
The most common used values for α are: 0.01, 0.05, or 0.10.
القيم الأكثر استخدامًا لـ α هي: 0.01، 0.05، أو 0.10
Other values for α are at the discretion of the researcher.
القيم الأخرى لـ α هي حسب تقدير الباحث
More expressions for α are: (المزيد من التعبيرات لـ ألفا هي)
P (committing a type I error) (ارتكاب خطأ من النوع الأول) =
P (rejecting H0 when H0 is true) (رفض الصفرية عندما تكون الصفرية صحيحة) =
P (rejecting H0 when H1 is false) (رفض الصفرية عندما تكون البديلة خاطئة) =
The probability of committing a type II error is denoted by (beta) β.
يتم الإشارة إلى احتمال ارتكاب خطأ من النوع الثاني بواسطة (بيتا) β.
Other labels for β are (العلامات الأخرى لـ بيتا هي)
P (committing a type II error) (ارتكاب خطأ من النوع الثاني) =
P (not rejecting H0 when H0 is false) (عدم رفض الصفرية وتكون الصفرية خاطئة) =
P (not rejecting H0 when H1 is true) (عدم رفض الصفرية وتكون البديلة صحيحة) =
Power of the Test (قوة الاختبار)
The value of 1– β, which stands for P (rejecting H0 when H0 is false), is the power of the test.
قيمة 1– β والتي تمثل P (رفض H0 عندما تكون H0 خاطئة)، هي قوة الاختبار
The probabilities of type I and Type II errors tell us how good the test is.
تخبرنا احتمالات الأخطاء من النوع الأول والنوع الثاني بمدى جودة الاختبار
Clearly, we do not like to make a type I error with high probability, as well as we like to make a correct decision with a very high power.
من الواضح أننا لا نحب ارتكاب خطأ من النوع الأول باحتمالية عالية كما نحب اتخاذ قرار صحيح بقوة عالية جدًا
The smaller these probabilities (of type I error and Type II error) are the better is the test.
كلما كانت هذه الاحتمالات (الخطأ من النوع الأول والخطأ من النوع الثاني) أصغر كان الاختبار أفضل
Ideally, we like to use a test procedure for which both type I and type II errors have small probabilities.
من الناحية المثالية نفضل استخدام إجراء اختبار يكون فيه كل من الأخطاء من النوع الأول والنوع الثاني احتمالات صغيرة
However, it turns out that the type I error and the type II error are related in such a way that a decrease in the probability of one of them generally results in an increase in the probability of the other.
ولكن تبين أن الخطأ من النوع الأول والخطأ من النوع الثاني مرتبطان بطريقة تجعل انخفاض احتمالية أحدهما يؤدي عمومًا إلى زيادة احتمالية الآخر
It is not possible to control both probabilities based on a fixed sample size.
ومن غير الممكن التحكم في كلا الاحتمالين على أساس حجم عينة ثابت
Traditionally, or by convention, statisticians have adopted to fix the level of significance of the test in advance, and to search for a test procedure that will minimize the probability of making a type II error and consequently maximize the power for the test.
تقليديًا أو وفقًا للاتفاقية تبنى الإحصائيون تحديد مستوى أهمية الاختبار مسبقًا والبحث عن إجراء اختبار من شأنه أن يقلل من احتمالية ارتكاب خطأ من النوع الثاني، وبالتالي يزيد من قوة الاختبار
Practically, we can make those probabilities, namely α and β, smaller by taking a larger sample if possible.
عمليًا يمكننا جعل هذه الاحتمالات، أي α وβ أصغر من خلال أخذ عينة أكبر إذا أمكن.
For calculating the probability of type II error, and the power of the test, we direct the interested reader to Sullivan 2013.
لحساب احتمالية الخطأ من النوع الثاني وقوة الاختبار نوجه القارئ المهتم إلى سوليفان 2013
D) The Test Statistic (إحصاء الاختبار)
The test statistic is a quantity that depends on the information, or statistics, that the sample will provide.
إحصاء الاختبار هو كمية تعتمد على المعلومات أو الإحصاءات التي ستوفرها العينة
It is a function of the sample statistics, and the value(s) of the parameter(s) under the null hypothesis.
إنه دالة لإحصاءات العينة وقيمة (قيم) المعلمة (المعلمات) تحت الفرضية الصفرية
Thus, a statistic is a random variable until we get some values from the sample.
وبالتالي فإن الإحصاء هو متغير عشوائي حتى نحصل على بعض القيم من العينة
The numerical value of the test statistic (large or small) leads us to decide whether or not to reject the Null Hypothesis when it is compared to the critical value(s) of the test.
إن القيمة العددية لإحصاء الاختبار (كبيرة أو صغيرة) تقودنا إلى اتخاذ قرار بشأن رفض الفرضية الصفرية أم لا عند مقارنتها بالقيمة (القيم) الحرجة للاختبار
The Critical Region or the Rejection Region (CR or RR)
المنطقة الحرجة أو منطقة الرفض (CR أو RR)
The critical region is an interval, or a union of intervals, which is determined by using special and certain distributions with the appropriate Table values.
المنطقة الحرجة هي فترة أو اتحاد فترات يتم تحديده باستخدام توزيعات خاصة ومحددة مع قيم الجدول المناسبة
It depends on the distribution of the test statistic when H0 is true, on the form of the alternative Hypothesis, and on the level of significance that was set for the test.
ويعتمد على توزيع إحصاء الاختبار عندما تكون H0 صحيحة وعلى شكل الفرضية البديلة وعلى مستوى الدلالة الذي تم تعيينه للاختبار.
Conclusion and interpretation (لاستنتاج والتفسير)
The final conclusion, of the test procedure, is based on whether or not the computed value of the test statistic falls inside the critical region, or not, as follows:
يعتمد الاستنتاج النهائي لإجراء الاختبار على ما إذا كانت القيمة المحسوبة للإحصاء الاختباري تقع داخل المنطقة الحرجة أم لا على النحو التالي
1. Reject H0 if the computed value of the test statistic falls in the critical region.
رفض H0 إذا كانت القيمة المحسوبة للإحصاء الاختباري تقع داخل المنطقة الحرجة
2. Do not reject H0 if the computed value of the test statistic does not fall inside the critical region.
لا ترفض H0 إذا كانت القيمة المحسوبة للإحصاء الاختباري لا تقع داخل المنطقة الحرجة
In either of the two cases detailed above, an interpretation and a practical statement are due in order to answer the question that was raised before the test procedure started.
في أي من الحالتين المفصلتين أعلاه يلزم تقديم تفسير وبيان عملي للإجابة على السؤال الذي أثير قبل بدء إجراء الاختبار
Methods in Testing a Statistical Hypothesis
طرق اختبار الفرضية الإحصائية
There are two methods to test a statistical hypothesis, namely The Classical or Traditional method, and the P-value method.
هناك طريقتان لاختبار الفرضية الإحصائية وهما الطريقة الكلاسيكية (أو التقليدية) وطريقة القيمة الاحتمالية
Both of these methods will be introduced and used in this text.
سيتم تقديم كلتا الطريقتين واستخدامهما في هذا النص
Based on the notation and definitions that were set above, we will list the steps in the Classical method, in general, first and then the steps for the p-value method next.
بناءً على التدوين والتعاريف التي تم تحديدها أعلاه سنقوم بإدراج الخطوات في الطريقة الكلاسيكية بشكل عام أولاً ثم خطوات طريقة القيمة الاحتمالية
More detailed steps will be outlined later based on the parameter, or parameters, involved, or stated in the hypotheses.
سيتم توضيح الخطوات الأكثر تفصيلاً لاحقًا بناءً على المعلمة أو المعلمات المعنية أو المذكورة في الفرضيات
(خطوات الطريقة الكلاسيكية) Classical Method Steps
1. Determine, and clearly, state the two hypotheses: H0 and H1.
حدد ووضح الفرضيتين: H0 وH1
Equality to the assigned parameter should be included under the Null Hypothesis.
يجب تضمين المساواة مع المعلمة المعينة ضمن الفرضية الصفرية.
2. Decide on the significance level α. (حدد مستوى أهمية)
Find the critical value or values and locate the rejection region or regions (all based on the parameter and distribution under consideration).
ابحث عن القيمة أو القيم الحرجة وحدد منطقة أو مناطق الرفض (كل ذلك بناءً على المعلمة والتوزيع قيد النظر).
3. Choose the appropriate Test statistic for the hypotheses based on the parameter on hand.
اختر إحصائية الاختبار المناسبة للفرضيات بناءً على المعلمة الموجودة
4. Using the information provided by the data in the sample, and the computed statistics, calculate the test statistic that was chosen in Step 3.
باستخدام المعلومات المقدمة من البيانات في العينة والإحصائيات المحسوبة احسب إحصائيات الاختبار التي تم اختيارها فالخطوة 3
5. Make your statistical decision, whether to reject, or not to reject, H0 based on the comparison between the computed value of the test statistic and the critical value(s) found in Step 2, and as outlined earlier.
اتخذ قرارك الإحصائي سواء برفض أو عدم رفض H0 بناءً على المقارنة بين القيمة المحسوبة لإحصائية الاختبار والقيمة (القيم) الحرجة الموجودة في الخطوة 2 وكما هو موضح سابقًا.
6. Give the conclusion, or the answer, in a statement that anyone can understand without any mathematical jargons or statistical ambiguity.
قدم النتيجة أو الإجابة في بيان يمكن لأي شخص فهمه دون أي مصطلحات رياضية أو غموض إحصائي
P-value Method Steps (خطوات طريقة القيمة الاحتمالية)
1. Determine and clearly state the two hypotheses: H0 and H1.
حدد ووضح الفرضيتين: H0 وH1.
Equality to the assigned parameter should be included under the Null Hypothesis.
يجب تضمين المساواة مع المعلمة المعينة ضمن الفرضية الصفرية.
2. Decide on the significance level α. (حدد مستوى الأهمية)
3. Choose the appropriate Test statistic for the hypotheses based on the parameter on hand.
اختر إحصائية الاختبار المناسبة للفرضيات بناءً على المعلمة الموجودة
4. Using the information provided by the data in the sample, and the computed statistics, calculate the test statistic that was set up in Step 3.
باستخدام المعلومات المقدمة من البيانات في العينة والإحصاءات المحسوبة احسب إحصائية الاختبار التي تم إعدادها فالخطوة 3
5. Make your statistical decision, whether to reject, or not to reject, H0 based on the comparison between the theoretical significance level α, (that was set up above) and the calculated p-value.
اتخذ قرارك الإحصائي سواء برفض أو عدم رفض H0 بناءً على المقارنة بين مستوى الدلالة النظرية α (الذي تم إعداده أعلاه) والقيمة الاحتمالية المحسوبة.
(This p-value is the practical, or attained, significance level, based on the type of the test and the distribution of the parameter involved).
(هذه القيمة الاحتمالية هي مستوى الدلالة العملي أو المكتسب بناءً على نوع الاختبار وتوزيع المعلمة المعنية).
A p-value less than α will lead to the rejection of H0, otherwise do not reject H0.
ستؤدي القيمة الاحتمالية الأقل من α إلى رفض H0 وإلا فلا ترفض H0.
6. Give the conclusion, or the answer to the question, in a statement that anyone can understand without any mathematical jargons or statistical ambiguity.
قدم النتيجة أو الإجابة على السؤال في بيان يمكن لأي شخص فهمه دون أي مصطلحات رياضية أو غموض إحصائي.
The above steps will be applied to test on one parameter or two parameters whether the test was two tailed test or one tailed, left or right test.
ستطبق الخطوات المذكورة أعلاه على الاختبار على معلمة واحدة أو معلمتين سواء كان الاختبار اختبارًا ثنائي الذيل أو اختبارًا أحادي الذيل، أو اختبارًا يسارًا أو يمينًا.
In the next section we will introduce the test of a statistical hypothesis on one parameter.
في القسم التالي، سنقدم اختبار فرضية إحصائية على معلمة واحدة.
The one parameter case will involve: one proportion, one mean and one standard deviation, or one variance.
ستشمل حالة المعلمة الواحدة؛ نسبة واحدة، ومتوسط واحد، وانحراف معياري واحد، أو تباين واحد.
Hypothesis Testing About One Parameter
اختبار الفرضيات حول معلمة واحدة
In this section we will discuss, and display, the procedures for testing a statistical hypothesis about one population parameter.
سنناقش في هذا القسم ونعرض الإجراءات الخاصة باختبار فرضية إحصائية حول معلمة واحدة من معلمات المجتمع.
The one population parameter, which is of interest, will include: one proportion, one mean, and one variance or a standard deviation.
ستتضمن معلمة المجتمع الواحدة التي تثير الاهتمام ما يلي: نسبة واحدة ومتوسط واحد وتباين واحد أو انحراف معياري.
In general, let that parameter be θ, and its assumed value be θ0.
بشكل عام، لنفترض أن هذه المعلمة هي θ، وأن قيمتها المفترضة هي θ0.
Following the steps that were set earlier, we will give the steps in more details for the case when one proportion is under investigation.
وباتباع الخطوات التي تم تحديدها سابقًا، سنقدم الخطوات بمزيد من التفاصيل للحالة التي تكون فيها نسبة واحدة قيد التحقيق.
It is to be noted here that the two hypotheses are mutually exclusive sets on the real line for the values of the parameter, with the equal sign always set to go with the null hypothesis.
ومن الجدير بالذكر هنا أن الفرضيتين عبارة عن مجموعات لا يتوافقان (متنافيتان) على خط الأعداد الحقيقية لقيم المعلمة مع وضع علامة المساواة دائمًا لتتوافق مع الفرضية الصفرية.
This is so chosen in order to compute the value of the test statistic based on the null hypothesis being true.
تم اختيار هذا من أجل حساب قيمة إحصائية الاختبار بناءً على صحة الفرضية الصفرية.
Hypothesis Testing about One Proportion (P)
اختبار الفرضيات حول نسبة واحدة
Recall that the best point estimate of p, the proportion of the population with a certain characteristic, is given by
تذكر أن أفضل تقدير لنقطة p وهي نسبة المجتمع التي تتميز بخاصية معينة يتم إعطاؤه بواسطة
Where x is the number of individuals in the sample with the specified characteristic of interest and n is the sample size.
حيث x هو عدد الأفراد في العينة الذين لديهم السمة المحددة موضع الاهتمام وn هو حجم العينة.
Recall from Chapter 3 that the sampling distribution of (p̂) is approximately normal, with mean
تذكر من الفصل 3 أن توزيع العينة (p̂) طبيعي تقريبًا، مع متوسط
(خطوات الطريقة الكلاسيكية) A) Classical Method Steps
For a specified value of the proportion P0 we have (We are using the z-test on one proportion)
بالنسبة لقيمة محددة للنسبة P0 لدينا (نستخدم اختبار z على نسبة واحدة)
1. State the null and alternative hypotheses
صِغ الفرضيات الصفرية والبديلة
There are three ways to set up the null and alternative Hypotheses.
هناك ثلاث طرق لإعداد الفرضيات الصفرية والبديلة
a) Equal hypothesis versus not equal hypothesis:
فرضية المساواة مقابل فرضية عدم المساواة
b) H0: P = P0 versus H1: P ≠ P0, two-tailed test.
c) At least versus less than: H0: P = P0 versus H1: P < P0, left-tailed test.
d)At most versus greater than: H0: P = P0 versus H1: P > P0, right-tailed test.
2. Let α (the most used values for the level of significance are: 0.01, or 0.05, or 0.10) be the significance level.
ليكن α (القيم الأكثر استخدامًا لمستوى الدلالة هي: 0.01، أو 0.05، أو 0.10) هو مستوى الدلالة
Based on the three cases in step 1, we have the following three cases that will go along with that:
بناءً على الحالات الثلاث في الخطوة 1 لدينا الحالات الثلاث التالية التي ستتوافق مع ذلك
a) For the two tailed test there are two critical values: -Zα/2 &Zα/2, and the critical region is given by |Z|> Z α/2, as shown in the Figure 1 to include both areas in this case each will be ½α .
بالنسبة للاختبار ذي الذيلين، هناك قيمتان حرجتان: -Zα/2 وZα/2، والمنطقة الحرجة تُعطى بواسطة Z|> Z α/2| كما هو موضح في الشكل 1 لتشمل كلتا المنطقتين وفي هذه الحالة ستكون كل منهما ½α.
b) For the left-tailed test, the critical value is -Zα, and the rejection region is given by Z < -Zα, as shown in the Figure 2. The area to the left of -Zα is α.
بالنسبة للاختبار ذي الذيل الأيسر القيمة الحرجة هي -Zα ومنطقة الرفض تُعطى بواسطة Z < -Zα، كما هو موضح في الشكل 2. المنطقة إلى يسار -Zα هي α.
c) For the-right tailed test, again, there is one critical value given by Zα, and the rejection region is Z >Zα, as shown in Figure 3. The area to the right t of Zα is α.
بالنسبة للاختبار ذي الذيل الأيمن مرة أخرى، هناك قيمة حرجة واحدة تعطى بواسطة Zα، ومنطقة الرفض هي Z >Zα، كما هو موضح في الشكل 3. المنطقة إلى اليمين t من Zα هي α.
بالنسبة لإحصائية الاختبار لدينا حيث n هو حجم العينة و
4. The above test statistic is computed based on the information provided to us by the sample data.
يتم حساب إحصاء الاختبار أعلاه بناءً على المعلومات المقدمة إلينا من بيانات العينة
5. The statistical decision will be made based on the case on hand whether we have a two- tailed, a left-tailed, or a right-tailed test, by comparing the computed value of the test statistic to the critical value based on the test being chosen.
سيتم اتخاذ القرار الإحصائي بناءً على الحالة المطروحة سواء كان لدينا اختبار ذو ذيلين أو ذيل أيسر أو ذيل أيمن، من خلال مقارنة القيمة المحسوبة لإحصاء الاختبار بالقيمة الحرجة بناءً على الاختبار الذي يتم اختياره
6. The interpretation and conclusion are due to answer the question that was raised.
يجب أن يجيب التفسير والاستنتاج على السؤال الذي تم طرحه
The above steps are the road map for testing a statistical hypothesis on one proportion using the classical or traditional method. Here is an example.
الخطوات المذكورة أعلاه هي خريطة الطريق لاختبار فرضية إحصائية على نسبة واحدة باستخدام الطريقة الكلاسيكية أو التقليدية. فيما يلي مثال.
(مثال) EXAMPLE 1
The government of a wealthy country intends to institute a program to discourage investment in foreign countries by its citizens.
تعتزم حكومة دولة غنية وضع برنامج لتثبيط مواطنيها عن الاستثمار في الدول الأجنبية.
It is known that in the past 35% of the country’s adult citizens held investment in foreign countries.
من المعروف أن 35% من مواطني الدولة البالغين كانوا في الماضي يمتلكون استثمارات في دول أجنبية.
The government wishes to determine if the current percentage of adult citizens, who own foreign investment is greater than this long-term figure of 35%.
ترغب الحكومة في تحديد ما إذا كانت النسبة الحالية للمواطنين البالغين الذين يمتلكون استثمارات أجنبية أكبر من هذا الرقم الطويل الأجل وهو 35%.
A random sample of 800 adults is selected, and it is found that 320 of these citizens hold foreign assets.
تم اختيار عينة عشوائية من 800 بالغ وتبين أن 320 من هؤلاء المواطنين يمتلكون أصولاً أجنبية.
Is this percentage greater than 35%? Use a 10% significance level for testing this claim.
هل هذه النسبة أكبر من 35%؟ استخدم مستوى دلالة 10% لاختبار هذا الادعاء.
(الحل) Solution
Using the setup above for the classical method on testing a statistical hypothesis on one proportion we proceed as follows:
باستخدام الإعداد أعلاه للطريقة التقليدية لاختبار فرضية إحصائية على نسبة واحدة، نتبع ما يلي:
1. H0: P =0.35 Versus H1: P > .35. This is a right–tailed test
H0: P = 0.35 مقابل H1: P > 0.35. هذا اختبار ذو طرف أيمن.
2. The level of significance is given to be 10%, or 0.10. Thus α = 0.10. Since the test is one- tailed, on the right side, we have one critical value given by: C.V. = Zα = Z0.10 = 1.282 and the rejection region is given by: Z > 1.282.
مستوى الدلالة هو 10% أو 0.10. وبالتالي، α = 0.10. بما أن الاختبار ذو طرف واحد، فلدينا على الجانب الأيمن قيمة حرجة واحدة تُعطى بالمعادلة: C.V. = Zα = Z0.10 = 1.282، ومنطقة الرفض تُعطى بالمعادلة: Z > 1.282.
(الشكل 4) Figure 4
3. The test statistics: where n= 800, x=320, and P0 =0.35.
إحصاءات الاختبار: حيث n = 800، x = 320، وP0 = 0.35.
4. From the above values, and form for the test statistic, we find Zcal = 2.965 where Pˆ = 0.40.
من القيم أعلاه، وصيغة إحصائية الاختبار، نجد أن Zcal = 2.965، حيث Pˆ = 0.40.
5. Since Zcal= 2.965 > C.V. = Z0.10 = 1.282, we reject H0.
6. it is concluded that the percentage of adult citizens, who own investment in a foreign country, is greater than 35%.
نستنتج أن نسبة المواطنين البالغين الذين يمتلكون استثمارات في دولة أجنبية تزيد عن ٣٥٪.
(طريقة القيمة الاحتمالية) The P-value Method
For a specified value of the proportion P0 and (We are using the z-test on one proportion) for testing on one proportion using the P-value Method, the steps go like this (the steps almost look like what we had on the classical Method except there is a difference between step 2 and step 5):
لقيمة محددة للنسبة P0 و(نستخدم اختبار Z على نسبة واحدة) لاختبار نسبة واحدة باستخدام طريقة القيمة الاحتمالية، تسير الخطوات على النحو التالي (تشبه الخطوات تقريبًا ما اتبعناه في الطريقة التقليدية، باستثناء وجود فرق بين الخطوة ٢ والخطوة ٥):
1. State the null and alternative hypotheses:
صِغ الفرضية الصفرية والفرضية البديلة
There are three ways to set up the null and the alternative Hypotheses.
هناك ثلاث طرق لصياغة الفرضية الصفرية والفرضية البديلة
a) Equal hypothesis versus not equal hypothesis
فرضية متساوية مقابل فرضية غير متساوية
H0: P = P0 versus H1: P ≠ P0, Two-tailed test (اختبار ثنائي الطرف)
b) At least versus less than (على الأقل مقابل أقل من)
H0: P ≥ P0 versus H1: P < P0, Left-tailed test (اختبار ذو طرف أيسر)
c) At most versus greater than (على الأكثر مقابل أكبر من)
H0: P ≤ P0 versus H1: P > P0, right-tailed test (اختبار ذو طرف أيمن)
2. Let α (= 0.01, or 0.05, or 0.10, or any other value of your choice) be the significance level.
ليكن α (= 0.01، أو 0.05، أو 0.10، أو أي قيمة أخرى من اختيارك) مستوى الدلالة.
3. For the test statistic we have & where n is the sample size and
بالنسبة لإحصائية الاختبار لدينا & حيث n هو حجم العينة
4. The above test statistic is computed based on the information provided to us by the sample data.
تم حساب إحصائية الاختبار أعلاه بناءً على المعلومات المقدمة لنا من بيانات العينة
5. How to calculate the p-value for your test? Based on the test type stated in step 1, we have the following options:
كيف نحسب القيمة الاحتمالية لاختبارك؟ بناءً على نوع الاختبار المذكور في الخطوة 1، لدينا الخيارات التالية
a) For the 2-tailed test, and after calculating the value of the test statistic, Zcal in step 4, the p- value is found by:
بالنسبة للاختبار ثنائي الذيل، وبعد حساب قيمة إحصائية الاختبار، Zcal في الخطوة 4، تُحسب قيمة p بالمعادلة التالية
p-value = 2 *P (Z < Zcal), or p-value = 2 *P (Z > Zcal), conditioned on whether the Zcal is negative or positive.
The statistical decision will be made based on comparing the computed p-value for the test statistic to the significance level stated in step 2.
يُتخذ القرار الإحصائي بناءً على مقارنة قيمة p المحسوبة لإحصائية الاختبار بمستوى الدلالة المذكور في الخطوة 2.
If the computed p-value is less than α, H0 will be rejected; otherwise, do not reject H0.
إذا كانت قيمة p المحسوبة أقل من α، فسيتم رفض H0 وإلا فلا تُرفض H0.
b) For the left-tailed test, and after calculating the value of the test statistic, Zcal in step 4, the p-value is found by: p-value = P (Z < Zcal).
بالنسبة للاختبار ذي الذيل الأيسر، وبعد حساب قيمة إحصائية الاختبار، Zcal في الخطوة 4، تُحسب قيمة p بالمعادلة التالية: قيمة p = P (Z < Zcal).
The statistical decision will be made by comparing the computed p- value for the test statistic to the significance level stated in step 2.
سيتم اتخاذ القرار الإحصائي بمقارنة القيمة الاحتمالية المحسوبة لإحصائية الاختبار بمستوى الدلالة المذكور في الخطوة ٢.
If the computed p-value is less than α, H0 will be rejected; otherwise, do not reject H0.
إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0؛ وإلا، فلا ترفض H0.
c) For the right-tailed test, and after calculating the value of the test statistic, Zcal in step 4, the p-value is found by: p-value = P (Z > Zcal ).
بالنسبة للاختبار ذي الذيل الأيمن، وبعد حساب قيمة إحصائية الاختبار، Zcal في الخطوة ٤، تُحسب القيمة الاحتمالية بالمعادلة التالية: القيمة الاحتمالية = P (Z > Zcal).
The statistical decision will be made by comparing the computed p- value for the test statistic to the significance level stated in step 2.
سيتم اتخاذ القرار الإحصائي بمقارنة القيمة الاحتمالية المحسوبة لإحصائية الاختبار بمستوى الدلالة المذكور في الخطوة ٢.
If the computed p-value is less than α, H0 will be rejected; otherwise, do not reject H0.
إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0 وإلا فلا ترفض H0.
6. The interpretation and conclusion are due to answer the question that was raised.
يجب أن يجيب التفسير والاستنتاج على السؤال المطروح.
(المثال) EXAMPLE 2
Apply the P-value method to check on the test in EXAMPLE 4.1.
طبّق طريقة القيمة الاحتمالية للتحقق من صحة الاختبار في المثال ٤.١.
(الحل) Solution
Using the setup above for the p-value method on testing a statistical hypothesis on one proportion we proceed as follows:
باستخدام الإعداد أعلاه لطريقة القيمة الاحتمالية لاختبار فرضية إحصائية على نسبة واحدة، نتبع ما يلي:
1. H0: P ≤ 0.35 Versus H1: P > .35. This is a right–tailed test. (It is 1Prop Z test on TI 84).
H0: P ≤ 0.35 مقابل H1: P > 0.35. هذا اختبار ذو طرف أيمن. (وهو اختبار Z ذو الاحتمالية الواحدة على TI 84).
2. The level of significance is given to be 10%, or 0.10.
مستوى الدلالة هو 10% أو 0.10
3. the test statistics where n= 800, x= 320, P0 = 0.35.
إحصاءات الاختبار حيث n = 800، x = 320، P0 = 0.35.
4. From the above values and form for the test statistic we find Zcal =2.965 where Pˆ = 0.40.
من القيم أعلاه وصيغة إحصائية الاختبار، نجد أن Zcal = 2.965 حيث Pˆ = 0.40.
5. Since Zcal = 2.965. Since we have a right-tailed test, then the p-value for the test will be calculated by finding P (Z > 2.965). This is done by applying step No. 5. Part
بما أن Zcal = 2.965. بما أن لدينا اختبارًا ذو طرف أيمن، فسيتم حساب القيمة الاحتمالية للاختبار بإيجاد P (Z > 2.965). يتم ذلك بتطبيق الخطوة رقم 5، الجزء
c) in the p-value method steps. Using the table for standard normal distribution we find ourselves trapped in rounding to two decimal places.
من خطوات طريقة القيمة الاحتمالية. باستخدام جدول التوزيع الطبيعي القياسي، نجد أنفسنا محاصرين في تقريب القيمة إلى منزلتين عشريتين.
(الشكل) Figure 5
First, let us take Zcal = 2.97. Based on that we see then P (Z > 2.97) = 1–P (Z < 2.97), and from the Standard Normal Table, we have P (Z > 2.97) = 1–0.9985 = 0.0015 < 0.10, hence The Null hypothesis is rejected, See Figure 2.
أولاً، لنفترض أن Zcal = 2.97. بناءً على ذلك، نجد أن P (Z > 2.97) = 1–P (Z < 2.97) ، ومن جدول التوزيع الطبيعي القياسي، نجد أن P (Z > 2.97) = 1–0.9985 = 0.0015 < 0.10، وبالتالي تُرفض الفرضية الصفرية، انظر الشكل 2.
Second, let us take Zcal = 2.96. Based on that we see then P (Z > 2.96) = 1P (Z <2.96), and from Standard Normal Table, we have P (Z > 2.96) = 10.9985 = 0.0015 < 0.10, hence The Null hypothesis is rejected.
ثانياً، لنفترض أن Zcal = 2.96. بناءً على ذلك، نرى أن P (Z > 2.96) = 1P (Z < 2.96)، ومن جدول التوزيع الطبيعي القياسي، نجد أن P (Z > 2.96) = 10.9985 = 0.0015 < 0.10، وبالتالي تُرفض الفرضية الصفرية.
In this case it did not make a difference whether you rounded up or down the calculated value for the test statistic.
في هذه الحالة، لم يُحدث تقريب القيمة المحسوبة لإحصائية الاختبار لأعلى أو لأسفل فرقًا.
Using a graphing calculator, and testing the same hypothesis, we find that the p-value, to 4 decimal places is, again, 0.0015. Thus, the null hypothesis is rejected.
باستخدام حاسبة بيانية، واختبار الفرضية نفسها وجدنا أن قيمة p، لأقرب 4 منازل عشرية هي 0.0015 أيضًا. وبالتالي تُرفض الفرضية الصفرية.
6. It is concluded that the percentage of adult citizens, who own investment in a foreign country, is greater than 35%.
يُستنتج أن نسبة المواطنين البالغين الذين يمتلكون استثمارات في دولة أجنبية تزيد عن 35%.
Hypothesis Testing about One Mean (μ)
اختبار الفرضيات حول متوسط واحد (μ)
This section will display the procedure, by using the two methods outlined above for testing a statistical hypothesis about one population mean.
يعرض هذا القسم الإجراء باستخدام الطريقتين الموضحتين أعلاه لاختبار فرضية إحصائية حول متوسط مجتمع واحد.
There are three cases to be considered in this section. Again, as it was stated above for one proportion
هناك ثلاث حالات يجب مراعاتها في هذا القسم. وكما ذُكر سابقًا بالنسبة لنسبة واحدة،
it is to be noted here that the two hypotheses are mutually exclusive sets on the real line for the values of the parameter
تجدر الإشارة هنا إلى أن الفرضيتين هما مجموعتان متنافيتان على خط الأعداد الحقيقية لقيم المعلمة
with the equal sign always set to go with the null hypothesis.
مع وضع علامة يساوي دائمًا مع الفرضية الصفرية.
This is so chosen in order to compute the value of the test statistics based on the null hypothesis being true.
تم اختيار هذه الفرضية لحساب قيمة إحصاءات الاختبار بناءً على صحة الفرضية الصفرية.
Case I: Testing on One Mean, μ when Population variance, σ2 known
الحالة الأولى: الاختبار على متوسط واحد، μ عند معرفة تباين المجتمع σ²
Classical Method Steps: For a specified value of the population mean μ0 we have (We are using the z-test):
خطوات الطريقة الكلاسيكية: لقيمة محددة لمتوسط المجتمع، μ0، لدينا (نستخدم اختبار z):
1. State the null and alternative hypotheses.
اذكر الفرضية الصفرية والفرضية البديلة.
There are three ways to set up the null and alternative Hypotheses
هناك ثلاث طرق لصياغة الفرضيات الصفرية والبديلة
a) Equal hypothesis versus not equal hypothesis
فرضية التساوي مقابل فرضية عدم التساوي
H0: μ = μ0 versus H1: μ # μ0, two-tailed test (اختبار ثنائي الطرف)
b) At least versus less than (على الأقل مقابل أقل من)
H0: μ = μ0 versus H1: μ < μ0, left tailed test (اختبار أيسر)
c) At most versus greater than (على الأكثر مقابل أكبر من)
H0: μ = μ0 versus H1: μ > μ0, right tailed test (اختبار أيمن)
2. Let α be the significance level, and based on the three cases in step 1
لنفترض أن α هو مستوى الدلالة وبناءً على الحالات الثلاث في الخطوة 1
we have the following three cases that will go along for finding the critical values and rejection regions:
لدينا الحالات الثلاث التالية التي تُستخدم لإيجاد القيم الحرجة ومناطق الرفض
a) For the two-tailed test there are two critical values: -Zα/2 & Zα/2
للاختبار ثنائي الطرف هناك قيمتان حرجتان: -Zα/2 وZα/2
and the critical region is given by |Z|> Zα/2, as shown in the Figure 6, with the area on each is α/2.
وتُعطى المنطقة الحرجة بالعلاقة Z|> Zα/2|. كما هو موضح في الشكل 6، حيث المساحة على كلٍّ منهما α/2.
Figure 6 (الشكل)
b) For the left tailed test, there is the critical value of -Zα, and the rejection region is given by Z < -Zα,
في اختبار الطرف الأيسر، توجد القيمة الحرجة -Zα، ومنطقة الرفض تُعطى بالعلاقة Z < -Zα.
as shown in the Figure 7, with the area to the left of -Zα is equal to α.
كما هو موضح في الشكل 7 حيث المساحة على يسار -Zα تساوي α.
c) For the right tailed test, again, there is on critical value given by Zα, and the rejection region is Z >Zα
في اختبار الطرف الأيمن توجد أيضًا قيمة حرجة واحدة تُعطى بالعلاقة Zα ومنطقة الرفض هي Z >Zα.
as shown in the Figure 8, with the area to the right of Zα is equal to α.
كما هو موضح في الشكل 8 حيث المساحة على يمين Zα تساوي α.
Figure 8 (الشكل)
3. The test statistic is given by where n is the sample size x
تُعطى إحصائية الاختبار بالعلاقة: حيث n هو حجم العينة، x هو المتوسط، وZ له التوزيع الطبيعي القياسي، N (0, 1).
is the mean, and Z has the standard normal distribution, N (0, 1).
4. The above test statistic is computed based on the information provided to us by the sample data.
. تُحسب إحصائية الاختبار أعلاه بناءً على المعلومات المُقدمة لنا من بيانات العينة.
5. The statistical decision will be made based on the case on hand whether we have a two- tailed,
سيتم اتخاذ القرار الإحصائي بناءً على الحالة المطروحة، سواءً كان لدينا اختبار ثنائي الذيل
a left-tailed or a right-tailed test, by comparing the computed value of the test statistic to the critical value based on the test being chosen.
أو اختبار أيسر الذيل، أو اختبار أيمن الذيل، وذلك بمقارنة القيمة المحسوبة لإحصائية الاختبار بالقيمة الحرجة بناءً على الاختبار المُختار.
6. The interpretation and conclusion are due to answer the question that was raised.
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح.
(مثال) EXAMPLE 3
To test H0: μ =50 versus H1: μ < 50, a random sample of n = 24 is obtained from a population that is known to be normally distributed with σ = 12, and we got a sample mean of 47.1. Will the null hypothesis be rejected?
لاختبار H0: μ = ٥٠ مقابل H1: μ < ٥٠، تم الحصول على عينة عشوائية من n = ٢٤ من مجتمع معروف بتوزيعه الطبيعي مع σ = ١٢، وحصلنا على متوسط عينة ٤٧.١. هل تُرفض الفرضية الصفرية؟
(الحل) Solution
Applying the classical Method steps for test on one mean we have
بتطبيق خطوات الطريقة التقليدية للاختبار على متوسط واحد، نحصل على
1. State the null and alternative hypotheses. H0: μ = 50 versus H1: μ < 50, left-tailed test
حدد الفرضية الصفرية والفرضية البديلة. H0: μ = 50 مقابل H1: μ < 50، اختبار الطرف الأيسر
2. Let α = 0.05 be the significance level.
لنفترض أن α = 0.05 هو مستوى الدلالة.
a) For the left tailed test, there is the critical value of -Z0.05 = 1.645, and the rejection region is given by Z < -1.645,
بالنسبة لاختبار الطرف الأيسر، القيمة الحرجة -Z0.05 = 1.645، ومنطقة الرفض تُعطى بواسطة Z < -1.645،
as shown in the Figure 1, the green area. The green area now is equal α.
كما هو موضح في الشكل 1 المنطقة الخضراء. المنطقة الخضراء الآن تساوي α.
(الشكل) Figure 9
3. The test statistic is given by
تُعطى إحصائية الاختبار بواسطة
4. The above test statistic is computed based on the information provided to us by the sample data. Thus Z= -1.1839
تُحسب إحصائية الاختبار أعلاه بناءً على المعلومات المُقدمة لنا من بيانات العينة. وبالتالي، Z = -1.1839
5. Since the calculated value of the test statistic, namely -1.1839, does not fall in the rejection region, then H0 is not rejected.
بما أن القيمة المحسوبة لإحصائية الاختبار، وهي -1.1839، لا تقع في منطقة الرفض، فإن H0 غير مرفوضة.
6. The conclusion is that μ is not less than 50. Therefore μ ≥ 50.
. الاستنتاج هو أن μ لا تقل عن ٥٠. وبالتالي، μ ≥ ٥٠.
P-value Method Steps: For a specified value of the population mean μ0 we have (We are using the z-test on one mean) for testing on one proportion the steps go like this:
خطوات طريقة القيمة الاحتمالية: لقيمة محددة لمتوسط المجتمع μ0، لدينا (نستخدم اختبار z على متوسط واحد) لاختبار نسبة واحدة. الخطوات كالتالي
1. State the null and alternative hypotheses
صِغ الفرضية الصفرية والفرضية البديلة
There are three ways to set up the null and the alternative Hypotheses.
هناك ثلاث طرق لصياغة الفرضية الصفرية والفرضية البديلة
a) Equal hypothesis versus not equal hypothesis
فرضية متساوية مقابل فرضية غير متساوية
H0: μ = μ0 versus H1: μ ≠ μ0, Two-tailed test (اختبار ثنائي الطرف)
b) At least versus less than: (أقل من)
H0: μ ≥ μ0 versus H1: μ < μ0, Left-tailed test (اختبار ذو طرف أيسر)
c) At most versus greater than: (أقصى من)
H0: μ ≤ μ0 versus H1: μ > μ0, right-tailed test (اختبار ذو طرف أيمن)
2. Let α be the significance level for the test.
لنفترض أن α هو مستوى الدلالة للاختبار.
3. for the test statistic we have where n is sample size.
بالنسبة لإحصائية الاختبار، حيث n هو حجم العينة.
4. The above test statistic is computed based on the information provided to us by the sample data.
تُحسب إحصائية الاختبار أعلاه بناءً على المعلومات المُقدمة لنا من بيانات العينة.
5. Apply how the p-value is calculated based on the type of your test, as shown above.
طبّق كيفية حساب القيمة الاحتمالية بناءً على نوع الاختبار، كما هو موضح أعلاه.
The statistical decision will be made based on the case on hand
سيتم اتخاذ القرار الإحصائي بناءً على الحالة المطروحة
whether we have a two-tailed, a left-tailed or a right-tailed test, by comparing the computed p-value, for the test, to the significance level stated in step 2.
سواءً كان لدينا اختبار ذو طرفين، أو أيسر، أو أيمن، وذلك بمقارنة القيمة الاحتمالية المحسوبة للاختبار بمستوى الدلالة المحدد في الخطوة 2.
If the computed p-value is less than α, H0 will be rejected; otherwise, do not reject H0.
إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0؛ وإلا، فلا يتم رفض H0.
6. The interpretation and conclusion are due to answer the question that was raised.
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح.
(مثال) EXAMPLE 4
Using the information in Example 4.3, test the above hypothesis there by the P-value method.
باستخدام المعلومات الواردة في المثال 4.3، اختبر الفرضية أعلاه باستخدام طريقة القيمة الاحتمالية.
(الحل) Solution
As in the steps we do not need to find a critical value for this method. The significance level was given to be 0.05.
كما في الخطوات السابقة، لا نحتاج إلى إيجاد قيمة حرجة لهذه الطريقة. مستوى الدلالة هو 0.05.
Following the steps as if it were the classical method, we find that the test statistic has the value of -1.1839. Let us find the p-value for this left-tailed test, see Figure 10
باتباع الخطوات كما لو كانت الطريقة التقليدية، نجد أن قيمة إحصائية الاختبار هي -1.1839. لنوجد القيمة الاحتمالية لهذا الاختبار ذي الطرف الأيسر، انظر الشكل 10.
The p-value = P (Z < -1.18) for using the Standard Normal Table, we get P-value = 0.1190. It is greater than Alpha. We do not reject the null hypothesis. Hence, we conclude that μ is not less than 50, therefore μ ≥ 50.
باستخدام جدول التوزيع الطبيعي القياسي، نحصل على القيمة الاحتمالية = 0.1190. وهي أكبر من ألفا. لا نرفض الفرضية الصفرية. وبالتالي، نستنتج أن μ ليس أقل من 50، وبالتالي μ ≥ 50.
It is to be recalled that the two methods used above lead to the same conclusion. In case there is a contradiction between them, i.e. if you reject the Null hypothesis by using one of them while you did not reject the Null Hypothesis by using the other method. It is for sure you have made a mistake in one of them. Check it again.
تجدر الإشارة إلى أن الطريقتين المستخدمتين أعلاه تؤديان إلى نفس النتيجة. في حال وجود تناقض بينهما، أي إذا رفضتَ فرضية العدم باستخدام إحداهما ولم ترفضها باستخدام الطريقة الأخرى، فمن المؤكد أنك أخطأتَ في إحداهما. تحقق من ذلك مرة أخرى.
Case II: Testing on One Mean, μ When Population Variance, σ2 Unknown
الحالة الثانية: الاختبار على متوسط واحد μ عندما يكون تباين المجتمع σ₂ مجهولًا
Since the population variance, σ2 is not known, it is traditionally reasonable to ask about the sample size.
بما أن تباين المجتمع، σ₂، غير معروف، فمن المنطقي تقليديًا السؤال عن حجم العينة.
This is based on the earlier presentations done in Chapter 3, when we compare the standard normal distribution with the student’s t-distribution.
يستند هذا إلى العروض التقديمية السابقة التي قُدّمت في الفصل الثالث، عندما قارنّا التوزيع الطبيعي القياسي بتوزيع t للطلاب.
We found out there that when n, the sample size is large, usually n ≥ 30, is suitable to use the standard normal distribution for the test statistic involving one mean.
وجدنا أنه عندما يكون حجم العينة كبيرًا، عادةً n ≥ 30، يكون من المناسب استخدام التوزيع الطبيعي القياسي لإحصاء الاختبار الذي يتضمن متوسطًا واحدًا.
Based on this discussion we have two cases to consider.
بناءً على هذه المناقشة، لدينا حالتان للنظر فيهما.
(حجم عينة كبير) A) large Sample Size
In this part, since the sample size is large, n ≥ 30, we will use the same procedure for testing a statistical hypothesis about one population mean with one change.
في هذا الجزء، ونظرًا لكبر حجم العينة (n ≥ 30) ، سنستخدم نفس الإجراء لاختبار فرضية إحصائية حول متوسط مجتمع واحد مع تغيير واحد.
That change will take place in calculating the test statistic Z, when the standard deviation of the population is replaced by that of the sample. Based on that, the test statistic will be given by
سيحدث هذا التغيير عند حساب إحصائية الاختبار Z، عندما يُستبدل الانحراف المعياري للمجتمع بانحراف العينة. بناءً على ذلك، سيتم الحصول على إحصائية الاختبار بواسطة
The test that will be used is the Z-Test. The steps, in the classical method and the P-value method, are the same as above for this case of testing about one mean when the population variance is unknown.
الاختبار المُستخدم هو اختبار Z. الخطوات في الطريقة التقليدية وطريقة القيمة الاحتمالية هي نفسها المذكورة أعلاه في هذه الحالة لاختبار متوسط واحد عندما يكون تباين المجتمع مجهولًا.
(حجم عينة صغير) B) Small Sample Size
In this part, since the sample size is small, n < 30, we will use the same procedure for testing a statistical hypothesis about one population mean with one change.
في هذا الجزء، ونظرًا لصغر حجم العينة (n < 30) ، سنستخدم نفس الإجراء لاختبار فرضية إحصائية حول متوسط مجتمع واحد مع تغيير واحد.
That change will take place in replacing Z as the test statistic with T, where T will have a student t-distribution with degrees of freedom ν = n-1. Based on that, the test statistic will be given by
سيحدث هذا التغيير عند استبدال Z كإحصائية اختبار بـ T، حيث سيكون لـ T توزيع t للطلاب بدرجات حرية ν = n-1. بناءً على ذلك، سيتم الحصول على إحصائية الاختبار بواسطة:
The t-distribution is another continuous distribution that is widely used in statistics. Because of that let us describe that distribution before getting to use it here.
توزيع t هو توزيع مستمر آخر شائع الاستخدام في الإحصاء. لذلك، دعونا نصف هذا التوزيع قبل استخدامه هنا.
In case I, above, we discussed testing a statistical hypothesis when the population variance was known.
في الحالة الأولى، ناقشنا اختبار فرضية إحصائية عندما يكون تباين المجتمع معلومًا.
We now have another case on hand when the population variance, or the standard deviation, is unknown, and we have a small sample.
لدينا الآن حالة أخرى عندما يكون تباين المجتمع، أو الانحراف المعياري، مجهولًا، ولدينا عينة صغيرة.
The Z-Test discussed in Case I and Case II A) does not apply any more. We have to appeal for another distribution. This distribution is the t-distribution.
لم يعد اختبار Z الذي تمت مناقشته في الحالتين الأولى والثانية (أ) ينطبق. علينا اللجوء إلى توزيع آخر. هذا التوزيع هو توزيع t.
In this case we do not replace σ by s anymore, and say that
في هذه الحالة، لا نستبدل σ بـ s، ونقول إن
Is normally distributed, with mean 0 and variance 1. Instead
موزع بشكل طبيعي، بمتوسط 0 وتباين 1. بدلًا من ذلك،
and this random variable follows Student's t-distribution with n-1 degrees of freedom. So, let us have the properties of the t-distribution as listed below.
ويتبع هذا المتغير العشوائي توزيع t الخاص بالطالب مع n-1 درجة حرية. لذا، لنفترض أن خصائص توزيع t كما هو موضح أدناه.
1. The t-distribution is controlled by its degrees of freedom. It is different for different degrees of freedom.
يتم التحكم في توزيع t بواسطة درجات حريته. يختلف باختلاف درجات الحرية.
2. The mean of the distribution is 0, and it is symmetric about its mean.
متوسط التوزيع يساوي 0، وهو متماثل حول متوسطه.
3. As it was the case with the standard normal distribution, the total area under the curve is 1.
كما هو الحال مع التوزيع الطبيعي القياسي، فإن المساحة الكلية تحت المنحنى تساوي 1.
4. The horizontal axis acts like a horizontal asymptote, i.e., as t increases (or decreases) without any bound; the graph approaches the horizontal axis but never intersects it.
يعمل المحور الأفقي كخط مقارب أفقي، أي عندما تزداد (أو تنقص) قيمة t دون أي حد؛ يقترب الرسم البياني من المحور الأفقي ولكنه لا يتقاطع معه أبدًا.
5. Compared with the standard normal distribution, and if drawn on the same scale, we find that the peak for standard normal distribution is higher than that of the t-distribution.
بالمقارنة مع التوزيع الطبيعي القياسي، وإذا رُسم على نفس المقياس، نجد أن ذروة التوزيع الطبيعي القياسي أعلى من ذروة التوزيع t.
This makes the tails for the t-distribution thicker than those for the standard distribution.
هذا يجعل ذيول التوزيع t أكثر سمكًا من ذيول التوزيع القياسي.
6. The variance for the t-distribution is > 1.
تباين التوزيع t أكبر من 1.
7. As the number of degrees of freedom increases (i.e. as the sample size n increases) the t-distribution gets closer to Z, the standard normal distribution.
مع زيادة عدد درجات الحرية (أي مع زيادة حجم العينة n) يقترب التوزيع t من Z، التوزيع الطبيعي القياسي
In this case the two curves for the two distributions will look almost alike. That is, and based on the law of large numbers, the estimator S, of σ, gets closer and closer.
في هذه الحالة، سيبدو المنحنيان للتوزيعين متشابهين تقريبًا. أي أنه، واستنادًا إلى قانون الأعداد الكبيرة، تقترب قيمة المقدّر S لـ σ أكثر فأكثر.
When testing regarding one mean with the population variance unknown, and a small sample, the steps in the classical and the p-value methods look almost the same as in the cases discussed above, but for more clarity and consistency we will list the steps here again.
Classical Method Steps: For a specified value of the population mean μ0 we have (We are using the T-test on one mean):
خطوات الطريقة الكلاسيكية: لقيمة محددة لمتوسط المجتمع μ0، لدينا (نستخدم اختبار T على متوسط واحد)
1. State the null and alternative hypotheses
صِغ الفرضية الصفرية والفرضية البديلة
There are three ways to set up the null and the alternative Hypotheses.
هناك ثلاث طرق لصياغة الفرضية الصفرية والفرضية البديلة
a) Equal hypothesis versus not equal hypothesis (فرضية التساوي مقابل فرضية عدم التساوي)
H0: μ = μ0 versus H1: μ ≠ μ0, two-tailed test (اختبار ذو طرفين)
b) At least versus less than (على الأقل مقابل أقل من)
H0: μ = μ0 versus H1: μ < μ0, left-tailed test (اختبار ذو طرف أيسر)
c) At most versus greater than (على الأكثر مقابل أكبر من)
H0: μ = μ0 versus H1: μ > μ0, right tailed test (اختبار ذو طرف أيمن)
It is to be noted here that the two hypotheses are mutually exclusive sets on the real line for the values of the parameter, with the equal sign always set to go with the null hypothesis.
تجدر الإشارة هنا إلى أن الفرضيتين هما مجموعتان متنافيتان على خط الأعداد الحقيقية لقيم المعلمة، مع وضع علامة تساوي دائمًا مع فرضية العدم.
This is so chosen in order to compute the value of the test statistics based on the null hypothesis being true.
تم اختيار هذا لحساب قيمة إحصاءات الاختبار بناءً على صحة الفرضية الصفرية.
2. Let α be the significance level for the test. Based on the three cases in step 1, we have the following three cases that will go along, for finding the critical value(s)and the rejection region(s)
لنفترض أن α هو مستوى دلالة الاختبار. بناءً على الحالات الثلاث في الخطوة 1، لدينا الحالات الثلاث التالية التي ستتبع لإيجاد القيمة (القيم) الحرجة ومنطقة (مناطق) الرفض:
a) For the two tailed test there are two critical values: -tα/2 & tα/2, and the critical region is given by |T|> tα, as shown in the figure.
للاختبار ثنائي الذيل هناك قيمتان حرجتان: -tα/2 وtα/2، والمنطقة الحرجة تُعطى بواسطة T|> tα| كما هو موضح في الشكل.
b) For the left tailed test, there is the critical value of - t, and the rejection region is given by T < -tα, as shown in the figure.
للاختبار ذي الذيل الأيسر، هناك القيمة الحرجة -t، ومنطقة الرفض تُعطى بواسطة T < -tα، كما هو موضح في الشكل.
c) For the right tailed test, again, there is on critical value given by tα, and the rejection region is T > tα, as shown in the figure.
للاختبار ذي الذيل الأيمن مرة أخرى، هناك قيمة حرجة واحدة تُعطى بواسطة tα، ومنطقة الرفض هي T > tα، كما هو موضح في الشكل.
3. For the test statistic we have T where n is sample size s is the standard deviation of the sample, and T has the student t-distribution with n-1 degrees of freedom.
بالنسبة لإحصائية الاختبار لدينا T حيث n هو حجم العينة، وs هو الانحراف المعياري للعينة، وT هو توزيع t للطلاب بدرجات حرية n-1.
4. The above test statistic is computed based on the information provided to us by the sample data.
تُحسب إحصائية الاختبار المذكورة أعلاه بناءً على المعلومات المُقدمة من بيانات العينة.
5. The statistical decision will be made based on the case on hand whether we have a two-tailed, a left-tailed or a right-tailed test, by comparing the computed value, of the test, statistic to the critical value based on the test being chosen.
يُتخذ القرار الإحصائي بناءً على الحالة المطروحة، سواءً كان لدينا اختبار ذو طرفين، أو ذيل أيسر، أو ذيل أيمن، وذلك بمقارنة القيمة المحسوبة لإحصائية الاختبار بالقيمة الحرجة بناءً على الاختبار المُختار.
6. The interpretation and conclusion are due to answer the question that was raised.
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح.
In order to complete the picture, as before, let us list the steps in testing a statistical hypothesis regarding one mean when the population variance is unknown by using the p-value method.
لإكمال الصورة، كما سبق، دعونا نُدرج خطوات اختبار فرضية إحصائية تتعلق بمتوسط حسابي واحد عندما يكون تباين المجتمع مجهولاً باستخدام طريقة القيمة الاحتمالية.
(خطوات طريقة القيمة الاحتمالية) P-value Method Steps
For a specified value of the population mean μ0 we have (We are using the T-test on one mean) the following steps need to be followed:
لقيمة محددة لمتوسط المجتمع μ0، لدينا (نستخدم اختبار T على متوسط واحد)، يجب اتباع الخطوات التالية:
1. State the null and alternative hypotheses
صياغة الفرضيات الصفرية والبديلة
There are three ways to set up the null and the alternative Hypotheses.
هناك ثلاث طرق لصياغة الفرضيات الصفرية والبديلة
a) Equal hypothesis versus not equal hypothesis (فرضية متساوية مقابل فرضية غير متساوية)
H0: μ = μ0 versus H1: μ ≠ μ0, two-tailed test (اختبار ذو طرفين)
b) At least versus less than (أقل من)
H0: μ ≥ μ0 versus H1: μ < μ0, left-tailed test (اختبار ذو طرف أيسر)
c) At most versus greater than (أقصى من)
H0: μ ≤ μ0 versus H1: μ > μ0, right tailed test (اختبار ذو طرف أيمن)
2. Let α be the significance level for the test.
ليكن α هو مستوى دلالة الاختبار.
3. The test statistic T where n is sample size s is the standard deviation of the sample, and T has the student t-distribution with n-1 degrees of freedom.
إحصائية الاختبار T حيث n هو حجم العينة، وs هو الانحراف المعياري لها، وT هو توزيع t للطلاب بدرجات حرية n-1.
4. The above test statistic is computed based on the information provided to us by the sample data.
تُحسب إحصائية الاختبار المذكورة أعلاه بناءً على المعلومات المُقدمة من بيانات العينة.
5. Apply how the p-value is calculated based on the type of your test, as shown above. In this case we need to use the t-value that was found in step 4, instead of the z-value, since we have a T-test now.
طبّق طريقة حساب القيمة الاحتمالية بناءً على نوع الاختبار، كما هو موضح أعلاه. في هذه الحالة، نحتاج إلى استخدام القيمة الاحتمالية التي تم الحصول عليها في الخطوة ٤، بدلاً من القيمة الاحتمالية z، نظرًا لوجود اختبار T الآن.
The statistical decision will be made based on the case on hand whether we have a two-tailed, a left tailed or a right-tailed test, by comparing the computed p-value for the test statistic to the significance level stated in step 2. If the computed p-value is less than α, H0 will be rejected; otherwise do not reject H0.
سيتم اتخاذ القرار الإحصائي بناءً على الحالة المطروحة، سواءً كان لدينا اختبار ذو طرفين، أو طرف أيسر، أو طرف أيمن، وذلك بمقارنة القيمة الاحتمالية المحسوبة لإحصائية الاختبار بمستوى الدلالة المذكور في الخطوة ٢. إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0؛ وإلا، فلا ترفض H0.
6. The interpretation and conclusion are due to answer the question that was raised.
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح.
It is to be noted here that the p-value cannot be precisely found from the Tables as it as the case with Z-Test.
تجدر الإشارة هنا إلى أنه لا يمكن حساب القيمة الاحتمالية بدقة من الجداول كما هو الحال في اختبار Z
By using the T-Table, we can put a range on the p-value only, while with technology the value will be given by the program used.
باستخدام جدول T، يمكننا تحديد نطاق للقيمة الاحتمالية فقط، بينما باستخدام التكنولوجيا، يتم تحديد القيمة بواسطة البرنامج المُستخدم.
(مثال) EXAMPLE 5
A colony of laboratory mice consisted of several hundred animals.
تتكون مستعمرة من فئران المختبر من عدة مئات من الفئران.
Their average weight was believed to 30 gm.
كان يُعتقد أن متوسط وزنها 30 غرامًا
An experiment was conducted to check on this belief.
أُجريت تجربة للتحقق من هذا الاعتقاد
A simple random sample of 25 animals was taken.
أُخذت عينة عشوائية بسيطة من 25 حيوانًا.
The average weight for this sample turned up to be 33 grams with a sample standard deviation of 5 gm.
تبين أن متوسط وزن هذه العينة 33 غرامًا، مع انحراف معياري للعينة قدره 5 غرامات.
What conclusion can be made using if the level of significance will be 5%?
ما الاستنتاج الذي يمكن التوصل إليه إذا كان مستوى الدلالة 5%؟
(الحل) Solution
Using the classical method steps for testing on one mean, using the T-test, we have:
باستخدام خطوات الطريقة التقليدية للاختبار على متوسط واحد، باستخدام اختبار T، لدينا
1. H0: μ = 30 versus H1: μ # 30, Two-tailed test (اختبار ثنائي الذيل)
2. It is assumed that the significance level is 0.05. Since we have a two-tailed test, we have the following critical values and the corresponding Rejection regions.
يُفترض أن مستوى الدلالة هو 0.05. بما أن لدينا اختبارًا ثنائي الذيل، فلدينا القيم الحرجة التالية ومناطق الرفض المقابلة لها.
Figure 11 -t 0.025=- t .025 = 2.064
We see, from Figure 11, that the critical values are ± 2.064, and the rejection regions are given by |T| > 2.064.
الشكل 11 = 0.025 2.064 t .025 = 2.064. نرى من الشكل 11 أن القيم الحرجة هي ± 2.064، وأن مناطق الرفض تُعطى بواسطة T| > 2.064|.
3. the test statistic is
إحصائية الاختبار هي
4. Using the information given on hand, by calculating the above expression for T:
باستخدام المعلومات المتوفرة، وبحساب التعبير أعلاه لـ T:
5. Since the value of the test statistic falls in the rejection region, we reject H0.
بما أن قيمة إحصائية الاختبار تقع في منطقة الرفض، فإننا نرفض H0.
6. Based on the data provided the average weight is > 30.
بناءً على البيانات المُقدمة، يكون متوسط الوزن أكبر من ٣٠.
Hypothesis Testing Concerning Two Parameters
اختبار الفرضيات المتعلقة بمعلمتين
In this section we will discuss, and display, the procedures for testing a statistical hypothesis about two populations’ parameters.
في هذا القسم، سنناقش ونعرض إجراءات اختبار فرضية إحصائية حول معلمات مجتمعين.
In general, let those parameters be denoted by θ1, and θ2. Thus the steps go as follows:
بشكل عام، يُرمز لهذه المعلمات بـ θ1 و θ2. وبالتالي، تسير الخطوات كما يلي
Tests about Two Proportions P1 – P2
اختبارات حول نسبتين
The populations’ parameters which are of interest in this section are the populations’ proportions. In section 4.4.1, we discussed inference regarding one population proportion.
معلمات المجتمعين التي نهتم بها في هذا القسم هي نسب المجتمعين. في القسم ٤.٤.١، ناقشنا الاستدلال على نسبة مجتمع واحد.
We will now tackle the question how to run a statistical hypothesis testing on two populations’ proportions. To conduct inference about two population proportions
سنتناول الآن كيفية إجراء اختبار فرضية إحصائية على نسب مجتمعين. لإجراء استدلال حول نسبتين مجتمعين
we must first determine the sampling distribution of the difference of two proportions. Recall that the best point estimate of p, the proportion of the population with a certain characteristic, is given by
يجب علينا أولاً تحديد توزيع العينة للفرق بين النسبتين. تذكر أن أفضل تقدير نقطي لـ p، أي نسبة المجتمع الذي يتمتع بخاصية معينة، يُعطى بالمعادلة:
where x is the number of individuals in the sample with the specified characteristic of interest and n is the sample size.
حيث x هو عدد الأفراد في العينة ذوي الخاصية المحددة موضع الاهتمام، وn هو حجم العينة.
Recall from Chapter 3 that the sampling distribution of p̂ is approximately normal, with mean p̂ =p and standard deviation
تذكر من الفصل الثالث أن توزيع العينة لـ p̂ يكون طبيعيًا تقريبًا، بمتوسط p = p̂ وانحراف معياري.
is normally distributed, with mean 0 and standard deviation 1.
يُوزع توزيعًا طبيعيًا، بمتوسط 0 وانحراف معياري 1
Using this information along with the independence of the two samples taken from two different populations,
باستخدام هذه المعلومات، بالإضافة إلى استقلالية العينتين المأخوذتين من مجتمعين مختلفين،
we obtain the sampling distribution of the difference between two proportions. Let us set the sampling distribution for P1 – P2.
نحصل على توزيع العينة للفرق بين نسبتين. لنحدد توزيع العينة لـ P1 – P2.
Suppose that two simple random samples were taken from two different populations with proportions of P1 and P2, for a certain property that we are interested in.
لنفترض أن عينتين عشوائيتين بسيطتين أُخذتا من مجتمعين مختلفين بنسبتي P1 وP2، لخاصية معينة تهمنا.
The First sample is of size n1 that produced x individuals having that interesting characteristic, while sample 2 is of size n2 that produced y individuals having the specified characteristic. Thus the sampling distribution of
العينة الأولى بحجم n1 وأنتجت x أفرادًا يتمتعون بتلك الخاصية المهمة، بينما العينة الثانية بحجم n2 وأنتجت y أفرادًا يتمتعون بالخاصية المحددة. وبالتالي، يكون توزيع العينة
(طبيعيًا تقريبًا مع المتوسط) approximately normal with mean
(والانحراف المعياري) And standard deviation
Provided that the condition on each sample is being satisfied. Thus, the standardized version of p̂1 – p̂2 is given by
بشرط استيفاء الشرط في كل عينة. وبالتالي، تُعطى الصيغة المعيارية لـ p̂1 – p̂2 بالصيغة التالية:
This has an approximate standard normal distribution.
هذا التوزيع طبيعي معياري تقريبي.
When comparing two population proportions, the null hypothesis will always have the equal sign with it i.e., p1 = p2 = p where p is the common value for the population proportion.
عند مقارنة نسبتين من المجتمع، تحمل الفرضية الصفرية دائمًا علامة تساوي، أي p1 = p2 = p، حيث p هي القيمة المشتركة لنسبة المجتمع.
Based on this setting we can write the above z statistic in this form
بناءً على هذا الإعداد، يمكننا كتابة إحصائية z أعلاه بهذا الشكل
the above test statistic will be used in the two methods for testing a statistical hypothesis about the difference between two population proportions. We start with the classical method.
ستُستخدم إحصائية الاختبار أعلاه في الطريقتين لاختبار فرضية إحصائية حول الفرق بين نسبتين من المجتمع. نبدأ بالطريقة الكلاسيكية.
Classical Method Steps: We are using the z-test on two proportions (2prop Z-Test):
خطوات الطريقة الكلاسيكية: نستخدم اختبار z على نسبتين (اختبار Z ثنائي الاحتمال)
1. State the null and alternative hypotheses
صِغ الفرضية الصفرية والفرضية البديلة
There are three ways to set up the null and the alternative Hypotheses.
هناك ثلاث طرق لصياغة الفرضية الصفرية والفرضية البديلة
a) Equal hypothesis versus not equal hypothesis (فرضية متساوية مقابل فرضية غير متساوية)
H0: P1 = P2 versus H1: P1 # P2, two-tailed test (اختبار ذو طرفين)
b) At least versus less than (على الأقل مقابل أقل من)
H0: P1 = P2 versus H1: P1 < P2, left tailed test (اختبار ذو طرف أيسر)
c) At most versus greater than (على الأكثر مقابل أكبر من)
H0: P1 = P2 versus H1: P1 > P2, right tailed test (اختبار ذو طرف أيمن)
2. Let α be the significance level. Based on the three cases in step 1, we have the following three cases that will go along for finding the critical values and rejection regions.
ليكن α مستوى الدلالة. بناءً على الحالات الثلاث في الخطوة 1، لدينا الحالات الثلاث التالية التي ستُستخدم لإيجاد القيم الحرجة ومناطق الرفض.
a) For the two tailed test there are two critical values: -Zα/2 & Zα/2, and the critical region is given by |Z|>Zα/2, as shown in the Figure 1.
للاختبار ثنائي الذيل، هناك قيمتان حرجتان: -Zα/2 وZα/2، والمنطقة الحرجة تُعطى بواسطة Z|>Zα/2| كما هو موضح في الشكل 1.
b) For the left tailed test, there is the critical value of -Zα, and the rejection region is given by Z < -Zα, as shown in the Figure 2.
للاختبار ذي الذيل الأيسر، هناك القيمة الحرجة -Zα، ومنطقة الرفض تُعطى بواسطة Z < -Zα، كما هو موضح في الشكل 2.
c) For the right tailed test, again, there is on critical value given by Zα, and the rejection region is Z > Zα, as shown in the Figure 3.
للاختبار ذي الذيل الأيمن، مرة أخرى، هناك قيمة حرجة واحدة تُعطى بواسطة Zα، ومنطقة الرفض هي Z > Zα، كما هو موضح في الشكل 3.
3. For the test statistic we have z as defined above.
لإحصاء الاختبار لدينا z، كما هو موضح أعلاه.
3. The above test statistic is computed based on the information provided to us by the sample data.
تُحسب إحصائية الاختبار أعلاه بناءً على المعلومات المُقدمة لنا من بيانات العينة.
4. The statistical decision will be made based on the case on hand whether we have a two- tailed, a left-tailed or a right-tailed test,
يُتخذ القرار الإحصائي بناءً على الحالة المطروحة، سواءً كان لدينا اختبار ذو طرفين، أو اختبار ذو طرف أيسر، أو اختبار ذو طرف أيمن
by comparing the computed value of the test statistic to the critical value based on the test being chosen.
وذلك بمقارنة القيمة المحسوبة لإحصائية الاختبار بالقيمة الحرجة بناءً على الاختبار المُختار.
5. The interpretation and conclusion are due to answer the question that was raised.
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح.
P-value Method Steps: We are using the z-test on two proportions:
خطوات طريقة القيمة الاحتمالية: نستخدم اختبار z على نسبتين
1. State the null and alternative hypotheses: There are three ways to set up the null and the alternative Hypotheses.
صِغ الفرضيات الصفرية والبديلة: هناك ثلاث طرق لصياغة الفرضيات الصفرية والبديلة.
a) Equal hypothesis versus not equal hypothesis
فرضية متساوية مقابل فرضية غير متساوية
H0: P1 = P2 versus H1: P1 # P2, two-tailed test (اختبار ذو طرفين)
b) At least versus less than: (على الأقل مقابل أقل من)
H0: P1 ≥ P2 versus H1: P1 < P2, left-tailed test (اختبار ذو طرف أيسر)
c) At most versus greater than: (على الأكثر مقابل أكبر من)
H0: P1 ≤ P2 versus H1: P1 > P2, right-tailed test (اختبار ذو طرف أيمن)
2. Let α(= 0.01, 0.05, 0.10) be the significance level.
ليكن α(= 0.01، 0.05، 0.10) مستوى الدلالة.
3. The test statistic for this case, as defined above, is given by
إحصائية الاختبار لهذه الحالة، كما هو مُعرّف أعلاه، تُعطى بواسطة
4. The above test statistic is computed based on the information provided to us by the sample data.
تُحسب إحصائية الاختبار المذكورة أعلاه بناءً على المعلومات المُقدمة لنا من بيانات العينة.
5. How to calculate the p-value for your test?
كيف تُحسب القيمة الاحتمالية لاختبارك؟
Based on the test type stated in Step 1. above, we have the following options
بناءً على نوع الاختبار المذكور في الخطوة ١ أعلاه، لدينا الخيارات التالية
a) For the 2-tailed test, and after calculating the value of the test statistic, Zcal in step 4, the p-value is found by
بالنسبة للاختبار ثنائي الذيل، وبعد حساب قيمة إحصائية الاختبار، Zcal في الخطوة ٤، تُحسب القيمة الاحتمالية بالصيغة التالية
p-value = 2*P (Z < Zcal) or p-value = 2*P (Z > Zcal), conditioned on whether the Zcal that is negative or positive.
القيمة الاحتمالية = ٢*P(Z < Zcal) أو القيمة الاحتمالية = ٢*P(Z > Zcal)، بشرط أن تكون قيمة Zcal سالبة أم موجبة.
The statistical decision will be made based by comparing the computed p- value for the test statistic to the significance level stated in step 2.
سيتم اتخاذ القرار الإحصائي بناءً على مقارنة القيمة الاحتمالية المحسوبة لإحصائية الاختبار بمستوى الدلالة المذكور في الخطوة ٢.
If the computed p-value is less than α, H0 will be rejected; otherwise do not reject H0.
إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0؛ وإلا، فلا تُرفض H0.
b) For the left-tailed test, and after calculating the value of the test statistic, Zcal in step 4, the p-value is found by: p-value = P (Z < Zcal).
في اختبار الطرف الأيسر، وبعد حساب قيمة إحصائية الاختبار Zcal في الخطوة 4، تُحسب القيمة الاحتمالية (p-value) بالمعادلة التالية: p-value = P (Z < Zcal).
The statistical decision will be made by comparing the computed p- value for the test statistic to the significance level stated in step 2.
يُتخذ القرار الإحصائي بمقارنة القيمة الاحتمالية المحسوبة لإحصائية الاختبار بمستوى الدلالة المحدد في الخطوة 2.
If the computed p-value is less than α, H0 will be rejected; otherwise, do not reject H0.
إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0؛ وإلا، فلا تُرفض H0.
c) For the right-tailed test, and after calculating the value of the test statistic, Zcal in step 4, the p-value is found by:
في اختبار الطرف الأيمن، وبعد حساب قيمة إحصائية الاختبار Zcal في الخطوة 4، تُحسب القيمة الاحتمالية (p-value) بالمعادلة التالية
p-value = P (Z > Zcal). The statistical decision will be made by comparing the computed p- value for the test statistic to the significance level stated in step 2.
p-value = P (Z > Zcal). يُتخذ القرار الإحصائي بمقارنة القيمة الاحتمالية المحسوبة لإحصائية الاختبار بمستوى الدلالة المحدد في الخطوة 2.
If the computed p-value is less than α, H0 will be rejected; otherwise, do not reject H0.
إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0؛ وإلا، فلا تُرفض H0.
6. The interpretation and conclusion are due to answer the question that was raised
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح
(مثال) EXAMPLE 8
In clinical trials of testing a certain drug, before it is released for the public, 3800 adults were randomly divided into two groups.
في التجارب السريرية لاختبار دواء معين، قبل طرحه للجمهور، قُسّم ٣٨٠٠ بالغ عشوائيًا إلى مجموعتين.
The patients in Group 1 (Experimental group) received 200 mg of the drug, while the patients in group 2 (control group) received a placebo.
تلقى مرضى المجموعة ١ (المجموعة التجريبية) ٢٠٠ ملغ من الدواء، بينما تلقى مرضى المجموعة ٢ (المجموعة الضابطة) دواءً وهميًا.
Out of the 2100 patients in the experimental group, 550 reported headaches as a side effect.
من بين ٢١٠٠ مريض في المجموعة التجريبية، أبلغ ٥٥٠ مريضًا عن صداع كأثر جانبي.
Of the 1700 patients in the control group 370 reported headaches as a side effect.
ومن بين ١٧٠٠ مريض في المجموعة الضابطة، أبلغ ٣٧٠ مريضًا عن صداع كأثر جانبي.
Is there significant evidence to support the claim that the proportion of the drug users that experienced headaches as a side effect is greater than the proportion in the control group at the α = 0.05 level of significance.
هل هناك دليل ملموس يدعم الادعاء بأن نسبة متعاطي المخدرات الذين عانوا من الصداع كأثر جانبي أكبر من نسبتهم في المجموعة الضابطة عند مستوى دلالة α = ٠.٠٥؟
(الحل) Solution
Using the conditions, and all requirements, to carry the test of a statistical hypothesis on the difference between two proportions, we have
باستخدام الشروط وجميع المتطلبات اللازمة لاختبار فرضية إحصائية حول الفرق بين نسبتين، نحصل على
1. The samples are independently obtained using simple random sampling
تم الحصول على العينات بشكل مستقل باستخدام العينة العشوائية البسيطة.
3. therefore (لذلك)
Thus, we proceed with the classical method using the 6 steps, and then we apply the p-value method second. So we have:
نتبع الطريقة التقليدية باستخدام الخطوات الست، ثم نطبق طريقة القيمة الاحتمالية. وبالتالي، نحصل على
1. H0: P1 = P2 versus H1: P1 > P2, right-tailed test. (اختبار ذو طرف يمين)
2. α = 0.05 is the level of significance. The Critical value is Z0.05 = 1.645 and the rejection region is given by Z > 1.645.
α = 0.05 هو مستوى الدلالة. القيمة الحرجة هي Z0.05 = 1.645، ومنطقة الرفض هي Z > 1.645.
3. The test statistic is (إحصائية الاختبار هي)
4. Zcal= 3.1668, based on the data provided.
Zcal = 3.1668، بناءً على البيانات المُقدمة.
5. Since the test statistic falls in the rejection region, the null hypothesis is rejected, i.e., H0: P1 = P2 is rejected, and H1: P1 > P2 is being supported.
بما أن إحصائية الاختبار تقع في منطقة الرفض، تُرفض الفرضية الصفرية، أي أن H0: P1 = P2 مرفوضة، وأن H1: P1 > P2 مدعومة.
6. There is sufficient evidence at the α = 0.05 level of significance to support the claim that the proportion of adults taking 200 mg of the drug who experienced headaches is greater than the proportion of adults taking a placebo who experienced headaches.
توجد أدلة كافية عند مستوى الدلالة α = ٠.٠٥ لدعم الادعاء بأن نسبة البالغين الذين تناولوا ٢٠٠ ملغ من الدواء وعانوا من الصداع أكبر من نسبة البالغين الذين تناولوا دواءً وهميًا وعانوا من الصداع.
Now we will apply the p-value method steps on testing the claim that was set up in EXAMPLE 4.8. The steps go like this.
سنطبق الآن خطوات طريقة القيمة الاحتمالية لاختبار الادعاء الوارد في المثال ٤.٨. الخطوات كالتالي
1. State the null and alternative hypotheses (صِغ الفرضية الصفرية والفرضية البديلة)
H0: P1 ≤ P2 versus H1: P1 > P2, right-tailed test. (اختبار ذو طرف أيمن)
2. Let α = 0.05, be the significance level.
ليكن α = ٠.٠٥ هو مستوى الدلالة.
3. The test statistic for this case, as defined above, is given by
إحصائية الاختبار لهذه الحالة، كما هو مُعرّف أعلاه، تُعطى بالمعادلة
4. Zcal = 3.1668, based on the data provided.
Zcal = ٣٫١٦٦٨، بناءً على البيانات المُقدّمة.
5. How to calculate the p-value for your test?
كيف تُحسب القيمة الاحتمالية لاختبارك؟
Based on the test type stated in Step 1, we have a right-tailed test, then the p-value is found by: p-value = P (Z > Zcal) = P(Z > 3.1668) = 0.0007706.
بناءً على نوع الاختبار المذكور في الخطوة ١، لدينا اختبار ذو طرف أيمن، وبالتالي تُحسب القيمة الاحتمالية بالمعادلة التالية: القيمة الاحتمالية = P (Z > Zcal) = P(Z > ٣٫١٦٦٨) = ٠٫٠٠٧٧٠٦.
Since the computed p-value is less than α, H0 is rejected, and H1: P1 > P2 is being supported.
بما أن القيمة الاحتمالية المحسوبة أقل من α، يتم رفض H0، ويتم دعم H1: P1 > P2.
6. There is sufficient evidence at the α = 0.05 level of significance to support the claim that the proportion of adults taking 200 mg of the drug who experienced headaches is greater than the proportion of adults taking a placebo who experienced headaches.
توجد أدلة كافية عند مستوى الدلالة α = ٠.٠٥ لدعم الادعاء بأن نسبة البالغين الذين تناولوا ٢٠٠ ملغ من الدواء والذين عانوا من الصداع أكبر من نسبة البالغين الذين تناولوا دواءً وهميًا والذين عانوا من الصداع.
Tests about Two Means μ1-μ2
اختبارات حول المتوسطين
A) populations variances known
تباينات المجموعات السكانية المعروفة
In this section we will discuss, and display, the procedure for testing a statistical hypothesis about two populations’ parameters.
في هذا القسم، سنناقش ونعرض إجراءات اختبار فرضية إحصائية حول معايير مجموعتين سكانيتين.
The populations parameters which are of interest in this section are the populations means, μ1 and μ2.
معلمات المجموعات السكانية التي نهتم بها في هذا القسم هي متوسطا المجموعات السكانية، μ١ وμ٢.
To perform inference about the difference between two means, we must first check if the two samples on hand had been taken as independent or dependent samples.
لاستنتاج الفرق بين المتوسطين، يجب أولًا التحقق مما إذا كانت العينتان المتوفرتان قد أُخذتا كعينتين مستقلتين أم تابعتين.
A sampling method is independent when the individuals in one sample do not dictate which individuals are to be taken for the second sample.
تكون طريقة أخذ العينات مستقلة عندما لا يُحدد الأفراد في إحدى العينتين الأفراد الذين سيتم أخذهم في العينة الثانية.
A sampling method is dependent when the individuals selected to represent the first population are used to determine the individuals to be included in the second sample that is representing the second population.
تكون طريقة أخذ العينات مترابطة عندما يُستخدم الأفراد المختارون لتمثيل المجتمع الأول لتحديد الأفراد الذين سيتم تضمينهم في العينة الثانية التي تمثل المجتمع الثاني.
The interest, in this section, lies in the difference between those two means for two populations when the samples have been taken independently.
يكمن الاهتمام في هذا القسم في الفرق بين هذين المتوسطين لمجتمعين عند أخذ العينات بشكل مستقل.
The case when the sampling had been dependent will be discussed under another section later.
سيتم مناقشة حالة أخذ العينات المترابطة في قسم آخر لاحقًا.
We will give below the systematic steps in the two methods for testing a hypothesis, namely: the classical method and the p-value method. (For a calculator, this is the 2-sample z-test)
سنوضح أدناه الخطوات المنهجية في طريقتي اختبار الفرضية، وهما: الطريقة الكلاسيكية وطريقة القيمة الاحتمالية. (بالنسبة للآلة الحاسبة، هذا هو اختبار z لعينتين).
(خطوات الطريقة الكلاسيكية) Classical Method Steps
1. State the null and alternative hypotheses:
تحديد الفرضيات الصفرية والبديلة
There are three ways to set up the null and alternative Hypotheses.
هناك ثلاث طرق لوضع الفرضيات الصفرية والبديلة
a) Equal hypothesis versus not equal hypothesis
فرضية متساوية مقابل فرضية غير متساوية
H0: μ1 = μ2 versus H1: μ1 # μ2, two-tailed test. (اختبار ثنائي الذيل)
b) At least versus less than (على الأقل مقابل أقل من)
H0: μ1 = μ2 versus H1: μ1 < μ2, left-tailed test. (اختبار ذو طرف أيسر)
c) At most versus greater than: (على الأكثر مقابل أكبر من)
H0: μ1 = μ2 versus H1: μ1 > μ2, right-tailed test. (اختبار ذو طرف أيمن)
2. Let α be the significance level. Based on the three cases in step 1,
لنفترض أن α هو مستوى الدلالة. بناءً على الحالات الثلاث في الخطوة 1
we have the following three cases that will go along to find the critical values and the rejection regions for the test
لدينا الحالات الثلاث التالية التي ستُستخدم لإيجاد القيم الحرجة ومناطق الرفض للاختبار
a) For the two tailed test there are two critical values: -Zα/2 & Zα/2, and the critical region is given by |Z|> Zα/2, as shown in the figure.
للاختبار ثنائي الذيل، هناك قيمتان حرجتان: -Zα/2 وZα/2، وتُعطى المنطقة الحرجة بواسطة |Z|> Zα/2، كما هو موضح في الشكل.
b) For the left tailed test, there is the critical value of -Zα, and the rejection region is given by Z < -Zα, as shown in the figure.
للاختبار ذي الطرف الأيسر، هناك القيمة الحرجة -Zα، وتُعطى منطقة الرفض بواسطة Z < -Zα، كما هو موضح في الشكل.
c) For the right tailed test, again, there is on critical value given by Zα, and the rejection region is Z > Zα, as shown in the figure.
بالنسبة لاختبار الذيل الأيمن، توجد أيضًا قيمة حرجة واحدة تُعطى بـ Zα، ومنطقة الرفض هي Z > Zα، كما هو موضح في الشكل.
3. The test statistic we have Z where n is the sample size, x is the sample mean, and Z has the standard normal distribution.
لدينا إحصائية الاختبار Z حيث n هو حجم العينة، وx هو متوسط العينة، وZ هو التوزيع الطبيعي المعياري.
4. The above test statistic is computed based on the information provided to us by the sample data.
تُحسب إحصائية الاختبار أعلاه بناءً على المعلومات المُقدمة لنا من بيانات العينة.
5. The statistical decision will be made based on the case on hand whether we have a two- tailed, a left-tailed or a right-tailed test,
يُتخذ القرار الإحصائي بناءً على الحالة المطروحة، سواءً كان لدينا اختبار ثنائي الذيل، أو اختبار أيسر الذيل، أو اختبار أيمن الذيل
by comparing the computed value of the test statistic to the critical value based on the test being chosen.
وذلك بمقارنة القيمة المحسوبة لإحصائية الاختبار بالقيمة الحرجة بناءً على الاختبار المُختار.
6. The interpretation and conclusion are due to answer the question that was raised.
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح.
P-value Method Steps: (We are using the 2-sample z-test on the difference between two means). The steps go like this:
خطوات طريقة القيمة الاحتمالية: (نستخدم اختبار z لعينتين على الفرق بين متوسطين). الخطوات كالتالي
1. State the null and alternative hypotheses:
صياغة الفرضية الصفرية والفرضية البديلة
There are three ways to set up the null and the alternative Hypotheses.
هناك ثلاث طرق لصياغة الفرضية الصفرية والفرضية البديلة.
a) Equal hypothesis versus not equal hypothesis
فرضية التساوي مقابل فرضية عدم التساوي
H0: μ1 =μ2 versus H1: μ1 # μ2, Two-tailed test (اختبار ثنائي الذيل)
b) At least versus less than: (على الأقل مقابل أقل من)
H0: μ1 ≥ μ2 versus H1: μ1 < μ2, Left-tailed test (اختبار ذو طرف أيسر)
c) at most versus greater than: (على الأكثر مقابل أكبر من)
H0: μ1 ≤ μ2 versus H1: μ1 > μ2, right-tailed test (اختبار ذو طرف أيمن)
2. Let α = 0.05, and based on the three cases in step 1, we have the following three cases that will go along
لنفترض أن α = 0.05، وبناءً على الحالات الثلاث في الخطوة 1، لدينا الحالات الثلاث التالية التي ستتبعها
d) For the two tailed test there are two critical values: -Zα/2 & Zα/2, and the critical region is given by |Z| > Zα/2,
للاختبار ثنائي الذيل، هناك قيمتان حرجتان: -Zα/2 وZα/2، والمنطقة الحرجة تُعطى بواسطة Z| > Zα/2|
e) For the left tailed test, there is the critical value of -Zα, and the rejection region is given by Z < -Zα,
بالنسبة لاختبار الذيل الأيسر، توجد القيمة الحرجة -Zα، ومنطقة الرفض تُعطى بواسطة Z < -Zα،
f) For the right tailed test, again, there is on critical value given by Zα and the rejection region is Z > Zα
بالنسبة لاختبار الذيل الأيمن، توجد أيضًا قيمة حرجة واحدة تُعطى بواسطة Zα ومنطقة الرفض هي Z > Zα.
3. The test statistic we have Z where n is the sample size.
إحصائية الاختبار لدينا Z حيث n هو حجم العينة.
4. The above test statistic is computed based on the information provided to us by the sample data.
تُحسب إحصائية الاختبار أعلاه بناءً على المعلومات المُقدمة لنا من بيانات العينة.
5. Apply how the p-value is calculated based on the type of your test, as shown above.
طبّق كيفية حساب القيمة الاحتمالية بناءً على نوع الاختبار، كما هو موضح أعلاه.
The statistical decision will be made based on the case on hand whether we have a two-tailed, a left-tailed or a right-tailed test,
سيتم اتخاذ القرار الإحصائي بناءً على الحالة المطروحة، سواء كان لدينا اختبار ثنائي الذيل، أو اختبار ذي ذيل أيسر، أو اختبار ذي ذيل أيمن،
by comparing the computed p- value for the test statistic to the significance level stated in step 2.
بمقارنة القيمة الاحتمالية المحسوبة لإحصائية الاختبار بمستوى الدلالة المذكور في الخطوة 2
If the computed p-value is less than α, H0 will be rejected; otherwise, do not reject H0.
إذا كانت القيمة الاحتمالية المحسوبة أقل من α، فسيتم رفض H0؛ وإلا، فلا ترفض H0.
6. The interpretation and conclusion are due to answer the question that was raised.
يُفترض أن يُجيب التفسير والاستنتاج على السؤال المطروح
(مثال) EXAMPLE 9
Test the claim that μ1 # μ2 at the 0.05 level of significance for the given data
اختبر صحة الادعاء القائل بأن μ1 = μ2 عند مستوى دلالة ٠.٠٥ للبيانات المعطاة.
We will do the 2-sample Z Test, assuming the populations are normally distributed with known variances.
سنجري اختبار Z لعينتين، بافتراض أن المجتمعات موزعة توزيعًا طبيعيًا مع تباينات معروفة.
Using the classical method we have
(الحل) Solution
1. State the null and alternative hypotheses: H0: μ1 = μ2 versus H1: μ1 # μ2 two-tailed test.
صِغ الفرضيات الصفرية والبديلة: H0: μ1 = μ2 مقابل H1: μ1 # μ2 اختبار ثنائي الذيل.
2. Let α = 0.05 be the significance level. For the two-tailed test there are two critical values: - Z0.025 = – 1.96 & Z0.025 = 1.96 and the critical region is given by |Z| > Z0.025 = 1.96, as shown in the Figure 1
ليكن α = 0.05 مستوى الدلالة. لاختبار ثنائي الذيل، هناك قيمتان حرجتان: - Z0.025 = - 1.96 و Z0.025 = 1.96، والمنطقة الحرجة تُعطى بواسطة |Z| > Z0.025 = 1.96، كما هو موضح في الشكل 1.
3. The test statistic is (إحصائية الاختبار هي)
4. The above test statistic is computed, and we have Z = 0.898, based on the information provided.
تم حساب إحصائية الاختبار أعلاه، ولدينا Z = 0.898، بناءً على المعلومات المُقدمة.
5. The null hypothesis is not rejected.
لم تُرفض الفرضية الصفرية.
6. The two populations have the same mean.
للمجتمعين الإحصائيين نفس المتوسط.
Note: The above test could have been carried using the p-value method and getting the p-value=0.3690.
ملاحظة: كان من الممكن إجراء الاختبار أعلاه باستخدام طريقة القيمة الاحتمالية، والحصول على القيمة الاحتمالية = 0.3690.
Thus, the null hypothesis is not rejected since the p-value is greater than the significance level.
وبالتالي، لم تُرفض الفرضية الصفرية لأن القيمة الاحتمالية أكبر من مستوى الدلالة.
B) Populations Variances unknown, large samples
المجتمعات الإحصائية: تباينات غير معروفة عينات كبيرة
In this situation a sample size is considered large if n ≥ 30.
في هذه الحالة، يُعتبر حجم العينة كبيرًا إذا كان n ≥ 30.
Populations can be assumed to be normally distributed with the population's means, µ1 and µ2, and populations' variances and.
يمكن افتراض أن المجتمعات الإحصائية موزعة توزيعًا طبيعيًا، بحيث يكون متوسط المجتمع الإحصائي µ1 وµ2، وتباينات المجتمع الإحصائي و.
we are still interested in the difference between the two populations' means.
ما زلنا مهتمين بالفرق بين متوسطي المجتمعين.
The steps will go as it was when the population variances are known with the exception that the test statistic will take a different form.
ستستمر الخطوات كما هي عند معرفة تباينات المجتمع، باستثناء أن إحصاء الاختبار سيتخذ شكلًا مختلفًا.
It is still a 2-sample z-test with the sample variances replacing the populations’ variances in the form for the test statistic.
لا يزال هذا اختبار z لعينتين، حيث تحل تباينات العينة محل تباينات المجتمعين في نموذج إحصاء الاختبار.
Hence the test statistic will have the following form:
وبالتالي، سيكون لإحصاء الاختبار الشكل التالي
All the other set up step for the classical method, and the p-value method, will be applicable here also.
جميع خطوات الإعداد الأخرى للطريقة التقليدية، وطريقة القيمة الاحتمالية، قابلة للتطبيق هنا أيضًا.
(مثال) Example 10
Test the claim that μ1 > μ2 at the 0.05 level of significance for the given data
اختبر الادعاء بأن μ1 > μ2 عند مستوى دلالة 0.05 للبيانات المعطاة.
(الحل) Solution
We have two large samples each n > 30. We will do the p-value method on testing the difference between two means, with population variances unknown.
لدينا عينتان كبيرتان، كل منهما n > 30. سنستخدم طريقة القيمة الاحتمالية لاختبار الفرق بين متوسطين، مع تباينات مجتمعية مجهولة.
1. State the null and alternative hypotheses: H0: μ1 = μ2 versus H1: μ1 > μ2, right-tailed test
صِغ الفرضيات الصفرية والبديلة: H0: μ1 = μ2 مقابل H1: μ1 > μ2، اختبار ذو طرف أيمن.
2. Let α = 0.05 (لنفترض أن α = 0.05)
3. The test statistic we have
إحصائية الاختبار لدينا
4. The above test statistic, based on the information provided is Z = 1.3722
إحصائية الاختبار أعلاه، بناءً على المعلومات المُقدمة، هي Z = 1.3722.
5. Apply the p-value for the right-tailed test we see that p-value = 0.08499 >α. Hence the null hypothesis is rejected.
بتطبيق القيمة الاحتمالية لاختبار ذو طرف أيمن، نجد أن القيمة الاحتمالية = 0.08499 >α. وبالتالي، تُرفض الفرضية الصفري
6. The two population means are the equal.
متوسطا المجتمعين متساويان.
C) Populations Variances Unknown, Small Samples
المجتمعات التباينات مجهولة عينات صغيرة.
Once more the steps in the classical method, and the p-value method, for testing on the difference between two means will apply here as well.
مرة أخرى، تُطبق هنا أيضًا خطوات الطريقة التقليدية، وطريقة القيمة الاحتمالية، لاختبار الفرق بين متوسطين.
However, there will be two sub-cases to be considered as the samples’ sizes are small.
ومع ذلك، ستكون هناك حالتان فرعيتان يجب مراعاتهما نظرًا لصغر حجم العينات.
Small sample are those samples with n <30.
العينة الصغيرة هي العينات التي يكون n <30.
In addition to that, as it was the case with one mean, population variance unknown, and small sample size, the t distribution will the underlying distribution for the test statistic in this case.
بالإضافة إلى ذلك، وكما كان الحال في حالة متوسط واحد، وتباين مجتمع غير معروف، وحجم عينة صغير، سيكون توزيع t هو التوزيع الأساسي لإحصاء الاختبار في هذه الحالة.
In this section we will discuss, the procedure for testing a statistical hypothesis about two populations’ means, when the variances are not known.
سنناقش في هذا القسم إجراء اختبار فرضية إحصائية حول متوسطي مجتمعين، عندما تكون التباينات غير معروفة.
This case, by itself, raises the following question: (the fact that the variances are unknown), Are the variances equal, or they are different?
تثير هذه الحالة، في حد ذاتها، السؤال التالي: (نظرًا لأن التباينات غير معروفة)، هل التباينات متساوية أم مختلفة؟
Without answering this question now, but the situation is worth looking at from these two different sub-cases.
لن نجيب على هذا السؤال الآن، ولكن الأمر يستحق النظر من هاتين الحالتين الفرعيتين المختلفتين.
The following discussion will address this phenomenon.
ستتناول المناقشة التالية هذه الظاهرة.
1. Let us consider the case when the two populations’ variances are equal, i.e., σ21 = σ2 2 = σ2, their common value.
لننظر في الحالة التي يكون فيها تباينا المجتمعين متساويين، أي ، وهي القيمة المشتركة لهما.
In this case we estimate this common value between the two populations’ variances by pooling the two variances of the two samples, and we have
في هذه الحالة، نُقدّر هذه القيمة المشتركة بين تبايني المجتمعين من خلال تجميع تبايني العينتين، ونحصل على:
The underlying distribution, for the test statistics will be given by
سيُعطى التوزيع الأساسي لإحصاءات الاختبار بواسطة
The above test statistic will have the student’s t-distribution with = n1 +n2 – 2.
ستكون إحصائية الاختبار المذكورة أعلاه توزيع t للطالب حيث = n1 + n2 – 2.
The steps in the classical method and the p- value method will apply on the difference between the two means: µ1 - µ2, by using the 2- sample t test, with the difference in the test statistic as given above.
تُطبق خطوات الطريقة الكلاسيكية وطريقة القيمة الاحتمالية على الفرق بين المتوسطين؛ µ1 - µ2، باستخدام اختبار t لعينتين، مع الفرق في إحصائية الاختبار كما هو موضح أعلاه.
(مثال) EXAMPLE 11
Test the claim that μ1 # μ2 at the 0.05 level of significance for the given data
اختبر الادعاء بأن μ1 = μ2 عند مستوى دلالة 0.05 للبيانات المعطاة.
(الحل) Solution
For this example, we will consider the case that was outlined above, i.e. we will assume the population variances are equal and carry the 2-sample T-Test,
في هذا المثال، سننظر في الحالة الموضحة أعلاه؛ أي، سنفترض تساوي تباينات المجتمع ونستخدم اختبار TT لعينتين
with the estimated pooled variance for the common value for the population variances, as given by
مع تقدير التباين المجمع للقيمة المشتركة لتباينات المجتمع، كما هو موضح في
We will carry the 2-sapmleTTest, using the classical method, as follows:
سنستخدم اختبار TT لعينتين، باستخدام الطريقة التقليدية، كما يلي:
1. State the null and alternative hypotheses: H0: μ1 = μ2 versus H1: μ1 # μ2 two-tailed test.
صِغ الفرضيات الصفرية والبديلة: H0: μ1 = μ2 مقابل H1: μ1 # μ2 اختبار ثنائي الذيل.
2. Let α = 0.05 be the significance level. In this case the degrees of freedom ν = 28. For the two-tailed test there are two critical values:
لنفترض أن α = 0.05 هو مستوى الدلالة. في هذه الحالة، درجات الحرية ν = 28. لاختبار ثنائي الذيل، هناك قيمتان حرجتان:
3. The test statistic we have
إحصائية الاختبار لدينا
4. The above test statistic is computed based on the information provided T = 0.898 to us by the sample data.
تُحسب إحصائية الاختبار أعلاه بناءً على المعلومات التي قدمتها لنا بيانات العينة، وهي T = 0.898.
5. The statistical decision is that the null hypothesis is not rejected.
القرار الإحصائي هو عدم رفض الفرضية الصفرية.
6. The two population means are equal.
متوسطا السكان متساويان.






























































