Связь между качественными и количественными признаками
Где х0 и ху — средние значения по X для наблюдений с V = 0 и для наблюдений с У = 1 соответственно; х — общее среднее значение по X; аг — среднее квадратическое отклонение всех значений по X; п0 и пх — количества наблюдений с У=0ис К= 1 соответственно; п = (п0 + п{) — общее число наблюдений. Точечио-бисериальпый коэффициент корреляции был предложен К. Пирсоном для случая, когда количественный… Читать ещё >
Связь между качественными и количественными признаками (реферат, курсовая, диплом, контрольная)
При социально-экономических исследованиях иногда возникает необходимость оценивания тесноты связи между двумя факторами У и X, когда один из них является качественным (У) и принимает только два альтернативных значения (например, «Да» и «Нет» или «1» и «О»), а другой — количественным (X). Такую взаимосвязь называют бисериальной. Для характеристики ее тесноты используются точечно-бисериальный и рангово-бисериальный коэффициенты корреляции.
Точечио-бисериальпый коэффициент корреляции был предложен К. Пирсоном для случая, когда количественный фактор (X) измерен с помощью абсолютной шкалы. Он вычисляется по следующим эквивалентным формулам:
где х0 и ху — средние значения по X для наблюдений с V = 0 и для наблюдений с У = 1 соответственно; х — общее среднее значение по X; аг — среднее квадратическое отклонение всех значений по X; п0 и пх — количества наблюдений с У=0ис К= 1 соответственно; п = (п0 + п{) — общее число наблюдений.
Значения данного коэффициента изменяются в пределах от -1 до +1, в большинстве случаев его знак значения не имеет и равен нулю, если наблюдения с У = 1 и У = 0 имеют равные средние по X. Этот показатель представляет собой разновидность коэффициента корреляции К. Пирсона, рассмотренного в п. 11.4.1, и интерпретируется аналогично с учетом отмеченных особенностей. Для некоторых применений (например, в психологии, педагогике и др.) наблюдения, «дающие» отрицательное значение коэффициента, принято исключать из рассмотрения. Обязательным условием использования Кр_ы$ является распределение количественного фактора (X) по закону, близкому к нормальному.
Рангово-бисериалъпый коэффициент корреляции используется, если количественный фактор (X) измерен с помощью порядковой (ранговой) шкалы. В этом случае теснота связи оценивается по формуле
где Ху — средний ранг наблюдений с У = 1; — средний ранг наблюдений с У = 0; п — общее количество наблюдений.
Показатель КГ_Ы8 так же изменяется в пределах от -1 до +1, и его знак значения не имеет.