Статистические методы выявления корреляционной связи...

Статистические методы выявления корреляционной связи

Четверг, Март 27th, 2008

Корреляционная связь, как видели из материала п.1 данной темы, характеризуется согласованностью в вариации значений признаков. Однако согласованность эта не всегда свидетельствует о наличии причинно-следственной связи между рассматриваемыми признаками. Так например, согласованность в вариации значений признаков может быть следствием какой-либо одной, общей для них причины, или отражать случайное совпадение в изменениях признаков, не находящихся между собой в какой-либо связи. Неправильно возлагать полностью на статистику задачу установления наличия связи. Статистика только обнаруживает и характеризует фактическое проявление связи, указания на возможность которой дает теория изучаемого явления.
Именно теоретический анализ указывает на вытекающую из существа изучаемого явления возможность связи между признаками, процессами, сопровождающими это явление. Однако теория не может дать ответ на вопрос, проявляется ли в действительности и как проявляется теоретически возможная связь в данных конкретных условиях.
При статистическом изучении корреляционной связи между признаками исходным материалом являются данные об индивидуальных значениях этих признаков в изучаемой статистической совокупности.
Статистическая наука в настоящее время располагает большим набором приемов (методов) выявления корреляционной связи. Одни приемы можно отнести к элементарным (простейшим), другие предусматривают использование специального сложного математического аппарата.
К так называемым элементарным приемам (методам) выявления наличия корреляционной связи относятся: параллельное сопоставление рядов значений факторного и результативного признаков, графическое изображение фактических данных с помощью поля корреляции, построение групповой и корреляционной таблиц, факторные (аналитические) группировки и исчисление групповых средних.
К сложным методам изучения взаимосвязей относятся балансовые таблицы, дисперсионный анализ, методы теории корреляции и регрессии, методы многомерного анализа, методы распознавания образов, метод главных компонентов и др.
При отсутствии ярко выраженной причинной связи между факторным и результативным признаками наличие и характер связи можно установить при помощи метода параллельных рядов: в одной таблице приводятся упорядоченные значения факторного признака, который обычно обозначается символом х, и соответствующие им значения результативного признака, который обычно обозначается символом у.
Наличие и характер связи определяется по степени согласованности вариации данных рядов.
В тех случаях, когда возрастание величины факторного признака влечет за собой возрастание величины результативного признака, говорят о возможном наличии прямой корреляционной связи. Если же с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную связь между этими признаками.

Четверг, Март 27th, 2008

Параллельное сопоставление рядов индивидуальных значений в данном случае показывает на наличие прямой корреляционной связи по мере увеличения производственного стажа размер дневной заработной платы повышается.
Метод параллельных рядов обычно используется для установления характера связи при относительно небольшом объеме исходного материала. Однако при наличии большого числа значений признаков, когда одному и тому же значению признака-фактора, как правило, соответствует несколько различных значений результативного признака, восприятие параллельных рядов сильно затрудняется. В этих случаях целесообразно для установления наличия связи воспользоваться методом построения корреляционных таблиц.
Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. В корреляционной таблице, как правило в подлежащем указывается факторный признак х, а в сказуемом – результативный признак у.
В корреляционной таблице указываются частоты: сколько раз данная величина одного признака повторяется в сочетании с соответствующей величиной другого признака. Итоговые графа и строка отражают распределение единиц совокупности по рассматриваемым признакам.
Если частоты в корреляционной таблице расположены на «главной» диагонали (из левого верхнего угла в правый нижний угол), но можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по «вспомогательной» диагонали (из левого нижнего угла в правый верхний угол), то предполагают наличие обратной связи между признаками.
Следует подчеркнуть, что при рассмотрении корреляционной таблицы важно установить расположение основной части частот. Возможны варианты, что все клетки корреляционной таблицы окажутся заполненными. Однако это обстоятельство еще не означает, что корреляционная связь между данными признаками отсутствует. Если основная масса частот расположена по той или иной диагонали, то корреляционная связь между признаками существует.
Корреляционная таблица позволяет сжато, компактно и достаточно наглядно изложить исходный материал. Поэтому даже расчеты по методам корреляции и регрессии можно вести по корреляционной таблице.

Корреляционные таблицы

Четверг, Март 27th, 2008

Анализ корреляционной таблицы также подтверждает о наличии между рассматриваемыми признаками положительной корреляционной связи.
Корреляционная таблица, как и метод параллельных рядов, полностью базируется на сопоставлении индивидуальных значений изучаемых признаков. А индивидуальные значения формируются под влиянием как основных, так и случайных факторов.
Корреляционная связь обнаруживается более ясно, четко, если влияние случайных факторов удается нивелировать. Это обеспечивается при применении для выявления наличия корреляционной связи метода аналитической группировки и исчисления групповых средних.
Метод аналитической группировки и исчисления групповых средних состоит в следующем:
а) совокупность результатов наблюдений разбивается на группы по величине факторного признака и для каждой группы вычисляется средняя величина результативного признака.

Четверг, Март 27th, 2008

Сравнив средние значения результативного признака (последний столбец а или б) по группам значений признака-фактора (первый столбец) можно сделать вывод, что между данными признаками имеется тесная прямая корреляционная зависимость.
Корреляционная зависимость, если она существует, будет тем отчетливее обнаруживаться, чем большее число данных будет по каждой группе. Другими словами, предполагаются по каждой группе. Другими словами, предполагаются что все случайные факторы взаимно погащаются и различия в величине средних будут связаны только с различиями в величине факторного признака. Если бы связи между факторным и результативным признаками не было, то все групповые средние результативного признака были бы приблизительно одинаковыми по величине.
Попутно заметим, что оценка существенности расхождения групповых средних лежит в основе использования методов дисперсионного анализа для выявления наличия и оценки тесноты корреляционной связи.
При применении метода аналитической группировки и исчисления групповых средних необходимо помнить, что оценка наличия или отсутствия корреляционной связи между изучаемыми признаками зависит как от количества выделяемых групп, так и от установления границ интервалов. Недостатком этого метода является неоднозначность результатов при различных группировках.
Для предварительного выявления наличия связи и раскрытия ее характера применяют также графический метод.
Сущность данного метода состоит в следующем. В прямоугольной системе координат на оси абсцисс откладываются значения факторного признака х, на оси ординат – результативного признака у. Используя индивидуальные данные по х и у строится точечный график. Каждая точка имеет соответствующие друг другу координаты (х, у).
Совокупность полученных точек образует корреляционное поле. По характеру расположения точек на корреляционном поле можно судить о наличии или отсутствии связи (о силе связи), а также о направлении связи. Так, если точки беспорядочно разбросаны по полю (в виде шара), то зависимость между переменными отсутствует; если точки образуют эллипс, т.е. концентрируются вокруг оси, идущей из нижнего левого угла в верхний правый (или наоборот), то имеется прямая (или обратная) зависимость между исследуемыми признаками.