<<
>>

Корреляционный анализ

Опыт анализа закономерностей исследуемой реальности показал, что единство и целостность объектов обеспечивается не только прямым влиянием одного признака, явления на другой (по типу причинно-следственной связи), но и косвенно, через сопряженное соотношение между качественно различными факторами.

Использование статистических методов к исследованию социальных процессов наглядно иллюстрирует корреляционный анализ, сфера применения которого сегодня стремительно расширяется.

Корреляционный анализ позволяет определить степень зависимости, сопряженности между двумя и более признаками.

Корреляционная связь имеет место в том случае, если функциональная (причинная) связь между показателями проявляется лишь частично.

В основе корреляционной связи лежит соотношение между динамическими рядами варьируемых признаков, взаимодействие которых обусловливает устойчивый режим функционирования системы.

R =

Основными задачами корреляционного анализа в практике исследования экономических проблем являются:

Метод корреляционного и регрессионного анализа широко используется для определения тесноты связи между показателями, не находящимися в функциональной (причинной) зависимости. Теснота связи между изучаемыми показателями измеряется корреляционным отношением (для криволинейной зависимости). Для прямолинейной зависимости исчисляется коэффициент корреляции: ?

определение оптимального сочетания номенклатуры продуктов и услуг; ?

измерение и оценка зависимости между производственными показателями; ?

оценка использования инвестиций в различных программах.

Использование корреляционного анализа позволяет выявлять факторы производства и их влияние на производственные показатели, определять приоритеты разработки стратегии предприятий, а также разрабатывать эффективную торговую политику предприятий.

Основу корреляционного анализа составляют связи, назначение которых состоит в выявлении общезначимой связи между исследуемыми переменными, в основе которой лежит действие определенного фактора.

При этом одни переменные выступают как факторные, другие — как результативные. Однако, используя такой тип зависимостей, следует учитывать различия между функциональной (причинной) и корреляционной связями. При функциональной связи изменение результативного признака (X) всецело обусловлено действием факторного признака ( ?). При корреляционной связи изменение результативного признака (У) обусловлено влиянием факторного признака (X) не всецело, а лишь частично, так как возможно влияние прочих факторов (е):

У-НЛ) + е.

Примером корреляционной связи является зависимость сумм издержек обращения от объема товарооборота. В этом случае, помимо факторного признака — объема товарооборота (X), на сумму издержек обращения ( У) влияют еще неучтенные факторы (е).

В табл. 2.13 представлено соотношение между двумя динамическими рядами, распределяющими значения объемов продаж (У) и производства (X). Основываясь на использовании коэффициента корреляции можно выявить связь между двумя показателями с целью определения заложенного в основу их динамики общего условия, влияющего на их соразмерное изменение. № п/п Xi Yi XiYi Yi1 XI1 4 100 100 1200 10000 14 400 5 140 140 1890 19 600 18 225 6 160 160 8400 25 600 19 600 7 180 180 32 400 32 400 32 400 оо 190 160 30 400 25 600 36 100 9 180 140 25 200 19 600 32 400 10 170 130 22 100 16 900 28 900 ??? = ??? = ????? = ???2 = ???2 = = 1295 = 1170 = 160 200 = 179 700 = 193 625 Подставляя полученные значения в формулу коэффициента корреляции, получаем:

Л = -1 = и, О.

1,3

,(193 )х(179,7-0,144)

V 10

Проиллюстрировать полученный результат можно по шкале Чед-дока (табл. 2.14).

Таблица 2.14 Шкала Чеддока

Показатели тесноты связи Характеристика силы связи 0,1-0,3 слабая 0,3-0,5 умеренная 0,5-0,7 заметная 0,7-0,9 высокая 0,9-0,99 весьма высокая По мере приближения значения коэффициента к единице корреляционная связь практически трансформируется в причинную.

Полученный выше результат свидетельствует в пользу достаточно высокого значения коэффициента корреляции между показателями, что подчеркивает высокую степень их внутренней взаимозависимости.

Корреляционный анализ может использоваться для измерения связи между различными показателями исследуемых процессов, что обеспечивает возможность контролировать и направлять эти процессы.

Наличие корреляционной связи между показателями позволяет через воздействие на один показатель оказывать влияние на другой показатель, выстраивая порядок управления процессом.

Широкую популярность в процессе использования корреляционного анализа получила формула коэффициента ассоциации известного британского ученого Дж. Юла (1871-1951).

Проиллюстрировать применение коэффициента ассоциации для решения конкретной проблемы позволит формулировка следующей задачи.

Для оценки влияния факторов на производительность труда в организации было проведено исследование, в ходе которого рассматривалась связь между фактором удовлетворенности трудом, изученного в результате социологических исследований и производительностью труда, дифференцированной исследователями на два уровня. В ходе опроса 100 человек были получены следующие результаты (табл. 2.15).

Таблица 2.15

Связь между производительностью труда и удовлетворенностью трудом в организации (вариант)

Производительность труда Удовлетворенность (Y1) либо N(Xi) (X) неудовлетворенность профессией (Y2) Высокая 20 0 20 (N11) (N12) Низкая 30 50 80 (N21) (N22) N(Yi) 50 50 100 Числа, приведенные в таблице, выражают количество человек, относящихся к одной из четырех групп образованной матрицы.

Корреляционную зависимость между полученными в результате исследования показателями, выраженную в значении коэффициента ассоциации, можно вычислить по формуле:

(????22+????2??

Подставляем числовые значения в формулу:

(20x50-0x30)

2 = 7 ( = 1-

(20x50 + 0x30)

Значение коэффициента указывает на глубокую корреляционную связь между производительностью труда и удовлетворенностью профессией, однако зависимость здесь является односторонней (производительность влияет на удовлетворенность, но влияет ли удовлетворенность на производительность?).

Из табл. 2.14. хорошо видно, что если один из показателей^ таблице отсутствует, то величина коэффициента ассоциации всегда будет равна единице, что дает преувеличенную оценку степени связи между исследуемыми показателями.

Поэтому, чтобы сделать анализ более точным и учесть двухстороннюю связь между показателями используется коэффициент контингенции К. Пирсона:

? = (л/м хЛ/22 -?? ? ? ?}/ (х\)х N (xl)x N (у\)х N (yl).

Коэффициент контингенции измеряется в диапазоне от +1 до -1, но всегда меньше коэффициента ассоциации.

? = (20x50-?)/V20x80x50x50 = 1000/2000 = 1/2.

Если ? меньше или равно 0,5, то существует двухсторонняя связь. В данном случае удовлетворенность труда также оказывает влияние на производительность труда.

Для оценки значимости коэффициента корреляции применяется (?) критерий Стьюдента, вычисляемый по формуле:

Полученная в процессе этих расчетов величина сравнивается с критическим (tt), которая берется из специальной таблицы значений с учетом заданного уровня значимости и числа степеней свободы.

Другим критерием, подтверждающим гипотезу о случайном или неслучайном распределении частот исследуемого признака, является, X2 — хи-квадрат. Для проверки такой гипотезы сравниваются эмпирические (наблюдаемые) и теоретические частоты. Численное значение X2 определяется по формуле:

?2 _ ? (/-/')

/'

где / — эмпирические частоты, a f — теоретические частоты.

Теоретическое значение определяется с учетом числа степеней свободы, определяемого по формуле: К = ? - г - 1, где ? - число групп, г — число параметров и степени вероятности. В случае фактического значения X2 ниже табличного (в соответствии с таблицей критических значений критерия К. Пирсона) в основе распределения частоты исследуемого признака лежит закон нормального распределения.

Таким образом, с помощью данного критерия можно установить статистически значимую взаимосвязь между переменными, составляющими параметры исследуемого объекта.

Использование корреляционного анализа будет неполным, если в расчет не берется значение среднего арифметического распределения, позволяющего сглаживать случайные и неслучайные колебания в динамике исследуемых рядов данных.

Среднее арифметическое распределение

Среднее арифметическое распределение, обозначаемое X, вычисляется по следующей формуле:

N

- ???

?

где ?.

— значение каждого отдельного случая; N — количество случаев;

N

- ·? Xi

? = ?=? — знак суммы значений всех отдельных случаев от 1 до N.

N

Среднее арифметическое исчисляется в тех случаях, когда необходимо определить объем усредняемого признака, выявленный путем обобщения суммы значений всех единиц исследуемой совокупности. К примеру, вычисленная таким образом средняя заработная плата в регионе позволяет сравнивать с этой величиной заработную плату различных социальных и профессиональных групп, определять оптимальную величину бюджетных дотаций и надбавок для выравнивания уровня жизни населения региона.

Так, распределяя в ходе вычисления среднего арифметического между отдельными элементами общую величину признака, исследователь выстраивает медиану. Медианой называется значение признака у той единицы совокупности, которая расположена в середине ряда частотного распределения. Для вычисления медианы необходимо в первую очередь проранжировать индивидуальные значения признаков, расположить соответствующие этому ряду частоты и найти их срединный интервал. Так, к примеру, вычисляется средняя численность населения ведущих городов региона (табл. 2.16).

Таблица 2.16

Разделение городов по численности населения

№ п/п Город Численность 1 А 1 ООО ООО 2 Б 400 ООО 3 В 250 000 4 Г 120 000 5 Д 50 000 6 ? 30 000 Срединные ранги в ряду представленных данных составляют 3-4 строку, и поэтому медиана равна

250 000 + 120 000

= 185 000.

2

Таким образом, медиана для данной выборки свидетельствует о том, что три города в регионе располагают численностью выше данного значения, а три города не дотягивают до этого значения. Если объем значений делит исследуемую совокупность на четыре,части, то величина каждой из них именуется квартилями, на десять — децилями, на сто — процентилями.

Однако использование среднеарифметического при определении характера рядов распределений может быть некорректным, если разброс значений в исследуемой совокупности является очень большим.

Зафиксировать такой разброс помогут два важнейших статистических показателя: показатель дисперсии и коэффициент вариации.

Показатель дисперсии

Дисперсию можно вычислить по формуле:

? = .

?

Корень квадратный из дисперсии ?2 представляет собой среднее квадратическое отклонение.

Показатель дисперсии, иногда называемый средним квадратом отклонений, призван определить степень размытости распределенного признака относительно среднего арифметического. Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю исследуемую совокупность. Если величина квад-ратического отклонения высока, то использование среднеарифметического значения показателя переменной для характеристики всей совокупности недопустимо.

Коэффициент вариации

Коэффициент вариации отображает отношение среднего квадрати-ческого отклонения к среднему арифметическому и вычисляется по формуле:

2

? = — ? 100%. X

Коэффициент вариации (X) является наиболее распространенным показателем колеблемости, вариативности признаков, используемым для оценки типичности средних величин. Статистиками доказано, что если коэффициент вариации больше 40 %, то это говорит о значительной степени вариативности признака в исследуемой совокупности, свидетельствующей о широком разбросе признака.

Значение коэффициента вариации особенно наглядно выявляется при характеристике региональной асимметрии. К примеру, по объемам ВРП размах вариации из 88 регионов (кроме Чечни) в 1999 г. составил 29,4 раза (на краях ряда Ханты-Мансийский автономный округ и Республика Дагестан), коэффициент вариации — 91,3%. В Европе аналогичное соотношение между регионами Европейского союза составляет 4,6 раза, а между всеми европейскими странами — около 13 раз.

Разновидностью корреляционного анализа является корреляционно-регрессионный метод. Одной из распространенных аналитических задач, решаемых с применением корреляционно-регрессивного метода, является задача на запуск-выпуск.

Допустим, что имеются фактические данные о запуске и выпуске промышленных изделий (тыс. шт) (табл. 2.17).

Требуется определить зависимость выпуска изделий (в среднем) от их запуска, составив соответствующее уравнение регрессии. Значения X и У определяются по формулам:

X - SX - ?; ? = S.Y, - ?; ? - 6,1 = 1.....6;

? - 102 - 6 - 17; ? - 95,4 - 6 - 15,9.

Дальнейшим вычислениям придается табличная форма, что повышает их наглядность (табл. 2.18).

Таблица 2.18

Представление вычислений в табличной форме

(Х,-Х) (Xi-X)2 (?.-?) (?.-?)2 (?,-?) (?.-?) 1 1 1,3 1,69 1,3 5 25 5 25 25 -4 16 -4,3 18,49 17,2 3 9 2,8 7,84 8,4 -2 4 -1,8 3,24 3,6 -3 9 -3 9 9 S^X, - ?)2 - 64 S^Yj - ?)2 = 65,26 S.{X.- X)(Y.t - ?) = 64,5.

Теснота связи между показателями запуска и выпуска измеряется коэффициентом корреляции, который исчисляется по формуле:

? = d2xy + dxdy. Подставляя соответствующие значения, получим:

?? = ^/liix" - Хер)2 + ? = V64 + 6 = 3,27;

dy - VS^Y, - ?)2 + ? - V65.26 + 6 ?= 3,30; d2xv = S(X - X)(Yi - Y) - 64,5 + 6 - 10,75; ? - 10,75 + (3,27 ? 3,30) - 10,75 + 10,79 « 0,996.

Считая формулу линейной (? - а0 + а,Х), определим зависимость выпуска промышленных изделий от их запуска. Для этого решается система нормальных уравнений:

na0 + ajSjXj - S,Y.;

a^ + a.S^-SXY,

Величины SXj2 и SXjYj представлены в табл. 2.20.

Подставляя найденное выражение а0 во второе уравнение, находим значение а,:

102(15,9 - 17а,) + 1798а, - 1686,3; 1621,8- 1734а, + 1798а, - 1686,3; 64а,- 1686,3- 1621,8; 64а,-64,5; а,-1,01; а0- 15,9-(17 ? 1,01); а0- 15,9-17,17; а,--1,27.

Итак, уравнение регрессии в окончательном виде имеет следующий вид:

? - - 1,27 + 1.01Х.

Проверка:

? - - 1,27+1,01 ? 17 - - 1,27 + 17,17; ? - 15,9.

Ранговая корреляция

Ранговая корреляция вычисляется на основе формулы, созданной Ч. Спирменом для определения тесноты связи как между количественными, так и между качественными признаками исследуемого процесса при условии, что значения этих признаков будут проранжи-рованы или упорядочены по степени убывания или возрастания признака. Коэффициент ранговой корреляции вычисляется по формуле:

6??2 k-? ,

(п3-п)

где d — разность рангов; ? — общее число рангов; ??2 — сумма квадратов в разности рангов.

Главной задачей ранговой корреляции является определение того, насколько исследуемые объекты, сравниваемые процессы идентичны по их признакам, и насколько эта идентичность (или неидентичность) является значимой, чтобы принимать ее во внимание при их оценке.

Примером, подтверждающим применение ранговой корреляции, может служить сравнение приоритетов потребительского выбора между различными категориями потребителей, заключающееся в совпадении их потребительских ориентации в отношении того или иного товара или внедренной новации.

С помощью вычисления коэффициента ранговой корреляции возможно решение таких задач, как: ?

выявление факторов производства и их влияния на производственные показатели; ?

определение приоритетов разработке стратегии предприятий; ?

разработка эффективной торговой политики предприятий; ?

измерение общественного мнения на основе общности ориентации различных социальных групп и пр.

Механизм реализации метода ранговой корреляции предполагает ряд этапов. 1.

Выделение не менее двух рядов последовательностей, характеризующих динамические характеристики объекта исследования. 2.

Определение места каждому показателю в структуре динамического ряда и распределение полученных результатов по рангам. Полное совпадение мест показателей в динамических рядах означает положительную корреляцию, тогда как обратный порядок, соответственно, свидетельствует об отрицательной корреляции. 3.

Вычисление фактического коэффициента ранговой корреляции, располагающегося в диапазоне от -1 до +1.

Проиллюстрировать процедуру исчисления ранговой корреляции можно на конкретном примере.

Опрашиваются две группы экспертов, потребителей в разных частях города с целью получения информации об источниках сведений о потребительских качествах товара. Ответы распределяются следующим образом (табл. 2.21).

Данные обследования заносятся в формулу: К=1- (6 ? (1 + 1+ 0+1+9+1 + 1)/(343-7)=- 1 -84/336-0,75.

Полученный результат свидетельствует о достаточно высокой степени корреляции между приведенными в таблице рядами данных. Это подтверждает версию, что между двумя торговыми точками значительной разницы в оценке потребителями приоритетов в получении информации не наблюдается. И поэтому предприятие в своей маркетинговой политике может и не принимать во внимание факт пространственной отдаленности между своими торговыми представительствами.

Использование метода ранговой корреляции также эффективно при наличии нормативной структуры показателей, отображающей условия потенциального экономического роста фирмы в сложившихся условиях.

К примеру, если в основу развития предприятия положен принцип экономического роста, в соответствии с которым снижение затрат живого труда должно осуществляться более опережающими темпами по сравнению с темпами затрат труда овеществленного, то нормативный ряд показателей развития предприятия будет выглядеть следующим образом:

Тзп < Тсс < Тмз < Ттп < Тнчп < Тр < Тп, где ? — показатель темпов роста, ? — прибыль, нчп — нормативно-чистая продукция, тп — стоимость товарной продукции, мз —материальные затраты, ? — расчетный показатель, измеряемый как ? + мз, сс — полная себестоимость товарной продукции, зп — трудовые затраты, выраженные в показателе заработной платы.

В нормативном ряду должны быть как ограничивающие показатели, имеющие в данном случае минимальные темпы роста, так и результативные, закладывающие приоритетные цели развития предприятия. Оценивая соответствие между нормативной и фактической структурами показателей, можно сделать вывод о результативности стратегической политики предприятия и о необходимости проведения корректирующих мер.

Алгоритм использования метода ранговой корреляции для оценки стратегической политики предприятия относительно темпов его развития будет включать в себя следующие этапы. 1.

Выявление динамики ключевых показателей роста, определяющих стратегическую политику предприятия за определенный период и выстроенных в направлении от ограничивающих показателей к результативным. 2.

Представленная таблица преобразуется в таблицу темпов выделенных показателей, измеренных в процентах на стадиях ежегодного изменения. На основании данных составленной таблицы формируются динамические ряды фактических показателей. 3.

На основании соответствия фактического динамического ряда нормативному производим расчет коэффициента ранговой корреляции по каждому фактическому динамическому ряду. 4.

По имеющимся данным коэффициента ранговой корреляции выявляем зависимости изменения данного коэффициента во времени, объясняя волнообразный характер этих изменений.

<< | >>
Источник: Рой О. М.. Исследования социально-экономических и политических процессов: Учебник для вузов. — СПб.: Питер. — 364 с: ил. — (Рерия «Учебник для вузов»).. 2004

Еще по теме Корреляционный анализ:

  1. 1.6. Взаимосвязь производственного и финансового анализа. Характеристика управленческого анализа
  2. 4.4.2. Диагностический анализ инновационной среды организации по методу БУУОТ-анализа
  3. 2.2. ЭКОНОМИЧЕСКИЙ, ПРАВОВОЙ И ПОЛИТИЧЕСКИЙ АНАЛИЗ В КОНТЕКСТЕ ЗАДАЧ МЕЖДУНАРОДНОГО МЕНЕДЖМЕНТА. СТРАНОВЫЙ МАРКЕТИНГОВЫЙ АНАЛИЗ
  4. 6. Анализ спроса. Оценка затрат или анализ процентных и непроцентных расходов
  5. Н. В. Войтоловский, А. П. Калинина, И. И. Мазурова. Экономический анализ: Основы теории. Комплексный анализ хозяйственной деятельности организации : учебник. 2-е изд., перераб. и доп. — М.: Высшее образование. — 513 с. — (Университеты России)., 2007
  6. 3.3. Статистические и экономико-математические методы анализа
  7. 4.2. Основные методы и виды анализа в системе маркетинга
  8. 2.4. Технология применения методов анализа исследовательских объектов
  9. Факторный анализ
  10. ФУНДАМЕНТАЛЬНЫЙ АНАЛИЗ
  11. 3.5. Подходы в анализе японских свечей
  12. ТЕХНИЧЕСКИЙ АНАЛИЗ
  13. Контент-анализ
  14. Анализ данных