Корреляционный анализ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ДАЛЬНЕВОСТОЧНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ

ШКОЛА ЕСТЕСТВЕННЫХ НАУК

РЕФЕРАТ

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Выполнил: Усачёв В.В.,

направление 230200.62

Информационные системы

Научный руководитель:

Ширмовский С.Э., с.н.с.,

к.ф.-м.н., доцент кафедры общей физики

г. Владивосток

2012 г.

  • установлению формы (линейная, нелинейная)
  • и направления (положительное или отрицательное) связи между варьирующими признаками,
  • измерению тесноты связи
  • и проверке уровня значимости полученных коэффициентов корреляции.
  • причинную зависимость между значениями параметров.

Пример такой зависимости приводился выше: взаимосвязь пропускной способности канала передачи данных и соотношения сигнал/шум (на пропускную способность влияют и другие факторы — характер помех, амплитудно-частотные характеристики канала, способ кодирования сообщений и прочее).

Установить однозначную связь между конкретными значениями указанных параметров не удаётся, но очевидно, что пропускная способность зависит от соотношения уровней сигнала и помех в канале. Иногда при этом причину и следствие особо не выделяют. В некоторых случаях такая корреляция является бессмысленной, например: если в качестве исходного фактора взять доходы разработчиков антивирусных программ, а за результат — количество вновь появляющихся вирусов, то можно сделать вывод, что разработчики антивирусов «стимулируют» создание вирусов;

  • «зависимость» между следствиями общей причины. Подобная зависимость характерна, в частности, для скорости и безошибочности набора текста оператором (оба фактора зависят от квалификации оператора).

Корреляционные связи различаются по форме, направлению и степени (силе).

  • математических ожиданий величин ;
  • стандартных отклонений случайных величин ;
  • коэффициента корреляции , который является мерой связи между случайными величинами и .

Примеры корреляционных полей.

Если , то значения , полученные из двумерной нормальной совокупности, располагаются на графике в пределах области, ограниченной окружностью. В этом случае между случайными величинами x и y отсутствует корреляция, и они называются некоррелированными. Для двумерного нормального распределения некоррелированность означает одновременно и независимость случайных величин x и y.

34 стр., 16909 слов

Оценка воздействия табачной зависимости на память

... познавательные навыки. Тема нашей работы сформулирована как: «Особенности памяти людей с табачной зависимостью». Целью работы является рассмотрение и анализ ... подростковый период в жизни человека имеет особое значение [6]. В возрасте 14-15 лет происходит ... лежат индивидуально-различные мотивы, основанные на комплексе условнорефлекторных связей, включающих в себя процесс курения и конкретные условия, ...

Если или , то говорят о полной корреляции, то есть между случайными величинами и существует линейная функциональная зависимость.

При значения определяют точки, лежащие на прямой линии, имеющей положительный наклон (с увеличением значения также увеличиваются).

При прямая имеет отрицательный наклон.

В промежуточных случаях, когда , определяемые значениями точки попадают в область, ограниченную некоторым эллипсом, причём при имеет место положительная корреляция (с увеличением значения в целом имеют тенденцию к возрастанию), при корреляция отрицательная. Чем ближе к , тем уже эллипс и тем теснее точки, определяемые экспериментальными значениями, группируются около прямой линии.

Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях рассматривают нелинейную корреляцию.

Корреляционную зависимость между признаками можно описывать разными способами, в частности, любая форма связи может быть выражена уравнением общего вида , где признак — зависимая переменная, или функция от независимой переменной , называемой аргументом.

Таким образом, визуальный анализ корреляционного поля помогает определить не только наличие статистической связи (линейной или нелинейной) между исследуемыми признаками, но и ее тесноту и форму.

  • необходимость глубокого изучения данной связи между признаками и целесообразность ее практического применения;
  • степень различий в проявлении связи в конкретных условиях (сопоставление оценки тесноты связи для различных условий);
  • выявление главных и второстепенных факторов в данных конкретных условиях путём последовательного рассмотрения и сравнения признака с различными факторами.

Показатели тесноты связи должны удовлетворять ряду основных требований:

  • величина показателя тесноты связи должна быть равна или близка к нулю, если связь между изучаемыми признаками (процессами, явлениями) отсутствует;
  • при наличии между изучаемыми признаками функциональной связи величина показателя тесноты связи должна быть равна единице;
  • при наличии между признаками корреляционной связи абсолютное значение показателя тесноты связи должно выражаться правильной дробью, которая по величине тем больше, чем теснее связь между изучаемыми признаками (стремится к единице).

Корреляционная зависимость определяется различными параметрами, среди которых наибольшее распространение получили парные показатели, характеризующие взаимосвязь двух случайных величин: коэффициент ковариации (корреляционный момент) и линейный коэффициент корреляции (коэффициент корреляции Пирсона).

11 стр., 5098 слов

Социальная хартия российского бизнеса: понятие, сущность, значение

... использована современная учебная литература, а также интернет-ресурсы. 1. Социальная хартия российского бизнеса понятие сущность значение Бизнес - основная двигающая сила создания экономических благ и накопления ... систему мер по ключевым направлениям корпоративной ответственности; использование ясной системы показателей для измерения и оценки компанией результатов своих действий в соответствии ...

Сила связи определяется абсолютным значением показателя тесноты связи и не зависит от направления связи.

В зависимости от абсолютного значения коэффициента корреляции корреляционные связи между признаками по силе делятся следующим образом:

  • сильная, или тесная (при );
  • средняя (при );
  • умеренная (при );
  • слабая (при );
  • очень слабая (при ).

  • при значения и полностью совпадают;
  • при величины и принимают противоположные значения;
  • при величины и практически не связаны друг с другом линейным соотношением. Однако это не означает отсутствия каких-то других (например, нелинейных) связей между параметрами;
  • при однозначной линейной связи величин и нет, и чем меньше абсолютная величина коэффициента корреляции, тем в меньшей степени по значениям одного параметра можно предсказать значение другого.

В первых двух случаях имеет место функциональная зависимость: зная значение одного параметра, можно однозначно указать значение другого параметра.

  • элементы матрицы симметричны относительно главной диагонали, то есть , ;
  • элементы главной диагонали равны единице, , .

1)

2) .

Далее, необходимо отдельно найти значения четырёх сумм, подставить полученные значения в уравнения 1) и 2) и выразить коэффициенты и .

v Математическая статистика и теория вероятностей, ИСИТ САФУ .

v Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 10-е издание, стереотипное. — Москва: Высшая школа, 2004. — 479 с.

v Андерсон Т., Введение в многомерный статистический анализ, https://ami.nstu.ru/, 1963, 24 с.

v Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. — 4-е издание, переработанное и дополненное. — Москва: Финансы и Статистика, 2002. — 480 с.

v Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб.: Питер, 2003. — 688 с.