Валидность психологического теста

2

Современная зарубежная психология. № 4 / 2013

1

Валидность психологического теста

Дифференциальная психология связана с развитием методов измерения межличностных и индивидуальных различий. Здесь с высокой точностью проверяются наиболее важные аспекты.

«В Российском психологическом обществе (РПО) наблюдается переориентация психологических взглядов как в университетах, так и в практике навстречу использованию валидных и научно обоснованных методов и процедур исследования» [14].

Используемый метод психодиагностики должен соответствовать критериям, которые позволяют заявить о качестве теста.

Обязательно должны соблюдаться три критерия: тест должен иметь высокую объективность, надёжность и валидность. Данная статья посвящена изучению валидности.

Психологический тест — это инструмент измерения. Любой инструмент измерения, имеет погрешность. Другими словами, любой психологический тест имеет ошибки измерения, от степени которых зависит качество измерительного инструмента. Цель разработчика тестового испытания — свести к минимуму данную погрешность, повысив тем самым качество теста. Данная цель достигается посредством конструирования качественных тестовых заданий, которые должны соответствовать необходимым критериям валидности.

Линерт и Ратц (Lienert, Raatz) определяют психологический тест как «… научный метод рутинного исследования одного или более эмпирически определяемых черт личности с целью возможного количественного отчета об относительной степени выражения индивидуальной особенности» [9].

Шмидт6Атцерт и Амеланг (SchmidtAtzert, Amelang) определяют психологический тест как метод исследования, обладающий следующими свойствами:

  • Это метод измерения;
  • Применяется для измерения одной или нескольких психологических черт;
  • Стандартизированная процедура;
  • Включает в себя сбор эмпирических данных;
  • Процедура проводится в определённых условиях;
  • Целью измерения является количественное выражение качественной характеристики или качественное утверждение о наличии той или иной функции [15].

Любой научный метод измерения должен соответствовать определенным критериям качества. Существуют основные и второстепенные критерии качества. Основными критериями качества являются:

4 стр., 1525 слов

Сущность и методы воздействия психологических методов на человека

... стороны личности: мотивационные, эмоциональные и поведенческие. Выделяют следующие критерии психологического теста: валидность, что обозначает пригодность теста для измерения именно того качества, на которое он направлен; научность, которую определяют фундаментальные ...

1. Объективность: Независимость теста от условий, в которых он применялся, от человека, проводящего испытание, анализирующего и интерпретирующего полученные результаты [4].

2. Надёжность: согласованность результатов, полученных при каждом повторном выполнении теста одним и тем же испытуемым, с результатами его первого тестирования [1].

3. Валидность: соответствие результатов теста той характеристике, для измерения которой он предназначен [4].

Второстепенными критериями качества являются:

  • Полезность: Полезен ли метод и насколько удобен для изучения конкретной характеристики? Иногда это называют внешней валидностью.
  • Репрезентативность: Могут ли проходить измерение люди с разным полом, возрастом, местом жительства и т. д.?
  • Экономичность: Являются ли затраты на исследование адекватны полученным данным?
  • Прозрачность: Является ли инструкция и порядок выполнения исследования понятным для испытуемого? Предусматривается ли процедура объяснения инструкции?
  • Фальсификация: Устроен ли процесс исследования таким образом, что испытуемый имеет возможность умышленно исказить результат?
  • Рациональность: Насколько рационально предусмотрено время исследования, учтены умственные способности испытуемых и окружающие физические условия?
  • Нормализация: Существует ли нормальный показатель по используемому методу? Каким образом можно сравнить полученные от разных людей результаты? [10]

Валидность

Как в психологии, так и в любой другой науке валидное измерение — это такое измерение, которое измеряет то, что оно должно измерять. Другими словами, при измерении математических способностей измерительный инструмент должен быть направлен на изучение именно математических способностей, а ничего другого. Безупречный эксперимент, возможный только в теории, будет обладать идеальной валидностью, то есть его результаты будут на 100% соответствовать реальности, а полученные закономерности будет возможным обобщить без ограничений. Несмотря на то, что валидность не измеряется к каких6либо условных единицах, говорят о степени валидности, подразумевая то, насколько результаты исследования соответствуют поставленной цели.

В отличие от базовой фальсифицируемости (опровержимости теории) и проверяемости начальное утверждение является критерием достоверного описания определённого явления. В контексте эмпирической достоверности исследований, валидность также относится к исследованию отдельных факторов, описанных в причинно6следственной модели. Валидность, следовательно, с одной стороны — это способность определённого действия («Насколько точно измерительный прибор измеряет объект?»), а с другой стороны — это способность производить определённые выводы на основе измерений («В какой степени верно полагать, что X и Y находятся в зависимости?»).

При использовании хороших измерительных приборов, измеренные значения не зависят от крайних показателей, при условии объективности исследователя. Также, хорошие измерительные приборы обеспечивают получение одинаковых результатов при повторном тестировании, что является критерием надёжности. Третьим критерием валидности является мера того, что данные, полученные при измерении, как и предполагалось, представляют величину, которая должна быть измерена. Только в случае выполнения всех критериев данные могут быть интерпретированы правильно. Срок действия определяется экспертной оценкой. Все критерии качества должны соблюдаться одновременно [3].

12 стр., 5572 слов

Методология и методы психолого-педагогического исследования

... и в нашей стране. 2. Методология научного исследования, метод, методика Методология (от «метод» и «логия») - учение о структуре, логической организации, методах и средствах деятельности. Метод ... разрешается, например, предлагать человеку такие практические рекомендации из результатов тестирования, ... ответ. По полученным ответам испытуемого, в свою очередь, судят ... при оформлении на работу, то человек также ...

внешнюю (или практическую)

Внешняя валидность

Внешняя валидность показывает соотношение между результатами измерительного прибора и эмпирического критерия [16].

Например, исследователь рассматривает отношение своего нового теста лингвистических способностей с учебными оценками субъектов по предмету иностранный язык, проверяя правильность измерений. При условии использования объективной оценки в качестве критерия или экспертной оценки, говорят о внешней валидности. Внешняя валидность достигается при условии, что исследуемый конструкт диагностируется одновременно при помощи нескольких тестов. Процедура определения конвергентной и дискриминантной валидности являются частными случаями этой категории.

Наиболее распространенные ошибки, влияющие на внешнюю валидность, совершаются при наборе группы испытуемых. Добровольным ли является участие? Как испытуемые узнали о возможности участвования (через объявление в газете, сайт и т. д.)? Что мотивирует испытуемых к участию (заинтересованность в теме, в деньгах, и т. д.)? Эти фильтры могут повлиять на качество подбора группы испытуемых. Наиболее распространенная опасность нарушения внешней валидности заключается в искусственности лабораторных экспериментов [5].

Внешняя валидность увеличивается с каждой успешной ревизией результатов, так как повторение с другими испытуемыми (другая возрастная группа, пол, культура и т. д.) или вариации экспериментальных условий накладывают ограничения на применимость выводов [3].

Для статистического анализа результатов повторного исследования используется метод мета6анализа.

внутренней валидности

Факторы, при которых внутренняя валидность находится под угрозой [8]:

— История. Любое незапланированное событие между двумя измерениями может иметь нежелательный эффект. Например, при первом измерении, для тестирования нового антидепрессанта погода холодная и дождливая, а при втором измерении погода была тёплой и солнечной.

  • Созревание. При длительном промежутке между измерениями возможно изменение испытуемых (взросление, развитие).

  • Реактивность.

Испытуемые могут реагировать на сам процесс измерения, например, может возникать привыкание или раздражительность, особенно тогда, когда процесс измерения неприятный.

— Изменения в измерительном приборе. Во время одного исследования, характеристики измерительных приборов могут быть изменены. Это может быть, например, путем нарастания скуки у испытуемых во время измерения. Зависимой переменной, может выступать конструкт, измерение которого производится менее точно. Например, для измерения влияния обучения на развитие интеллекта у детей используется тест интеллекта. Обучение является настолько успешным, что дети достигают высоких результатов при следующем тестировании.

27 стр., 13275 слов

Исследование интеллекта

... ]. Объект исследования, Предмет исследования Целью курсовой работы является анализ методов диагностики интеллектуального развития. Гипотеза: В соответствии с целью и гипотезой определены следующие задачи: 1. Изучить влияние разнообразных факторов на результаты ...

— Регрессия к среднему. Этим свойством могут перекрываться крайние значения выборки. Например, наличие большого количества показателей низкого и высокого интеллекта порождает среднее значение, которое нельзя применить ни к одному из испытуемых.

— Выбор неадекватной рандомизации. При рандомизации испытуемых в экспериментальные и контрольные группы могут быть допущены ошибки, таким образом, измерение эффекта будут искажённым. Кроме того, вышеописанные эффекты (История, созревание, регрессия к среднему и др.) могут влиять на группы по6разному.

  • Недостаточность испытуемых. Использование небольших экспериментальных групп не позволяет считать результаты исследования достоверными.
  • Направление причинного вывода. Причинная связь между независимой и зависимой переменной может подвергаться сомнению при наличии третьей переменной.

— Обмен информацией. Когда испытуемые взаимодействуют между тестированиями (например, «я думаю, что я принадлежу к группе плацебо»), возможно искажение результатов последующего тестирования. Испытуемые могут быть не довольны, например, тем, что у испытуемых из другой группы более комфортные (по их мнению) условия тестирования, несмотря на то, что это может быть замыслом экспериментатора. Этот эффект может вызвать демотивацию испытуемых [8].

С классической точки зрения внутренняя и внешняя валидность находится в конфликте: высокая степень внутренней валидности лучше всего достигается в жестко контролируемых и поэтому довольно искусственных (лабораторных) условиях. Однако, в естественном эксперименте возникает риск неконтролируемого вмешательства, которое может быть просто неучтено исследователем. С другой точки зрения это только кажущееся противоречие. Так как критерии были разработаны на основе исследований индуктивной логики из обобщения эмпирических данных (например, из эксперимента), они находится на переднем плане. Здесь возникает вопрос о воспроизводимости результатов в различных условиях на различной выборке. Тем не менее, исследования дедуктивной логики имеют другую цель. В целом эта теория пытается подвергнуть фальсификации полученные выводы, а не проверять логику эмпирического исследования. Согласно этой логике, возникшее противоречие сфальсифицировано. Доказанная эмпирическим путём теория должна подвергнуться дополнительному испытанию. Возражения, которые ставят под сомнение достоверность результатов эксперимента заключаются в вопросе о внутренней валидности эксперимента [3].

Обоснованность эмпирических выводов о причинно6следственных связях всегда подвергается тщательной проверке в экспериментальных и квази6экспериментальных исследованиях.

В 1954 году Американской психологической ассоциацией были предложены рекомендации по конструированию психологических тестов и других диагностических методов. Они предложили четыре типа валидности: очевидная ва лидность, содержательная валидность, конструктная валидность и прогностиче ская валидность [10].

То есть, кроме оценки внутренней и внешней валидности психологический тест должен быть оценен и по данным типам валидности.

Очевидная валидность

— Высокая очевидная валидность является необходимым показателем. Она выступает в качестве мотиватора, побуждающего испытуемых к выполнению заданий теста. Очевидная валидность способствует более ответственному отношению к исследованию, к выполнению заданий теста и к заключениям, формулируемым психологом на основе проведённого исследования.

42 стр., 20732 слов

Методики исследования мышления и интеллекта

... к понятию интеллекта. Тесты интеллекта 1. Диагностика мышления и интеллекта, .1 Психодиагностические аспекты работы Одно из направлений деятельности псиолога - психодиагностика, на которую отводится ... и других. Дипломная работа предполагает разрешение следующей теоретической гипотезы: для исследования мышления и интеллекта используются стандартизированные и нестандартизированные методики, их выбор, ...

  • Представление пользователей методики об очевидной валидности в немалой степени зависит от её названия, инструкции, стимульного материала [3].

Для формирования адекватного мнения испытуемых следует избегать размытых формулировок, которые могут быть истолкованы неоднозначно. Очевидная валидность повышается путём краткого описания методики и цели исследования. При наполнении содержания методики важно обратить внимание на соответствие терминологии стимульного материала лексикону выборки. Необходимо обладать информацией о возрасте испытуемых, половом составе, социальном статусе, уровне образования, профессиональной специфики испытуемых и т. д.

Содержательная валидность

Содержательная валидность психологического теста закладывается при составлении стимульного материала [3].

Первым этапом является изучение вида деятельности испытуемого и его собственных свойств. Далее разрабатывается модель тестовой деятельности на основе наиболее важных элементов реальной деятельности. И, наконец, на последнем этапе проводится анализ соответствия разработанной модели деятельности реальной деятельности испытуемого.

Использование большого количества экспертных оценок существенно повышает уровень содержательной валидности психологического теста [3].

Конструктная валидность, Конвергентная валидность

В психологии, проверка дискриминантной валидности заключается в том, что тест не должен измерять никакой черты, с которой он теоретически и не должен быть связан.

Кэмпбелл и Фиск [6] ввели понятие дискриминантной валидности в их обсуждении вопроса оценки валидности психологического теста. Они подчеркнули важность использования как конвергентной, так и дискриминантной валидности при оценке новых психологических тестов. Успешная оценка дискриминантной валидности показывает, что результаты теста не имеют значимой корреляции с результатами других тестов предназначенных для измерения теоретически разных понятий.

Факторы снижения конструктной валидности [8]:

  • Расплывчатое определение измеряемого конструкта;
  • Моно6операция: рассматривается только один аспект измеряемого конструкта;
  • Моно6метод: при изучении конструкта используется только один метод;
  • Переоценка (эффект Хоторна);
  • Эффект социальной желательности;
  • Ожидания экспериментатора (эффект Розенталя);
  • Пренебрежение некоторыми факторами;
  • Несколько независимых переменных;
  • Взаимодействие между измерением и лечением;
  • Ограниченные обобщения аналогичных переменных.

Конструктная валидность является наиболее сложным видом валидности психологического теста. Валидность существенно понижается при неточном описании измеряемого конструкта с использованием абстрактных терминов.

прогностической валидностью

Уровень прогностической валидности может использоваться как в широком смысле, означая прогноз на основе данных тестирования поведения испытуемого в реальной (критериальной) ситуации, так и в более узком смысле, указывая лишь на временной интервал [1].

Процедура определения прогностической валидности опирается на анализ корреляции между оценками по тесту и предсказанными результатами деятельности, формирующимися свойствами личности, исходом лечения и т. п. [1].

17 стр., 8446 слов

Виды диагностической деятельности педагога психолога

... теоретической основы одного из видов деятельности практического психолога, а именно диагностической деятельности. Характеристика психодиагностики как непосредственной теоретической основы диагностической деятельности психолога-практика означает, что она ... а также приемов постановки психологического диагноза, общения школьного психолога или педагога с учениками. [4, с.14] Можно говорить, что ...

В психометрии, прогностическая валидность определяется как степень соответствия прогнозов, полученным с помощью исследуемого теста, прогнозируемой мере [7].

Например, валидность когнитивного теста для выявления профессиональной пригодности заключается в корреляции между тестовым баллом и профессиональным успехом. То есть, при приёме на работу абитуриенты проходят исследуемый тест, а спустя какое6то время, например, через 1 год результаты теста сравниваются с объективными показателями успеха принятых работников. Такой когнитивный тест будет иметь прогностическую валидность в случае, если наблюдаемые корреляции окажутся статистически значимыми.

Как и во многих других аспектах социальных наук, величина корреляции, полученные из исследования прогностической валидности, как правило, не высока. Типичная прогностическая валидность для тестов на профессиональную пригодность имеет корреляционный показатель в окрестности r = 0,35. Тем не менее, полезность использования такого теста для прогноза профессиональной успешности весьма значительна [13].

текущую валидность

парал лельная валидность

«Современный тест — это не только надежный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели; а современный психологический тест — это теоретически и эмпирически обоснованная система высказываний (заданий), позволяющая получить измерения соответствующих психологических свойств» [2].

Выводы, сделанные на основе эмпирического исследования (обычно о причинноследственной связи) с использованием психологических тестов обладают высокой степенью статистической достоверности тогда, когда надежность измерительных приборов и выбранного статистического метода высока и, как правило, когда допустима низкая вероятность ошибки, то есть математические расчёты (например, корреляционные матрицы) не искажены. Показатель внутренней и внешней валидности даёт основания полагать о верности этих выводов. Заключение о валидности обсуждаемо и всегда может быть подвержено сомнениям и проверке.

Литература

[Электронный ресурс]//URL: https://psychoexpert.ru/referat/nadejnost-i-validnost-psihologicheskih-metodov/

психологический тест валидность

Анастази А., Урбина С., Бодалев А.А., Столин А.В., Гессманн Х.В.

4. Клайн П. Справочное руководство по конструированию тестов. Киев: ПАН Лтд, 1994. 288 с.

Aronson E., Wilson T.D., Akert R.M.

Campbell D.T., Fiske D.W.

Cronbach L.J., Meehl P.E.

Krauth J.

Lienert G.A., Raatz U.

Lienert G.A., Raatz U.

McIntire S.A., Miller L.A.

Messick S.

Messick S.

14. Psychology in Russia: State of the Art. Scientific Yearbook / Ed. By Yu.P. Zinchenko,V.F. Petrenko. Moscow: Lomonosov State University; Russian Psychological Society, 2011. 519 p.

SchmidtAtzert L., Amelang M.

Schnell R., Hill P.B., Esser E.