История применения тестов на практике. История возникновение тестирования и тестологии

Между теоретическими положениями, развиваемыми в рамках общей психологии, и основами психодиагностики прослеживается тесная внутренняя взаимосвязь. Представления о закономерностях развития и функционирования психики являются отправным пунктом при выборе психодиагностической методологии, конструировании психодиагностических методик, их использовании в практике.

История психодиагностики -- это и история появления основных психодиагностических методик, и развитие подходов к их созданию на основе эволюционирования взглядов о природе и функционировании психического. В этой связи интересно проследить, как формировались некоторые важные психодиагностические методы в рамках основных школ психологии.

Тест (англ. test -- проба, испытание, исследование) экспериментальный метод в психологии и педагогике, стандартизированные задания, позволяющие измерить психофизиологические и личностные характеристики, а также знания, умения и навыки испытуемого.

Тесты начали применяться в 1864 году Дж. Фишером в Великобритании для проверки знаний учащихся. Теоретические основы тестирования были разработаны английским психологом Ф. Гальтоном в 1883 году: применение серии одинаковых испытаний к большому числу индивидов, статистической обработке результатов, выделение эталонов оценки.

Первый стандартизированный педагогический тест был составлен американским психологом Э. Торнодайком. Развитие тестирования было одной из причин, обусловивших проникновение в психологию и педагогику математических методов.

Американский психолог К. Спирмен разработал основные методы корреляционного анализа для стандартизации тестов и объективного измерения тестологических исследований. Статистические методы Спирмена -- применение факторного анализа -- сыграли большую роль в дальнейшем развитии тестирования.

Значительное распространение тестирование получило в психотехнике для профессионального отбора. Интенсивное развитие психотехники приходится на время 1-й мировой войны 1914-1918 года, когда первоочередными стали вопросы профессионального отбора для нужд армии и военного производства. В связи с этим широкое применение в психотехнике имеет метод тестов.

Наибольшее развитие тестологического исследования получили в США (например, за время 2-й мировой войны с 1939 по 45 год при мобилизации в армию было тестировано около 20 миллионов человек). В России составление и применение тестов относится к 20-м годам прошлого века, в 1926 году была опубликована первая серия тестов для школ.

С конца прошлого века эксперимент стал применяться и в исследовании высших умственных процессов (суждения, умозаключения, мышления), хотя раньше неоднократно высказывалось убеждение, что эксперимент может применяться только к элементарным психическим процессам.

Для чего нужны психологические тесты? Чтобы выяснить, что испытуемый может, а какие задачи пока решить не в состоянии. Для этого в тест вводится определенное содержание в отношении тех знаний и умений, которые будут изучаться.

Составление тестов строится по единой схеме: определение целей тестирования, составление тестов в черновом виде, апробация тестов на репрезентативной выборке испытуемых и исправление недостатков, разработка шкалы измерений (на основе качественных соображений и статистической обработки результатов) и правил интерпретации результатов.

Качество тестов определяется по таким характеристикам, как надёжность, валидность (соответствие полученных результатов цели тестирования), дифференцирующая сила заданий и др.

Валидность теста -- это его психометрическая характеристика, действительная способность теста измерять ту психологическую характеристику, для диагностики которой он заявлен и указывает на степень соответствия получаемой информации диагностируемому психическому свойству.

Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями, например, с успешностью выполнения соответствующей деятельности. Совокупность характеристик валидности теста, полученных экспериментально-статистическим способом -- валидность эмпирическая.

Практическое использование тестирования связано главным образом с диагностированием личностных характеристик человека, выражаемых через количественные показатели.

Тестовые методики связаны с теоретическими принципами бихевиоризма. Методологическая концепция бихевиоризма основывалась на том, что между организмом и средой существуют детерминационные отношения. Организм, реагируя на стимулы внешней среды, стремится изменить ситуацию в благоприятную для себя сторону и приспосабливается к ней. Бихевиоризм ввел в психологию в качестве ведущей категорию поведения, понимая его как совокупность доступных объективному наблюдению реакций на стимулы. Поведение, согласно бихевиористской концепции, является единственным объектом изучения психологии, а все внутренние психические процессы должны быть интерпретированы по объективно наблюдаемым поведенческим реакциям. В соответствии с этими представлениями цель диагностики сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов (термин введен Ф. Гальтоном).

Первым исследователем, использовавшим в психологической экспериментатике понятие "интеллектуальный тест", был Дж. Кеттелл. Этот термин после статьи Дж. Кеттелла "Интеллектуальные тесты и измерения", опубликованной в 1890 г. в журнале "Mind" ("Мысль"), приобрел широкую известность. В своей статье Дж. Кеттелл писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут однообразными. Так впервые была провозглашена необходимость стандартизации тестов для того, чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых.

Дж. Кеттелл предложил в качестве образца 50 тестов, включавших различного рода измерения:

· чувствительности;

· времени реакции;

· времени, затрачиваемого на называние цветов;

· времени, затрачиваемого на называние количества звуков, воспроизводимых после однократного прослушивания, и др.

Он применял эти тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Дж. Кеттеллом и другие американские лаборатории начали использовать метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895-1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам.

Первоначально в качестве тестов использовались обычные экспериментально-психологические испытания. По форме они походили на приемы лабораторного исследования, но смысл их применения был принципиально иным. Ведь задачей психологического эксперимента является выяснение зависимости психического акта от внешних и внутренних факторов, например, характера восприятия от внешних раздражителей, запоминания -- от частоты и распределения повторений и т.д.

При тестировании психолог регистрирует индивидуальные различия психических актов, оценивая полученные результаты при помощи некоторого критерия и ни в коем случае не изменяя условий осуществления этих психических актов.

Новый шаг в развитии метода тестов был сделан французским врачом и психологом Л. Бине (1857-1911), создателем самой популярной в начале XX в. серии интеллектуальных тестов.

До А. Бине тестировались, как правило, различия в сенсомоторных качествах -- чувствительности, быстроте реакции и т. д. Но практика требовала информации о высших психических функциях, обозначаемых обычно терминами "ум", "интеллект". Именно эти функции обеспечивают приобретение знаний и успешное выполнение сложной приспособительной деятельности.

В 1904 г. Министерство образования Франции поручило Бине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению от ленивых и не желающих учиться, от страдающих прирожденными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей. Бине в сотрудничестве с Анри Симоном провел серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с трех лет). Проведенные на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня. Причиной, по которой А. Бине вместе с Т. Симоном приступил к разработке первого в истории психодиагностики интеллектуального теста, стал практический запрос -- необходимость создать методику, с помощью которой можно было отделить детей, способных к учению, от страдающих прирожденными дефектами и не способных учиться в нормальной школе.

Первая серия тестов -- Шкала Бине-Симона (Binet-Simon Intelligence Development Echelle) появилась в 1905 г. Затем она несколько раз пересматривалась авторами, которые стремились изъять из нее все задания, требующие специального обучения.

Задания в шкалах Бине были сгруппированы по возрастам (от 3 до 13 лет). Для каждого возраста подбирались определенные тесты. Они считались соответствующими данной возрастной ступени, если их решало большинство детей данного возраста (80-90 %). Показателем интеллекта в шкалах Бине был умственный возраст, который мог расходиться с хронологическим. Умственный возраст определялся по уровню тех заданий, которые мог решить ребенок. Если, например, ребенок, чей хронологический возраст равен 3 годам, решает все задачи для четырехлетних детей, то умственный возраст этого 3-летнего ребенка признавался равным 4 годам. Несовпадение умственного и хронологического возраста считалось показателем либо умственной отсталости (если умственный возраст ниже хронологического), либо одаренности (если умственный возраст выше хронологического).

Вторая редакция шкалы Бине послужила основой работы по проверке и стандартизации, проведенной в Стэнфордском университете (США) коллективом сотрудников под руководством Л. М. Термена (1877-1956). Первый вариант адаптации тестовой шкалы Бине был предложен в 1916 г. и имел так много серьезных изменений по сравнению с основным, что был назван Шкалой интеллекта Стэнфорд-Бине (Stanford-Binet Intelligence Scale). Основных нововведений по сравнению с тестами Бине было два:

1) введение в качестве показателя по тесту коэффициента интеллектуальности (Intelligence Quotient -- IQ), выводящегося из отношения между умственным и хронологическим возрастами;

2) применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.

Шкала Стэнфорд-Бине рассчитана на детей в возрасте от 2,5 до 18 лет. Она состояла из заданий разной трудности, сгруппированных по возрастным критериям. Для каждого возраста наиболее типичный, средний показатель выполнения, был равен 100, а статистическая мера рассеяния, отклонения индивидуальных значений от этого среднего равнялась 16. Все индивидуальные показатели по тесту, попадавшие в интервал, ограниченный числами 84 и 116, считались нормальными, соответствующими возрастной норме выполнения. Если тестовый показатель был выше тестовой нормы (более 116), ребенок считался одаренным, а если ниже 84, то умственно отсталым.

Шкала Стэнфорд-Бине получила популярность во всем мире. Она имела несколько редакций (1937, 1960, 1972, 1986). В последней редакции она применяется и в настоящее время. Показатель IQ, получаемый по шкале Стэнфорд-Бине, на долгие годы стал синонимом интеллекта. Вновь создаваемые интеллектуальные тесты стали проверяться путем сопоставления с результатами шкалы Стэнфорд-Бине.

Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные психологи, имеющие достаточно высокую квалификацию.

Эти особенности первых тестов ограничивали их распространение. Практика же требовала диагностировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период первой мировой войны появилась новая форма тестовых испытаний -- групповое тестирование.

Необходимость как можно быстрее отобрать и распределить полуторамиллионную армию рекрутов по различного рода службам, школам и училищам заставила специально созданный комитет поручить ученику Л. Термена Отису (1886-1963) разработку новых тестов. Так появились две формы армейских тестов -- Альфа (Army Alpha) и Бета (Army Beta). Первая из них предназначалась для работы с людьми, знающими английский язык. Вторая -- для неграмотных и иностранцев. После окончания войны эти тесты и их модификации продолжали широко применять.

Групповые (коллективные) тесты не только делали реальными испытания больших групп, но наряду с этим допускали упрощение инструктирования, процедуры проведения и оценки результатов тестирования. К тестированию начали привлекаться люди, не имеющие настоящей психологической квалификации, а всего лишь обученные проведению тестовых испытаний.

В то время как индивидуальные тесты, такие, как шкалы Стэнфорд-Бине, в основном применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, в промышленности и в армии.

Двадцатые годы прошлого столетия характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего ее направленностью на оперативное решение практических задач. Измерение интеллекта с помощью тестов рассматривалось как средство, позволяющее научно, а не чисто эмпирически подойти к вопросам обучения, профотбора, оценки достижений и т. д.

На протяжении первой половины XX в. специалистами в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили ее поистине до высокого совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, что все они отличались высокой надежностью и хорошей валидностью.

Валидизация выявила ограниченные возможности тестов интеллекта: прогнозирования на их основе успешности выполнения конкретных, достаточно узких видов деятельности часто не достигалось. Требовалась, помимо знания уровня общего интеллекта, дополнительная информация об особенностях психики человека. Возникло новое направление в тестологии -- тестирование специальных способностей, которое вначале призвано было лишь дополнить оценки тестов интеллекта, а впоследствии выделилось в самостоятельную область.

Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механических, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Разрабатывались комплексные батареи способностей для использования при консультировании и распределении персонала. Наиболее известны среди них Батарея тестов общих способностей (General Aptitude Test Battery -- GATB) и Батарея тестов специальных способностей (Special Aptitude Test Battery -- SATB), разработанные Службой занятости США для использования консультантами в государственных учреждениях. Тесты и батареи специальных способностей, различаясь составом, методическими качествами, сходны в одном -- их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.

Теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними -- факторного анализа. Факторный анализ позволял точнее определить и классифицировать то, что называли специальными способностями.

Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая была в 20-40-х гг. XX в. Факторный анализ -- это высшая ступень линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения математической связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще, то же относится и к невысоким коэффициентам корреляции. Поэтому факторный анализ и добываемые посредством этого анализа факторы не всегда верно отражают зависимости между психическими процессами.

Но, пожалуй, главное, что вызывает сомнение, -- это понимание так называемых специальных способностей. Эти способности трактуются не как индивидуальные особенности, возникшие в качестве продукта влияний требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает массу логических трудностей. В самом деле, откуда вдруг сложились и проявились у современного индивида такие способности, о которых даже представления не имели предшествующие поколения? Нельзя же думать, что в психике таятся способности, пригодные для всех грядущих общественных требований.

Сказанное убеждает в том, что к возможностям факторного анализа и к его факторам нужно относиться с большой осторожностью и не считать этот анализ универсальным инструментом изучения психики.

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях -- тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияния специальных программ обучения на эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее.

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэнфордский тест достижений (Stanford Achievement Test -- SAT), впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях. Значительное число тестов специальных способностей и достижений было создано под воздействием практических запросов со стороны промышленности и экономики. Они применялись для профотбора и профессионального консультирования. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов.

Наименование параметра Значение
Тема статьи: Метод тестов
Рубрика (тематическая категория) Психология

Сегодня широкое применение получил метод тестирования , который когда-то в отечественной науке и практике недооценивался. Теперь на вооружении психологов имеется несколько тысяч тестов.

Тест (англ. test – проба, проверка) - ϶ᴛᴏ система заданий, позволяющих измерить уровень развития качеств (свойств) личности. Тесты являются специализированными методами психодиагностического обследования. От других методов они отличаются тем, что имеют четкую процедуру сбора и обработки данных и своеобразную их последующую интерпретацию

Популярность данного метода обусловлена возможностью получения точной и качественной характеристики психологического явления, а также возможностью составить результаты исследования, что в первую очередь крайне важно для решения практических задач.

Одна из самых первых попыток разработать тесты была сделана Ф. Гальтоном (1822-1911). Тесты и статические методы, предложенные Ф. Гальтоном, в дальнейшем получили применение для решения практических вопросов жизни и послужили началом создания прикладной психологии, получившей название ʼʼпсихотехникаʼʼ. Этот термин вошел в лексикон ученых после публикации статьи Д. Кеттелла (1860-1944). ʼʼПсихология, – пишет в этой статье Кеттелл, – не сможет стать прочной и точной, как физические науки, в случае если не будет базироваться на эксперименте и измерении. Шаг в данном направлении должна быть сделан путем применения серии умственных тестов к большому числу людей. Результаты могут иметь значительную научную ценность в открытии постоянства психических процессов, их взаимозависимости и измерений в различных обстоятельствахʼʼ.

В 1905 ᴦ. французский психолог А. Бинœе создал один из первых психологических тестов – тест для оценки интеллекта.

Впоследствии различными учеными создаются целые серии тестов. Их направленность на оперативное решение практических задач обусловила быстрое и широкое распространение психологических тестов. К примеру, Г. Мюнстерберг (1863-1916) предложил тесты для профессионального отбора, которые создавались следующим образом: первоначально они проверялись на группе рабочих, достигших лучших результатов, а затем им подвергались вновь принимаемые на работу.

В период Первой мировой войны использование психологических тестов приобрело массовый характер.
Размещено на реф.рф
Так, в США военные власти обратились к крупнейшим психологам страны Э. Торндайку (1874-1949), Р. Йерксу (1876-1956) и Г. Уипплу (1878-1976) с предложением возглавить решение проблемы применения психологии в военном делœе. Американская психологическая ассоциация и университеты быстро развернули работу в данном направлении.

Разработка тестов как психологического метода осуществлялась и в России. Развитие данного направления в отечественной психологии того времени связано с именами А. Ф. Лазурского (1874-1917), Г. И. Россолимо (1860-1928), В. М. Бехтерева (1857-1927), а также П. Ф. Лесгафта (1837-1909).

Особенно заметный вклад в разработку тестовых методов был внесен Г. И. Россолимо. Для диагностики индивидуальных психических свойств он разработал методику их количественной оценки, дающую целостное представление о личности. Методика позволяла оценить 11 психических процессов, которые, в свою очередь, разбивались на пять групп: внимание, восприимчивость, воля, запоминание, ассоциативные процессы (воображение и мышление).

Сегодня тесты - ϶ᴛᴏ наиболее широко используемый метод психологического исследования. Многие методики проведения тестирования носят имена их авторов, к примеру тест Айзенка, тест Роршара, тест Розен-цвейга, тест Равена, кубики Косса и др.
Размещено на реф.рф
Это еще раз подчеркивает основную особенность тестов, когда в их содержании и методике использования отражена авторская психологическая теория, авторское мировоззрение. Все это позволяет с помощью тестов выделять необходимые параметры психической реальности, ставить в отношении их психодиагностические вопросы и успешно их решать. Также крайне важно отметить тот факт, что тесты занимают промежуточное положение между субъективными и объективными методиками. Это обусловливает многообразие тестовых методик.

Существуют различные варианты тестов: тест-опросник, тест-задание, проективные тесты.

Тест-опросник основан на системе заранее продуманных, тщательно отобранных и проверенных с точки зрения их валидности и надежности вопросов, по ответам на которые можно судить о психологических качествах испытуемых.

Тест-задание предполагает получение информации о психологических характеристиках человека на основании анализа успешности выполнения определœенных заданий. В тестах этого типа испытуемому предлагается выполнить определœенный перечень заданий. Количество выполненных заданий является основанием для суждения о наличии или отсутствии, а также степени развития у него определœенного психологического качества. Большинство тестов по определœению уровня умственного развития относится именно к этой категории.

В основе проективных тестов лежит механизм проекции, согласно которому человек склонен приписывать другим людям неосознаваемые собственные качества (особенно недостатки). Данная категория тестов не использует самоотчеты испытуемых, а предполагает свободную интерпретацию исследователœем выполняемых испытуемым заданий. К примеру, по наиболее предпочтительному для испытуемого выбору цветовых карточек психолог определяет его эмоциональное состояние. В других случаях испытуемому показывают картинки с изображением неопределœенной ситуации, после чего психолог предлагает описать события, отраженные на картинке, и на базе анализа интерпретации испытуемым изображенной ситуации делается вывод об особенностях его психики.

Тест-опросник и тест-задание применимы к людям разного возраста͵ принадлежащим к различным культурам, имеющим разный уровень образования, разные профессии и неодинаковый жизненный опыт. Это их положительная сторона. Недостаток состоит в том, что при использовании тестов испытуемый по своему желанию может сознательно повлиять на получаемые результаты, особенно если он заранее знает, как устроен тест и каким образом по полученным результатам будут его оценивать. Вместе с тем, тест-опросник и тест-задание неприменимы в тех случаях, когда изучению подлежат психологические свойства и характеристики, в существовании которых испытуемый не должна быть полностью уверен, не осознает или сознательно не хочет признать их наличие у себя. Такими характеристиками являются, к примеру, многие отрицательные личностные качества и мотивы поведения.

В этих случаях обычно применяется третий вид тестов – проективные. Следует указать, что тесты проективного типа предъявляют повышенные требования к уровню образованности и интеллектуальной зрелости испытуемых, и в данном состоит основное практическое ограничение их применимости. Вместе с тем, такие тесты требуют большой специальной подготовки и высокой профессиональной квалификации со стороны самого психолога.

При использовании тестов существуют различные формы представления тестового материала: бланковые, аппаратурные, процессуальные.

Бланковыми называются такие формы, при использовании которых испытуемый получает тестовый материал в виде различных бланков: рисунков, схем, таблиц, опросников и т.п.

В аппаратурных формах используются разные технические средства, различного рода аппаратура для предъявления и обработки результатов тестирования, к примеру аудио- и видеотехника, электронно-вычислительные машины.

С помощью процессуальной формы исследуется какой-либо психологический или поведенческий процесс, и ему в результате дается точная качественная или количественная характеристика, к примеру процесс запоминания человеком материала, процесс межличностного взаимодействия индивидов в группе.

При этом, несмотря на свою большую популярность в применении, значение тестов нельзя абсолютизировать и подменять ими другие виды изучения психики человека. Ограничения в применении тестов обусловлены следующим.

1. Тест применяется для оценки того или иного психического качества человека, как правило, вне связи с реальной деятельностью. При этом психических качеств в ʼʼчистомʼʼ виде не существует. Эти качества связаны всœегда с целями и условиями деятельности человека, с другими психическими качествами, с особенностями личности в целом. Эта связь в тестовых испытаниях учитывается очень слабо.

2. С помощью тестов пытаются обычно определить (к примеру, при профессиональном отборе) уровень развития у конкретного человека тех или иных психических качеств. При этом для этих целœей нужно не столько знать достигнутый к моменту испытаний уровень качеств, сколько прогнозировать возможности их изменения в процессе обучения и трудовой деятельности. Иными словами, для целœей профессиональной подготовки более важно знать не наличный, а потенциальный уровень возможностей и способностей человека. Ответа на данный вопрос тестовые испытания практически не дают.

По этой причине к проведению тестовых испытаний следует подходить с большой осторожностью, ими ни в коем случае нельзя подменять другие виды психологического исследования человека. При этом в сочетании с другими методами данные тестовых испытаний могут дать весьма ценный материал для изучения психологических качеств человека.

Метод тестов - понятие и виды. Классификация и особенности категории "Метод тестов" 2017, 2018.

1.1. Зарождение тестологии.

1.2. Тесты Дж. Кеттелла, А. Бине, Т. Симона и др.

1.1. Время зарождения тестологии относят ко второй половине XIX века, когда психологи стали исследовать индивидуальные различия физических, физиологических и психических особенностей человека.

В середине ХIХ века особое внимание исследователей уделялось изучению умственной отсталости, которую в этот период впервые стали рассматривать как болезнь. Французский врач Э. Сеген разработал собственную методику и основал первую школу для обучения умственно отсталых. Впоследствии многие из разработанных им приемов вошли в тесты на выявление уровня интеллекта.

Одним из первых, кто начал использовать тестовые технологии для измерения индивидуальных особенностей, стал английский биолог Френсис Гальтон. Он занимался вопросом наследственности, при этом разработал ряд методик для определения зрительной, слуховой и тактильной чувствительности, а также для определения мускульной силы, скорости реакции и др. В ходе сбора эмпирических данных Гальтон обследовал множество учреждений в системе образования с целью получить систематические измерения антропометрических характеристик учащихся. В 1884 году он организовал антропометрическую лабораторию на Всемирной выставке в Лондоне, где каждый желающий за небольшую плату мог измерить свои физические возможности по 17 показателям: рост, вес, сила кисти, сила удара, различения цвета, острота зрения и др. Таким образом, накапливались первые систематические данные по индивидуальным особенностям простых психофизических функций. По мнению Ф.Гальтона, тесты сенсорного различения можно использовать как средство оценки интеллекта человека.

Ф. Гальтон был первым, кто применил оценочные шкалы, анкетирование и технику свободных ассоциаций.

Он сформулировал три принципа тестирования, эти выводы сохраняют актуальность до сих пор:

1) применение серии одинаковых испытаний к большому количеству испытуемых;

2) необходимость накопления и обработки статистических результатов;

3) установление эталонов оценки.

Важнейшим вкладом Ф. Гальтона в развитие тестологии является разработка и использование методов математической статистики для обработки полученных данных по индивидуальным различиям. Он вводит метод сравнения двух рядов переменных, для оценки этого соотношения используется особая величина – индекс-коэффициент корреляции. Он также изучает взаимосвязь переменных, для чего впервые использует построение линий регрессии одной переменной на другую.

1.2. Особенно заметный вклад в развитие тестирования внесли работы Джеймса Кеттелла (1860 - 1944). Американский психолог разработал около пятидесяти наборов заданий, которые назывались «умственными тестами», практически же это были тесты сенсорного различения и скорости реакции, которые, по мнению Дж. Кеттелла, можно было использовать для измерения интеллекта. Дж. Кеттелл рассматривал тестирование как научный метод и выдвигал ряд требований к проведению тестирования, чтобы результаты были приближены к объективным.


Тесты Дж. Кеттелла были типичными среди большого количества серий тестов, разработанных в последнее десятилетие ХIХ века. Такие серии применялись для школьников, студентов и взрослых людей в Америке повсеместно. В основном они были направлены на измерение простых сенсорных и моторных процессов, хотя их авторы заявляли, что тесты предназначены для измерения интеллекта. Первая проверка этих тестов показала их слабую внутреннюю согласованность и то, что их результаты не соответствовали оценке интеллекта испытуемых независимыми экспертами.

В Европе в это время тесты, например, тесты Э. Крепелина и Г. Эббингауза, были более сложными и объективными.

Дж. Кеттелл активно пропагандировал новые методы измерения. В течение 1895 - 1896 гг. в Америке создаются два национальных комитета, с целью организации тестологов в области теоретических исследований и практики создания качественных тестов и их применения.

Новый этап в развитии тестологии связан с деятельностью французского психолога Альфреда Бине (1857 - 1911). Он разрабатывает оригинальные методики измерения интеллекта. А. Бине не устраивали попытки оценить уровень интеллекта через измерение элементарных психических процессов. Он идет по пути измерения сложных интеллектуальных функций. Работа в Комиссии по изучению методов обучения умственно отсталых детей с 1904 года дала возможность А. Бине реализовать свои идеи на практике. Совместно с Теодором Симоном А. Бине создает тестовые задания, направленные на дифференциацию детей способных к обучению, но ленивых или отстающих, и на детей умственно отсталых.

Шкала Бине-Симона (шкала 1905 года) состояла из 30 заданий, которые были расположены по возрастанию трудности. Уровень трудности был определен по результатам обследования 50 нормальных детей в возрасте от 3 до 11 лет и небольшого числа слабоумных детей. Тесты были рассчитаны на оценку способности к суждению, пониманию и рассуждению, которые, по мнению А. Бине, и являются основными компонентами интеллекта. Вероятность успешного выполнения определялась возрастающей трудностью заданий теста и увеличивалась в зависимости от возраста испытуемого.

В 1908 году появляется новый переработанный вариант шкалы: увеличивается количество заданий, убираются неудачные задания, расширяется выборка стандартизации. Бине и Симон заявляют и новую цель шкалы: теперь это не только дифференциация детей на нормальных и умственно отсталых, но и выделение среди нормальных детей различных возрастных уровней интеллектуального развития. Группировка тестов по возрастным уровням позволила определить нормы для детей разных возрастных категорий. Дальнейшая модификация шкалы была сосредоточена на ее стандартизации и определении ее валидности.

Тесты Бине-Симона привлекли внимание психологов разных стран. Они активно переводились и адаптировались. В Америке появилось много переработанных вариантов тестов Бине-Симона. Одним из удачных вариантов признан тест, разработанный Левисом Мадисоном Терменом (Странфордская шкала интеллекта Бине). В этом варианте был впервые использован коэффициент интеллектуальности - показатель умственного развития (IQ).

Активная работа по созданию, совершенствованию и применению тестов сопровождалась разработкой статистических методов обработки полученных результатов (К. Пирсон, Ч.Спирмен).

В начале возникновения и становления тест как измерительный инструмент использовался только в рамках эксперимента, был предназначен исключительно для индивидуального измерения. Групповые тесты впервые появились в США в 1917 году, когда Америка вступила в Первую мировую войну, и возникла необходимость быстро определить интеллектуальный уровень полутора миллионов вступающих в ряды армии. С этой целью использовались тесты интеллекта Артура Синтона Отиса. Тесты Отиса включали два вида: альфа-вербальный тест для владеющих английским языком и бета-тест – невербальный, рассчитанный на неграмотных и новобранцев иностранного происхождения. По окончании Первой мировой войны после некоторой переработки эти тесты стали повсеместно использоваться как групповые тесты интеллекта в образовательных учреждениях, среди взрослого населения.

В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчета результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определенное количество баллов) вместо возрастных долей, которые использовались А.Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами .

2. Психологические и педагогические тесты

В начале ХХ века также возникает идея использования тестирования для измерения уровня учебных достижений. Американский психолог В.А.Макколл предлагает разделить тесты на психологические (определение уровня умственного развития) и педагогические (измерение успешности учащихся по предметам за определенный период обучения). Целью педагогического тестирования, по мысли Макколла, должно быть выделение и объединение учащихся с близкими показателями уровня обученности.

Основоположником педагогических измерений считается американский психолог Эдуард Ли Торндайк, который создал первый педагогический тест (ability tests). Первые тесты учебных достижений представляли собой тесты на решение арифметических задач, правописание, оценку почерка, рассуждение. Свои выводы по использованию тестовых методов в педагогике Торндайк обобщает в книге «Введение в теорию психологии и социальных измерений» (1904).

История развития системы тестирования в России и за рубежом

План

    Возникновение тестирования.

    Первые педагогические тесты.

    Развитие тестирования в России.

    Современная теория тестов (IRT).

Возникновение тестирования

Всякая попытка определить точное время возникновения тестов напоминает стремление географов найти точное начало большой реки, вытекающей множеством ручейков из обширного болота. Примерно так же обстоит дело и с тестами. Для изучения истории тестов вначале потребовалось изучить предысторию – то самое болото, из которого и вытекает их подлинная история.

В Древнем Египте искусству жрецов обучали только тех, кто выдерживал систему определенных испытаний. Вначале кандидат проходил процедуру, которую можно было бы сейчас назвать собеседованием. При этом выясняли биографические данные, уровень образованности, оценивали внешность, умение вести беседу. Затем проверяли умения – трудиться, слушать, молчать. Проводили испытания огнем, водой и угрозой смерти. Тем, кто не уверен, что выдержит все тяготы длительного образования, предлагалось подумать – с какой стороны окончательно закрыть за собой дверь в храм – с внутренней или внешней?

Сообщается (там же), что эту суровую систему испытаний и отбора успешно преодолел в молодые годы Пифагор. Вернувшись после учебы в Грецию, он основал свою школу, допуск в которую открывал только после серии различных испытаний, похожих на те, которые выдержал он сам.

Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что "не из каждого дерева можно выточить Меркурия". И потому придавал значение диагностике, в первую очередь, именно этих способностей, что делалось с помощью трудных математических задач.

Как считают, Пифагор обращал также внимание на походку и на смех молодых людей, утверждая, что манера смеяться служит самым хорошим показателем характера человека. Он внимательно относился к рекомендациям родителей и учителей, тщательно вел наблюдение за каждым новичком, особенно после того, как последнего приглашали свободно высказываться и, не стесняясь, смелее оспаривать мнение собеседников (там же).

В III тысячелетии до н.э. в Китае существовала должность правительственного чиновника. Соответственно, появились и первые элементы профотбора на эту должность. Отбору способствовала атмосфера торжественности и внимания к молодым людям, осмелившимся держать государственные экзамены на занятие по этой должности. В китайском обществе эти экзамены воспринимались почти как празднество. Тему экзамена нередко давал сам император, и он же проводил проверку знаний претендентов и на заключительном этапе конкурса.

Одной из самых распространенных форм диагностики способностей человека в те времена была физиогномика – искусство распознавания характера и способностей человека по его внешнему виду. Гиппократ, впервые употребивший это название, считал физиогномику наукой. Тогда же появились первые учебники и практические руководства по физиогномике, а также и первые специалисты.

Имеется немало свидетельств применения различных испытаний в Древнем Риме и Спарте. В Спарте была создана и успешно осуществлялась система воспитания воинов, в Риме – система обучения гладиаторов. "Люди– писал Платон, – рождаются не слишком похожими друг на друга, их природа различна, да и способности к тому или иному делу также... Поэтому можно сделать все в большем количестве, лучше и легче, если выполнять одну какую-нибудь работу соответственно своим природным задаткам".

В Афинах обсуждался вопрос о зависимости могущества государства от способностей лиц, им управляющих. В работе Платона "Государство" на вопрос о том, каких правителей нужно выбирать, Сократ отвечает: "Надо отдавать предпочтение самым надежным, мужественным, и по возможности, самым благообразным; кроме того, надо отыскивать людей не только благородных и строгого нрава, но и обладающих также свойствами, подходящими для такого воспитания. У них... должна быть острая восприимчивость к наукам и быстрая сообразительность. Надо искать человека с хорошей памятью, несокрушимо твердого и во всех отношениях трудолюбивого" (там же).

Нередко результаты испытания интеллектуальных способностей становились предметом гордости. Сообщается, например, что индийский царь Девсарам, желая испытать мудрость иранцев, прислал им шахматы. Предполагалось, что иранцы вряд ли сумеют разгадать суть этой игры, и потому они должны были, по условию, отослать в Индию подать. Однако визирь Важургмихр понял правила игры и, в свою очередь, изобрел игру, называемую сейчас нарды. Эту игру он послал в Индию, и там выяснилось, что разгадать правила этой игры индийцы не смогли.

Различные конкурсы и экзамены устраивались и в средневековом Вьетнаме. Всего за два года, в период с 1370 по 1372 г. удалось провести переаттестацию всех гражданских чиновников и военнослужащих, что позволило улучшить работу государственного аппарата. В результате этого Вьетнам стал сильным и жизнеспособным государством. Особое внимание было уделено созданию боеспособного офицерского корпуса. В ХV в. экзамены были там упорядочены. Они проводились по этапам и турам. Лауреаты получали подарки от короля, их имена вносились в "золотой список", который вывешивался у Восточных ворот столицы, об их победах на конкурсе сообщалось в родную общину. Имена наиболее отличившихся участников высекались на специальных каменных стелах, установленных в Храме Литературы (там же).

Если использование письменных контрольных работ и экзаменов в странах Востока уже в те годы считалось вполне нормальным и естественным делом, то этого нельзя сказать о странах Запада. Там возникали трудности психологического характера, вызванные попытками замены привычных устных форм контроля письменными. Например, в Англии сто лет ушло на слом консервативных традиций, препятствовавших применению письменных контрольных работ в учебном процессе, и еще сто лет на то, чтобы последние начали использоваться на приемных и выпускных экзаменах.

Впрочем, были исключения. В той же Англии ценность письменных работ быстрее других оценил Орден Иезуитов, увидевший в них средство повышения мотивации учебной работы. Используя свое влияние, Орден распространил практику применения письменных работ во многих других странах. Ответная реакция на это в первую очередь проявилась в Америке. Сообщается, что там, в 1762 г., состоялось открытое выступление студентов Йельского университета против использования письменной формы экзаменов, из-за которых им приходится много зубрить.

В 1884г. в США вышла первая книга с тестовыми материалами, содержавшая задания и ответы к ним с оценкой по пятибалльной шкале. В этой книге содержались задания по математике, истории, грамматике, навигации, давались примерные тексты сочинений вместе с методом количественной оценки сочинений. Это был первый в истории случай использования простейших статистических расчетов в педагогической работе.

Быстро распространявшись в США, такая форма контроля знаний имела не только много сторонников, но и противников. Сообщается, например, о школьном инспекторе из Чикаго, запретившем в 1881г. проводить письменный контроль и обязавшем осуществлять перевод учащихся в очередной класс не на основе проверок, а опираясь исключительно на мнения учителей и директоров школ. Распространилось мнение, что никто лучше учителя не сможет оценить способности ученика, и потому экзамены и всякие другие формы контроля являются издевательством над здравым смыслом. Этим было положено начало общественному движению против какого-либо контроля в школе. Пик такого движения в США пришелся на конец XIX века (1880-е годы), после чего вновь стали появляться предпосылки для формирования благожелательного отношения к контролю знаний.

Потребность в создании общественно-государственной системы контроля знаний была осознана в США в 1885 году. В Нью-Йорке начал действовать экзаменационный совет – один из немногих советов, которые смогли разработать методы объективного контроля знаний. Начало общегосударственной системы оценки знаний положило создание там в 1900 году комитета по проверке знаний абитуриентов колледжей в США.

В России конца XIX – начала XX века вопрос разработки тестов и их применения не ставился и не обсуждался. “Проверка знаний, – писал один из авторов, – представляется мне по опыту самым скучным, бесполезным и даже вредным занятием. Она терпима, как необходимое зло, только там, где от учителя требуют ежемесячных отметок как средства контроля не только над учениками, но и над учителем”. Однако с той поры в российской педагогике стихийно сформировались две противоречащие тенденции: одна за контроль знаний учащихся, другая – против.

Приведенный здесь краткий исторический экскурс позволяет сделать вывод о необходимости рассматривать испытания как важную часть жизни многих – если не всех – народов мира, со времен древнейших цивилизаций и до наших дней. Однако можно ли на основании приведенных данных говорить о раннем историческом периоде возникновения тестов? Если согласиться с наиболее распространёнными сейчас определениями теста, даваемыми как перевод с английского слова "test" (испытание, проверка, проба), то на поставленный вопрос надо будет ответить утвердительно. А если не согласиться? Тогда надо допустить, что настоящие тесты появились позже, в конце XIX-начале XX века.

ВАРИАНТ №1

А1. Кто из ученых впервые высказал предположение о составе первичной атмосферы Земли:

1- А.И. Опарин 3- Л. Пастер

2- С. Миллер 4- Ф. Реди

А2. Какими по способу питания были первые организмы:

1-автотрофы 3- гетеротрофы

2-миксотрофы 4- хемотрофы

А3. В процессе возникновения жизни на Земле выделяют несколько этапов. Назовите первый из них:

1- концентрирование веществ 3- возникновение самовоспроизводящихся молекул

2-абиогенный синтез органических веществ 4- возникновение фотосинтеза

А4. Общей реакцией обмена для всех первых организмов была:

1-анаэробный гликолиз 3-окислительное фосфорилирование

2-синтез глюкозы в хлоропластах 4- фотолиз воды

А5. В 1953 году С.Миллер и Г. Юри синтезировали органические вещества, пропуская электрические разряды через смесь газов. Укажите газ, который в эксперименте отсутствовал:

1-метан 3-кислород

2- аммиак 4-водород

1-концентрирование веществ 2-абиогенный синтез органических веществ

3- Земля – газо-пылевое облако 4- раскаленная планета

5- охлаждение планеты 6- ливневые дожди

А- Ф. Реди 1- креационизма

Б- Д. Холдейн 2 –биохимической эволюции

В- А.И. Опарин 3-самозарождения

Г- Ван Гельмонт

Д- Ашер

В3.В состав первичной атмосферы входили:

1-сероводород 4-аммиак

2-метан 5-неон

3-кислород 6-водород

В4. Выберите свойства, которыми обладала коацерватная капля:

1- рост 4-наследственность

2- клеточное строение 5-раздражимость

3-обмен веществ 6- размножение

В5. Современная теория возникновения планет основана на работах:

1- И. Канта 4- Д. Джинса

2- Ж. Бюффона 5-О.Ю. Шмидта

3- П. Лапласа 6- Л. Пастера

С1. Почему первые организмы на Земле были гетеротрофами?

С2. Какие свойства нуклеотидов сыграли значительную роль в возникновении жизни?

Тест «Возникновение жизни на Земле»

ВАРИАНТ №2

А1. Что служило источником энергии для самых первых примитивных форм жизни на Земле:

1-энергия солнца 3-электрические разряды

2-химическая энергия 4-тепловая энергия

А2. Назовите ученого, который первым высказал гипотезу абиогенного происхождения органических соединений:

1- А.И. Опарин 3- Л. Пастер

2- С. Миллер 4- Ф. Реди

А3. В 1953 году С. Миллер и Г. Юри синтезировали органические вещества, пропуская электрические разряды через смесь газов. Укажите вещество, которое они не получили:

1-глицин 3- мочевина

2- АТФ 4- глутамин

А4.Одним из важнейших этапов возникновения жизни можно считать:

1- появление аминокислот 3- появление нуклеиновых кислот

2- появление углеводов 4- появление липидов

А5. Наиболее важным с точки зрения «возникновения жизни» свойством органических молекул оказалась их:

1- способность к разнообразным химическим реакциям

2- способность к самоорганизации и воспроизведению 3-сложность строения

4-непрочность внутренних химических связей

В1. Расположите в правильном порядке этапы возникновения жизни по теории А.И. Опарина:

1- анаэробные прокариотические гетеротрофы 2- преобразование планеты

3- абиогенный синтез органических веществ 4- эукариотические гетеротрофы 5- образование коацерватов 6- появление самовоспроизводящихся структур

В2. Соотнесите ученых и теории возникновения жизни:

А- Д. Бернал 1- панспермии

Б- С. Миллер 2 –биохимической эволюции

В- Аристотель 3-самозарождения

Г- Луи Пастер

Д- Рихтер

В3. Выберите характеристики первых организмов:

1-автотрофы 4-многоклеточные

2-гетеротрофы 5-одноклеточные

3-прокариоты 6-эукариоты

В4. Каковы первые источники энергии на Земле:

1-вулканизм 4-гидроэнергия

2- грозовые разряды 5-радиоактивная энергия

3-энергия ветра 6 –энергия распада неорганических веществ

В5. В чем заслуги А.И. Опарина:

1- первым высказал гипотезу абиогенного синтеза органических веществ

2- сформулировал естественно-научную теорию происхождения жизни

3- доказал невозможность самозарождения живых организмов

4- синтезировал органические вещества за счет электрических разрядов

5 – разработал коацерватную теорию

6- доказал невозможность самозарождения микроорганизмов

С1. Чем было вызвано появление автотрофных организмов?

С2. Какое значение имело появление мембраны у протобионтов для биологической эволюции?