Первые тесты как метод исследования имели. Тестирование (метод тестов)

Главная

Времена года

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

знание тестовый задание

Одним из способов быстрой проверки знаний является тестирование. Однако в настоящее время, в связи с развитием информационных технологий, дистанционного обучения и в частности адаптивных обучающих систем, тестирование может применяться как средство идентификации личности обучаемого для построения индивидуальной последовательности обучения, когда каждый обучаемый проходит учебные курсы в том порядке и в том объеме, которые наиболее соответствуют его уровню подготовленности. В технологии дистанционного обучения при отсутствии непосредственного контакта обучаемого с преподавателем тестирование становится одним из основных средств контроля знаний, поэтому особенно остро встает проблема создания качественных тестов, которые могли бы быстро, объективно и адекватно измерять уровень знаний обучаемых.

Можно различать три вида тестирования:

· предварительное;

· текущее;

· итоговое.

Предварительное тестирование применяется перед началом обучения и направлено на выявление предварительных знаний обучаемого по ряду дисциплин, которые ему предстоит изучать. Сюда же могут включаться психологические тесты для определения индивидуальных характеристик личности обучаемого, которые учитываются в ходе обучения для настройки на работу с конкретным обучаемым. По результатам предварительного тестирования строится предварительная последовательность изучения учебных курсов.

Текущее тестирование - это контроль или самоконтроль знаний по отдельному элементу учебного курса, например, разделу или теме. По его результатам строится последовательность изучения тем и разделов внутри курса, а также может осуществляться возврат к темам, которые были изучены недостаточно хорошо.

Итоговое тестирование - это контроль знаний по курсу в целом или по совокупности курсов. По его результатам корректируется последовательность изучения учебных курсов.

При работе с тестами всегда нужно учитывать надежность результатов тестирования. Под надежностью тестовых результатов понимается характеристика, показывающая точность измерения знаний заданиями теста. Нужно отметить, что речь идет не о надежности теста, а о надежности результатов тестирования, т.к. на нее сильно влияет степень однородности различных групп обучаемых, уровень их подготовленности и ряд других факторов, связанных не с самим тестом, а с условиями проведения процесса тестирования.

1. Классификация тестов, методы тестирования, достоинства и недостатки тестовой проверки знаний студентов

1.1 Тестирование как метод исследования

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида .

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжирования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют объективности оценок, не зависящих от субъективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

К тестам предъявляют следующие требования:

Строгая формализация всех этапов тестирования;

Стандартизация заданий и условий их выполнения;

Квантификация полученных результатов и их структурирование по заданной программе;

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

Каждый тест, соответствующий критериям надежности, кроме набора заданий включает в себя следующие компоненты:

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий;

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится;

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученный результат .

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь необходимо учитывать, что переносить интерпретацию полученных результатов можно только на такие группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров;

2) введение поправочных коэффициентов с учетом характеристик выборки;

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос);

б) указаний относительно регистрации или интеграции полученных ответов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя, различают тесты объективные и субъективные.

К объективным тестам относится большинство тестов достижений и психофизиологические тесты. К субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

По формальной структуре различаются тесты простые, т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатистическими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой «идеальной норме» .

Разработка теста состоит из четырех этапов.

1) на первом этапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

2) на втором производится отбор предварительных пунктов испытания с последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

3) на третьем этапе тест проверяется повторно на той же самой популяции;

4) на четвертом калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его проявления (способности, уровень знаний, темперамент, интересы, установки);

б) связанную с этим валидизацию метода, т.е. определение того, насколько он измеряет требуемое свойство;

в) величину выборки из популяции, на которой должна проводиться оценка метода;

г) стимулирующий материал (таблички, изображения, игрушки, фильмы);

д) влияние исследователя в процессе инструктирования, постановки задач, разъяснений, ответов на вопросы;

е) условия ситуации;

ж) такие формы поведения испытуемого, которые свидетельствуют об измеряемом свойстве;

з) шкалиpование релевантных форм поведения;

и) сведение результатов по отдельным измеряемым пунктам в общие значения (суммирование ответов типа «Да»);

к) формулировку результатов в нормированной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам.

Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечая на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, кружочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал «лжи». Опросники применяются преимущественно для диагностики характера, диагностики личности (экстраверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций.

На современном этапе в прикладной социологии чаще всего используются тестовые методики, заимствованные из социальной психологии, касающиеся изучения качеств личности. Появляются тесты, специально разработанные социологами. Эти тесты часто используются в социологических анкетах.

1.2 Достоинства и недостатки тес товой проверки знаний студентов

В системе высшего образования применение тестирования знаний студентов имеет свои предпосылки. Поэтому тестирование имеет как достоинства, так и недостатки которые будут рассмотрены ниже.

В качестве достоинств можно отметить следующее:

1. Тестирование является более качественным и объективным способом оценивания. Для заочного обучения в условиях предельного ограничения количества аудиторных часов тестирование часто является единственной возможностью формирования достаточно объективной оценки знаний студентов.

2. Тестирование - более справедливый метод, оно ставит всех студентов в равные условия, как в процессе контроля, так и в процессе оценки, исключая субъективизм преподавателя.

3. Тесты это более объёмный инструмент, поскольку позволяет установить уровень знаний студента по предмету в целом, чем при выполнении контрольной работы.

4. Тестирование существенно экономит время преподавателя, отводимое на контроль знаний студентов, по сравнению с проверкой и защитой контрольных работ студентами заочной форме обучения. Это связано с тем, что тестированию одновременно подвергается сразу группа студентов.

Однако тестирование имеет также некоторые недостатки:

1. Жесткие временные ограничения, применяемые при выполнении тестовых заданий, исключают возможности определить структуру и уровень подготовленности тех испытуемых, которые в силу своих психофизиологических особенностей думают и делают все медленно, но при этом качественно.

2. Данные, получаемые преподавателем в результате тестирования, хотя и включают в себя информацию о пробелах в знаниях по конкретным разделам, но не позволяют судить о причинах этих пробелов.

3. Обеспечение объективности и справедливости теста требует принятия специальных мер по обеспечению конфиденциальности тестовых заданий. При повторном применении теста желательно внесение в задания изменений.

4. В тестировании присутствует элемент случайности и интуиции. Причиной этого может быть угадывание ответа студентом, поэтому при разработке теста необходимо предвидеть такую ситуацию .

2 . Модели тестирования

Остановимся на основных моделях тестирования.

Классическая модель. Данная модель является самой первой и самой простой. Имеется n заданий по определенной области знаний, по нескольким областям знаний или части области знаний (разделу, теме и т.п.). Из этого множества заданий случайным образом выбирается k заданий (k

Достоинство:

Простота реализации.

Недостатки:

Из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных;

Оценка зависит только от количества правильных ответов и не учитывает сложность заданий.

Классическая модель из-за своих недостатков имеет самую низкую надежность, т.к. отсутствие учета параметров заданий часто не позволяет объективно оценить знания обучаемого.

В настоящее время происходит уход от использования данной модели к более совершенным и эффективным моделям, например, к адаптивному тестированию.

Классическая модель с учетом сложности заданий. Это тестирование проводится аналогично предыдущему, однако каждое задание имеет определенный уровень сложности Ti, i= и при подсчете результата тестирования учитывается сложность вопросов, на которые обучаемый дал правильный ответ. Чем выше сложность вопроса, тем выше будет результат тестирования. Для вопросов, на которые был дан неправильный ответ, сложность не учитывается.

Недостаток: из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных.

Модели с учетом сложности заданий позволяют более адекватно подойти к оценке знаний. Но случайность выбора заданий не позволяет добиться параллельности тестов по сложности, т.е. одинаковости суммарных характеристик сложности заданий, что снижает надежность тестирования.

Модель с возрастающей сложностью. Имеется m уровней сложности. В тесте должны присутствовать задания всех уровней сложности. Из этого множества заданий случайным образом выбирается k заданий (k

Результат тестирования определяется аналогично модели с учетом сложности.

Данная модель обеспечивает параллельность тестов по сложности, т.е. надежность результатов тестирования еще выше, чем в предыдущих моделях.

Модель с разделением заданий по уровням усвоения.

Различают пять уровней усвоения учебного материала.

Нулевой уровень (Понимание) - это такой уровень, при котором обучаемый способен понимать, т.е. осмысленно воспринимать новую для него информацию. Фактически речь идет о предшествующей подготовке обучаемого .

Первый уровень (Опознание) - это узнавание изучаемых объектов при повторном восприятии ранее усвоенной информации о них или действиях с ними, например, выделение изучаемого объекта из ряда предъявленных объектов.

Второй уровень (Воспроизведение) - это воспроизведение усвоенных ранее знаний от буквальной копии до применения в типовых ситуациях. Примеры: воспроизведение информации по памяти, решение типовых задач по образцу.

Третий уровень (Применение) - это такой уровень усвоения информации, при котором обучаемый способен самостоятельно воспроизводить и преобразовывать усвоенную информацию для обсуждения известных объектов и применения ее в нетиповых ситуациях. При этом обучаемый способен генерировать новую для него информацию об изучаемых объектах. Примеры: решение нетиповых задач, выбор подходящего алгоритма из набора ранее изученных алгоритмов для решения конкретной задачи.

Четвертый уровень (Творческая деятельность) - это такой уровень владения учебным материалом темы, при котором обучаемый способен создавать новую информацию, ранее неизвестную никому. Пример: разработка нового алгоритма решения задачи.

Уровень представления обозначается a и может меняться от 0 до 4.

Задания составляются для каждого из пяти уровней. Сначала проводится тестирование с использованием заданий по уровню 0, затем по уровню 1, 2 и т.д. Перед переходом с уровня на уровень вычисляется степень владения учебным материалом на данном уровне и определяется возможность перехода на следующий уровень.

Для измерения степени владения учебным материалом на каждом уровне используют коэффициент:

где P 1 - количество правильно выполненных существенных операций в процессе тестирования;

Р 2 - общее количество существенных операций в тесте.

Под существенными операциями понимают те операции, которые выполняются на проверяемом уровне a. Операции, принадлежащие к более низким уровням, в число существенных не входят.

Исходя из этого: 0 ? К б? 1.

Таким образом, уровень усвоения учебного материала может быть использован для оценивания качества знаний у обучаемого и выставления оценки. Рекомендуются следующие критерии для выставления оценки:

К б < 0,7 Неудовлетворительно

0,7 ? К б <0,8Удовлетворительно

0,8 ? К б <0,9Хорошо

К б? 0,9 Отлично

При К б < 0,7 следует продолжать процесс обучения на том же уровне.

Модель с учетом времени ответа на задание. В данной модели при определении результата тестирования учитывается время ответа на каждое задание. Это делается для того, чтобы учесть возможность несамостоятельного ответа на задания: обучаемый может долго искать ответ в учебнике или других источниках, но в итоге его оценка все равно будет низкой, даже если на все вопросы он ответил правильно. С другой стороны, если он не пользовался подсказками, а долго думал над ответами, это означает, что он недостаточно хорошо изучил теорию, а в результате даже при правильных ответах оценка будет снижена.

Учет времени ответа может производиться, например, по формулам.

Результат ответа на i-е задание теста:

знание тестовый задание

Если R i > 1, то R i =1.

Если R i < 0, то R i =0.

где: t отв - время ответа на задание,

t max - время, в течение которого уменьшение оценки не происходит.

t max установлено для того, чтобы обучаемый имел возможность прочитать вопрос и варианты ответов, осмыслить их и выбрать правильный, по его мнению, ответ. Параметр t max может задаваться как константа для всех заданий теста или вычисляться для каждого отдельно взятого задания в зависимости от его сложности, т.е. t 2 max =f(T i), т.к. логично предположить, что для ответа на сложное задание требуется больше времени, чем на простое задание. Другая возможная зависимость параметра t max - от индивидуальных способностей обучаемого, которые должны быть определены ранее.

Результат тестирования:

Модели с учетом времени ответа на задание также позволяют повысить надежность результатов тестирования, особенно в сочетании с моделью с учетом сложности заданий.

Модель с ограничением времени на тест. Для оценки результатов тестирования берутся только те задания, на которые успел ответить обучаемый за данное время.

В настоящее время данная модель используется достаточно широко.

В некоторых работах рекомендуется обязательно сортировать задания по возрастанию сложности и устанавливать такое время тестирования, за которое на все задания теста не сможет ответить ни один, даже самый сильный обучаемый. Такой подход предлагается применять при тестировании на бланках, когда обучаемых видит перед собой сразу все задания. Суть его в том, что когда обучаемый ответит на все задания, а время у него еще останется, он может начать проверять свои ответы, сомневаться, а в итоге может исправить правильные ответы на неправильные. Поэтому рекомендуется или ограничивать время на тест или забирать бланк сразу после ответа на все задания теста.

Адаптивная модель. Данная модель является продолжением классической модели с учетом сложности заданий.

Адаптивным называется тест, в котором сложность заданий меняется в зависимости от правильности ответов испытуемого. Если обучаемый правильно отвечает на тестовые задания, сложность последующих заданий повышается, если неправильно - понижается. Также есть возможность задания дополнительных вопросов по темам, которые обучаемый знает не очень хорошо для более тонкого выяснения уровня знаний в данных областях. Таким образом, можно сказать, что адаптивная модель напоминает преподавателя на экзамене - если обучаемый отвечает на задаваемые вопросы уверенно и правильно, преподаватель достаточно быстро ставит ему положительную оценку. Если обучаемый начинает «плавать», то преподаватель задает ему дополнительные или наводящие вопросы того же уровня сложности или по той же теме. И, наконец, если обучаемый с самого начала отвечает плохо, оценку преподаватель тоже ставит достаточно быстро, но отрицательную.

Данная модель применяется для тестирования обучаемых с помощью компьютера, т.к. на бумажном бланке невозможно заранее разместить столько вопросов и в том порядке, сколько и в котором они должны быть предъявлены обучаемому.

Тестирование обычно начинается с заданий средней сложности, но можно начинать и с легких заданий, т.е. идти по принципу повышения сложности.

Тестирование заканчивается, когда обучаемый выходит на некоторый постоянный уровень сложности, например, отвечает подряд на некоторое критическое количество вопросов одного уровня сложности.

Достоинства:

1) позволяет более гибко и точно измерять знания обучаемых;

2) позволяет измерять знания меньшим количеством заданий, чем в классической модели;

3) выявляет темы, которые обучаемый знает плохо и позволяет задать по ним ряд дополнительных вопросов.

Недостатки:

1) заранее неизвестно, сколько вопросов необходимо задать обучаемому, чтобы определить его уровень знаний. Если вопросов, заложенных в систему тестирования, оказывается недостаточно, можно прервать тестирование и оценивать результат по тому количеству вопросов, на которое ответил обучаемый;

2) возможно применение только на ЭВМ.

Надежность результатов тестирования в данном случае самая высокая, т.к. осуществляется приспособление под уровень знаний конкретного обучаемого, что обеспечивает более высокую точность измерений.

Возможный алгоритм адаптивной модели тестирования. Данный алгоритм является достаточно простым и позволяет варьировать только уровень сложности, не учитывая статистику ответов на предыдущие вопросы. На каждом шаге тестирования по каждому уровню сложности обучаемому дается два задания, и по результатам ответов на них определяется уровень сложности для следующих заданий. Данное количество заданий (два) позволяют более адекватно оценивать уровень знаний, чем одно задание, на которое обучаемый может отгадать или случайно забыть ответ, и в то же время не дает большого количества сочетаний вариантов ответов, как в случае трех и тем более большего количества заданий.

Пусть имеется m уровней сложности. Вводится коэффициент k r =100/m.

Обозначим t - текущий уровень знаний обучаемого, t н - нижний уровень знаний, t в - верхний уровень знаний. Все уровни знаний будем измерять от 0 до 100 (0 - нет знаний, 100 - абсолютное знание) .

1. Установить t = 50; t н = 0; t в = 100.

2. Вычислить текущий уровень сложности T=t/k r .

3. Выдать два задания сложности T. Пусть k пр - количество правильных ответов, k пр?.

4. Пересчет уровня знаний:

· если k пр = 2, то t н = t; t в = t в + 0.5t. Если t в > 100, то t в = 100;

· если k пр = 1, то t н = t н / 4; t в = t в + 0.1t. Если t в > 100, то t в = 100;

· если k пр = 0, то t н = t н / 2; t в = t.

5. Если |t-t 1 |<е, то уровень знаний равен t 1 , выход.

6. Перейти к шагу (2).

е устанавливается исходя из необходимой точности оценки знаний. Однако с уменьшением е возрастает число вопросов, необходимых для включения в тест.

Модель тестирования по сценарию. Данная модель также является продолжением классической модели. Данная модель реализуется в системе Дистанционного Асинхронного Обучения, разрабатываемой в Татарском Институте Содействия Бизнесу (ТИСБИ) .

Существенным недостатком классической модели является непараллельность тестов для различных обучаемых, т. к. нельзя заранее определить, какие задания по сложности и по каким темам достанутся обучаемому. Поэтому при сценарном тестировании преподаватель перед тестированием формирует сценарий тестирования, где может указывать:

· количество заданий по каждой теме, которые должны быть включено в тест;

· количество заданий каждого уровня сложности, которые должны быть включено в тест;

· количество заданий каждой формы, которые должны быть включено в тест»;

· время прохождения теста

· и другие параметры.

Сценарий может создаваться по любому объему учебного материала: разделу, предмету, специальности и т.д.

Существует четыре формы тестовых заданий:

1. Задания с выбором, которые делятся на 3 подгруппы: задания с выбором одного правильного ответа или одновариантные задания, задания с выбором нескольких правильных ответов или многовариантные задания, задания с выбором наиболее правильного ответа.

2. Открытые задания.

3. Задания на установление соответствия.

4. Задания на установление правильной последовательности.

Непосредственно при тестировании выборка заданий каждого уровня сложности, по каждой теме, каждой формы и т.д. производится случайным образом из общей базы заданий, поэтому каждый обучаемый получает свои задания. Получаемые тесты для всех обучаемых являются параллельными, т.е. имеют одинаковое число заданий и одинаковую суммарную сложность. Но в отличие от модели с возрастанием сложности, которая также обеспечивает параллельность, здесь разработчик теста решает сам, сколько и каких заданий должно быть предъявлено по каждой теме, следовательно, обеспечиваются абсолютно одинаковые условия тестирования для всех обучаемых.

По сравнению с адаптивной моделью данная модель является менее эффективной, т.к. не настраивается под индивидуальные особенности каждого обучаемого, однако имеет преимущество психологического характера: при тестировании по адаптивной модели обучаемые отвечают на разное количество вопросов и как будто бы находятся в разных условиях. В случае тестирования по сценарию все обучаемые получают одинаковое количество вопросов по каждой теме и по каждому уровню сложности.

Надежность результатов тестирования сопоставима с надежностью, получаемой при тестировании с возрастанием сложности.

Модель на нечеткой математике. Цель введения нечеткой математики - попытка математической формализации нечетких, качественных явлений и объектов с размытыми границами, встречающихся в реальном мире. Нечеткое управление оказывается особенно полезным, когда описываемые процессы являются слишком сложными для анализа с помощью общепринятых количественных методов или когда доступные источники информации интерпретируются качественно, неточно или неопределенно. Экспериментально показано, что нечеткое управление дает лучшие результаты по сравнению с получаемым при общепринятых алгоритмах управления. Нечеткая логика, на которой основано нечеткое управление, ближе по духу к человеческому мышлению и естественным языкам, чем традиционные логические системы. Нечеткая логика, в основном, обеспечивает эффективные средства отображения неопределенностей и неточностей реального мира. Наличие математических средств отражения нечеткости исходной информации позволяет построить модель, адекватную реальности .

Данная модель тестирования является развитием любой предыдущей модели, в которой вместо четких характеристик тестовых заданий и ответов используются их нечеткие аналоги. Примерами могут служить:

Сложность задания («легкое», «среднее», «выше среднего», «сложное» и т.п.);

Правильность ответа («правильно», «частично правильно», «скорее неправильно», «неправильно» и т.п.);

Время ответа («маленькое», «среднее», «большое», «очень большое» и т.п.);

Процент правильных ответов («маленький», «средний», «большой», «очень большой» и т.п.);

Итоговая оценка;

Введение нечетких характеристик может помочь преподавателям разрабатывать тесты. Например, преподаватель может достаточно быстро определить, является ли задание сложным или нет. Но сказать точно, насколько оно сложно, например, по 100-бальной шкале или точно оценить разницу сложностей двух заданий будет для него достаточно трудно. С точки зрения обучаемого нечеткая оценка его знаний в виде «хорошо», «отлично», «не очень хорошо» и т.п. более понятна ему, чем четкое количество баллов, которое он набрал в результате тестирования.

Модели могут быть комбинированными, например:

Классическая модель с учетом сложности заданий и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с ограничением времени на тест;

Модель с учетом времени ответа на задание и адаптивная модель;

Модель с учетом времени ответа на задание и модель на нечеткой математике;

Модель с разделением заданий по уровням усвоения и модель с учетом сложности заданий;

3 . Разработка тестовых заданий

3.1 Создание компьютерного тестирования

Компьютерный тест - инструмент, предназначенный для измерения обученности учащегося, состоящий из системы тестовых заданий в электронном виде, определённой процедуры проведения, обработки и анализа результатов. Компьютерный тест формируется программным способом из электронного банка тестовых заданий в соответствии со спецификацией (планом, паспортом теста).

Систематическая проверка знаний большого числа проверяемых приводит к необходимости автоматизации проведения тестирования знаний, использованию компьютерной техники и соответствующих программ проверки знаний.

Компьютерное тестирование как эффективный способ проверки знаний находит в образовании все большее применение. Одним из его достоинств является минимум временных затрат на получение надежных итогов контроля, и получение результатов практически сразу по завершении контролирующего теста. От традиционных оценок и контроля знаний - тесты отличаются объективностью измерения результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателей, а на объективные критерии.

Главные требования к системе компьютерного контроля заключаются в том, что:

Тестовые вопросы и варианты ответов на них должны быть четкими и понятными по содержанию;

Компьютерный тест должен быть простым в использовании;

Тестовых вопросов должно быть настолько много, чтобы совокупность этих вопросов охватывала весь материал, который обучающийся должен усвоить;

Вопросы должны подаваться испытуемому в случайном порядке, чтобы исключить возможность механического запоминания их последовательности;

Варианты возможных ответов должны следовать так же в случайном порядке;

Необходимо проводить учет времени, затраченного на ответы, и ограничивать это время.

Был создан тест для проверки знаний студентов физического факультета по дисциплине специализации «Допуски, посадки и технические измерения». Опрос в форме тестирования проводится в течение 15 минут и включает в себя 15 вопросов, которые последовательно предъявляются студенту в автоматизированном режиме. Во время тестирования на экране монитора располагается только одно тестовое задание.

Каждый студент имеет право пройти тест только один раз. По истечении 15 минут компьютерная программа автоматически завершает процедуру тестирования и выдает на экран монитора итоговый результат.

Во время тестирования переговоры между студентами не разрешаются. С вопросами, не касающимися содержания учебного материала, следует обращаться к преподавателю или администратору компьютерного класса, предварительно подняв руку, чтобы не отвлекать других испытуемых во время тестирования.

Наличие учебных и справочных материалов во время сеанса тестирования не допускается. Выходить из компьютерного класса во время сеанса тестирования не разрешается.

Для компьютерного тестирования была использована программа «Краб 2», в которой случайным образом из 50 вопросов выбирается 15 и предлагаются студенту. На каждый вопрос дается по 4 варианта ответа. Правильными может быть от одного до трёх ответов.

Рисунок 1 - Пример вопроса с одним правильным ответом

Рисунок 2 - Пример вопроса с несколькими правильными ответами

При тестировании допускается пропускание вопроса, возвращение к предыдущему вопросу, а также своевременное завершение теста. Результат тестирования выводится на экран при завершении теста. Указывается количество правильных, неправильных и пропущенных ответов. По завершению теста можно посмотреть все задания, на который студент дал неверный ответ.

Рисунок 3 - Результат тестирования

3.2 Тестовые задания

1. Качество изделия следует рассматривать:

a. на протяжении всего «жизненного цикла»;

b. на этапе изготовления;

c. на этапе эксплуатации;

d. нет правильного ответа

2. Термин, условно применяемый для обозначения наружных элементов деталей, включая и нецилиндрические элементы:

a. отверстие;

b. вал;

d. шарнир.

3. Размер элемента, установленный измерением:

a. наименьший предельный размер;

b. номинальный;

c. предельный размер;

d. действительный размер.

Какая схема изображена на представленном рисунке

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

4. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

5. Какая схема изображена на представленном рисунке:

a. схемы посадок в системы основного отверстия;

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

c. поля допусков с разными основными отклонениями и уровнями относительной точности;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

6. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

a. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

c. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

7. Какие калибры обеспечивают контроль по наибольшему и наименьшему придельным значениям параметров:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

8. Калибры, предназначенные для контроля деталей в процессе их изготовления:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

9. Калибры, предназначенные для контроля рабочих калибров-скоб:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

10. Допуск формы - это:

a. нормативные ограничения отклонения формы назначенными полями допусков;

b. характеристики любой реальной поверхности;

c. прямолинейность осей поверхности вращения;

d. прямолинейность цилиндра и конуса.

11. Какие виды взаимозаменяемости различают:

a. функциональная;

b. алгебраическая;

c. геометрическая;

d. полная.

12. К суммарным отклонениям формы и расположения относятся:

a. торцовое биение;

b. заданное биение;

c. радиальное биение;

d. нормальное биение.

13. Условный знак допуска плоскости выглядит:

a. ;

14. Условный знак допуска формы заданной поверхности:

c. ;

15. По каким классам точности установлены общие допуски размеров:

a. последний, средний;

b. нормальный, точный;

c. точный, средний;

d. грубый, очень грубый.

16. Какое обозначение имеет шариковый радиальный подшипник:

a. 0;

17. Какое обозначение имеет шариковый радиальный сферический подшипник:

b. 1;

18. Какое обозначение имеет роликовый радиальный с витыми роликами подшипник:

d. 5.

19. Какое обозначение имеет шариковый радиально-упорный подшипник:

c. 6;

20. Основными достоинствами резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

21. Основными недостатками резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

22. Для метрических резьб стандартизированы:

a. профиль резьбы;

b. номинальные диаметры и шаги;

c. нормы точности;

d. нет правильного ответа.

23. В зависимости, от каких характеристик функционирования различают резьбовые соединения:

a. неподвижные;

b. подвижные;

c. стандартные;

d. нестандартные.

24. Качество измерений, отражающее близость к нулю систематических погрешностей и их результат:

a. правильность измерений;

b. сходимость измерений;

d. нормальность измерений.

25. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

26. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в различных условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

27. Какой взаимозаменяемости полная взаимозаменяемость предполагает наличие:

a. полная;

b. неполная;

c. начальная;

d. конечная.

28. Предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

29. Действительный размер это:

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

30. Номинальный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

31. Наибольший предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

32. Действительное отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

33. Предельное отклонение это:

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

34. Верхнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

35. Нижнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

36. Основное отклонение это:

a. одно из двух предельных отклонений определяющее положение поля допуска относительно нулевой линии;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

37. Квалитет - это:

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

38. Допуск - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

d. отверстие, нижнее отклонение которого равно нулю.

39. Поле допуска - это:

d. отверстие, нижнее отклонение которого равно нулю.

40. Основное отверстие - это:

d. отверстие, нижнее отклонение которого равно нулю.

41. Характер соединения двух деталей, определяемый разностью их размеров до сборки:

a. допуск;

b. посадка;

42. Разность между размерами отверстия и вала до сборки, если размер отверстия больше размера вала:

a. допуск;

b. посадка;

c. зазор;

43. Разность между размерами вала и отверстия до сборки, если размер вала больше размера отверстия:

a. допуск;

b. посадка;

d. натяг.

44. Разность между наибольшим и наименьшим предельными размерами или алгебраическая разность между верхним и нижним отклонениями:

a. допуск;

b. посадка;

45. Наименьший зазор - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

46. Наибольший зазор - это:

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

47. Посадка с натягом - это:

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке.

48. Наименьший натяг - это:

c. наименьший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

49. Наибольший натяг - это:

a. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке;

b. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

c. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

Заключение

Тестирование является одним из основных видов проверки знаний, как во время вступительной комиссии в высшее учебное заведение, так и в процессе обучения. Этот метод проверки знаний позволяет давать оценку беспристрастно, системно, объективно и достаточно быстро, исключая субъективные особенности экзаменатора.

В курсовой работе были рассмотрены основные модели тестовых заданий (классический, адаптивный, с учетом времени, с учетом сложности), их достоинства и недостатки. Так же было разработано компьютерное тестирование для проверки знаний у студентов физического факультета по темам: «Допуски, посадки и технические измерения».

Тестовые задания познавательны для обучающихся, они способствуют развитию интереса к предмету и повышают качество знаний. Обучающиеся с разным уровнем подготовки чувствуют себя психологически комфортно при проведении теста. Тестовые задания способствуют развитию мышления, учат сопоставлять и сравнивать, анализировать и делать выводы, планировать дальнейшую деятельность.

На основе материала данной курсовой работы можно сказать, что использование тестов для проверки знаний студентов является надежным и перспективным методом и может широко использоваться и в дальнейшем.

Список использованных источников

знание тестовый задание

1. Социологический справочник / под ред. В.И. Воловича. - Киев, 1990. - 379 с.

2. Социологический словарь / сост.: А.Н. Елсуков, К.В. Шульга. - Мн., 1991. - 528 с.

3. Фонд времени и мероприятия в социальной сфере / под ред. В.Д. Патрушева. - М.: Наука, 1989. - 176 с.

4. Беспалько, В.П. Системно-методическое обеспечение учебно-воспитательного процесса подготовки специалистов / В.П. Беспалько, Ю.Г. Татур - М.: «Высшая школа», 1989. - 144 с.

6. Глова, В.И. Мягкие вычисления (soft computing) и их приложения / В.И. Глова, И.В. Аникин, М.А. Аджели. - Казань: 2000. - 98 с.

Подобные документы

История возникновения тестирования. Понятие теста, тестовых заданий. Классификация тестов, основные формы тестирования. Закрытые и открытые тестовые задания. Задания на соответствие и установление правильной последовательности. Анализ систем тестирования.

презентация , добавлен 07.04.2014

Особенности организации тестирования знаний. Рекомендации по использованию тестовых заданий на разных этапах обучения и в различных видах занятий, оценка их результатов. Анализ роли и места тестовых заданий по истории в проверке знаний и умений учащихся.

курсовая работа , добавлен 30.08.2010

Значение проверки знаний учащихся по биологии. Классификация тестовых заданий. Основные формы и методы проверки знаний и умений учащихся. Использование тестовых заданий для текущей и итоговой проверки. Обучение учащихся работе с тестовыми заданиями.

курсовая работа , добавлен 17.03.2010

Педагогическое тестирование в России и за рубежом. Исторические предпосылки современного тестирования в отечественном образовании. Классификация видов педагогических тестов, предтестовых заданий и требования к ним. Инновационные формы тестовых заданий.

курсовая работа , добавлен 28.10.2008

Использование электронных систем управления обучением. Формирование банка тестовых заданий всех основных форм. Матрица результатов тестовых заданий. Индекс легкости заданий для тестируемой группы. Средства анализа результатов тестовых заданий системы.

реферат , добавлен 31.03.2011

Цель проведения и методы оценочной процедуры. Составление контрольно-измерительных материалов для итоговой аттестации по технической механике. Структуризация банка заданий. Оценка результатов тестирования. Экспертиза и апробация банка тестовых заданий.

дипломная работа , добавлен 25.05.2014

Качественные экспертно-ориентированные методы оценки знаний и умений учащихся. Цель и основные задачи тестирования. Основные виды тестовых заданий. Функции теста и основные этапы его разработки. Сквозное применение педагогами метода тестирования.

курсовая работа , добавлен 27.12.2011

История проверки знаний и способностей с помощью различных заданий. Опыт централизованного абитуриентского и репетиционного тестирования в России. Тесты в американской системе образования. Характерные черты тестовых методов, используемых в Америке.

реферат , добавлен 05.02.2008

Методологические основы создания тестовых заданий, их особенности, класификация, критерии качества, экспертиза. Проверка в тестовых заданиях законов сохранения энергии, сохранения импульса и сохранения момента импульса.

дипломная работа , добавлен 29.07.2011

Теоретико-методические основы тестовых заданий и его видов. Психолого-педагогические основы. Тесты на уроках математики. Анализ опыта учителей по применению тестовых заданий. Краткая характеристика преимуществ использования тестовой формы контроля.

Теоретическая и практическая психология - наука невероятной глубины, позволяющая познать тайны человеческого сознания. Это наука никогда не останавливается и совершенствуется с каждым днем, все больше и больше углубляясь в изучение человеческой личности и ее поведения.

Тесты в психологии - это один из методов изучения человеческого разума. На сегодняшний день разновидности тестирования сложно подсчитать точно. Большое разнообразие опросников позволяет любому человеку разобраться в себе и узнать множество тайн своей личности, не обращаясь напрямую к специалисту.

Важно отметить, что существуют психологические тесты для женщин и мужчин отдельно, но мы рассмотрим общий метод тестов в психологии, не имеющий деления по гендеру. Давайте вместе разберемся с секретами нашего сознания.

Где применяется психологическое тестирование?

Психологические тесты с ответами применяются в следующих случаях:

Для установления особенностей человеческой личности.
Тесты по психологии для студентов помогают определить будущую специализацию молодого поколения.
В качестве метода, помогающего определять специфику развития ребенка.
В случае необходимости подтверждения профессиональной пригодности испытуемого.
Для подтверждения психического здоровья.

На самом деле тест в психологии - это огромная область, и применяются они в разных сферах. Но мы остановимся на первой задаче - особенности личности - и постараемся максимально точно изучить личностные особенности каждого.

Тест Айзенка

Тесты по психологии личности занимают большую область в данной науке. Первым опросником, который следует пройти для того, чтобы лучше понять себя, является тест Айзенка, или, иначе говоря, исследование темперамента человека. Существует 4 основных типа темперамента: флегматик, и меланхолик. Как проходить психологические тесты? Чтобы определить, к какому из типов вы можете отнести себя, следует дать ответы на следующие 57 вопросов. Отвечать нужно только «да» или «нет».

Нравится ли вам находиться в эпицентре активности и суеты?
Вы склонны к тому, чтобы чувствовать беспокойство от того, что вы не знаете, чего хотите?
Относитесь ли вы к людям, которые за словом в карман не полезут?
Склонны к беспричинным перепадам настроения?
Стараетесь обойти шумные вечеринки и праздники, а если и присутствуете на них, то стараетесь быть максимально далеко от центра внимания?
Вы всегда делаете то, о чем вас попросят?
Часто ли на вас нападает плохое настроение?
В ссорах ваш основной принцип - молчание?
Легко ли меняется ваше настроение?
Любите находиться в кругу людей?
Случается ли такое, что вы не можете уснуть из-за тревожных мыслей?
Вас можно считать упрямым?
Считают ли вас бесчестной личностью?
Говорят ли о вас, что вы ненаходчивый человек?
Лучшая работа - в одиночестве?
Плохое настроение - частый и беспричинный гость?
Считаете ли вы себя активным человеком в самом эпицентре жизни?
Могут ли стать причиной вашего смеха?
Бывает ли у вас такое состояние, когда что-либо надоело по самое горло?
Чувствуете себя уверенно только в привычной и удобной одежде?
Вам сложно сосредоточиться?
У вас нет проблем с выражением собственных мыслей словами?
Часто погружаетесь в личные раздумья?
Вы человек, отвергающий предрассудки?
Считаете ли себя любителем розыгрышей?
В основном ваши мысли о работе?
Важно ли для вас вкусно поесть?
Когда вы желаете выговориться, важно ли, чтобы ваш собеседник был в хорошем расположении духа?
Не любите брать в долг?
Склонны ли похвастаться?
Считаете себя чувствительным к чему-либо?
Вам предпочтительнее домашняя посиделка в одиночестве, чем шумный праздник?
Посещает ли вас сильное беспокойство?
Строите ли вы планы намного раньше необходимого?
Случаются ли головокружения?
Отвечаете на сообщения сразу же?
Ваши дела идут лучше, если вы их делаете самостоятельно, чем с группой?
Случается ли у вас одышка даже без физических нагрузок?
Считаете ли вы себя человеком, который может спокойно отойти от общепринятых правил (в рамках нормы)?
Беспокоит состояние вашей нервной системы?
Любите строить планы?
Лучше отложить на завтра то, что можно сделать и сегодня?
Боитесь замкнутых пространств?
Инициативны ли вы при первой встрече с человеком?
Случаются ли сильные головные боли?
Вы приверженец того, что многие проблемы могут решиться сами?
Страдаете бессонницей?
Склоны к лжи?
Случается ли такое, что говорите первое, что придет в голову?
Попадая в глупую ситуацию, вы часто вспоминаете ее и волнуетесь о ней?
Замкнуты ли вы?
Часто попадаете в неприятные ситуации?
Вы заядлый рассказчик историй?
Главное - не победа, а участие - это не про вас?
Вам некомфортно в обществе, где люди выше вас по социальному положению?
Когда все складывается против вас, вы продолжаете действовать?
Вас сильно охватывает волнение перед важным делом?

Теперь сверимся с ключом.

Ключ к тесту

Определять будем по нескольким факторам: экстраверсии - интроверсии, уровню нейротизма и шкале лжи. За каждое совпадение с ответом зачисляется 1 балл.

Экстраверсия - интроверсия

Ответы «да»: 1, 3, 8, 10, 13, 17, 22, 25, 27, 39, 44, 46, 49, 53, 56.

Ответы «нет»: 5, 15, 20, 29, 32, 34, 37, 41, 51.

Как вы заметили, некоторых номеров вопросов не хватает. Это не ошибка, так и должно быть. Сверимся с ключом к этому пункту. Взгляните на круг (см. рисунок ниже) - горизонтальная линия обозначает шкалу экстраверсии - интроверсии. Чем большее количество баллов по этому признаку, тем больше вы склонны к экстраверсии и наоборот. Число 12 является средним значением.

Шкала нейротизма

Шкала нейротизма на этом же круге имеет обозначение устойчивости-неустойчивости. Здесь необходимо сверить только ответы «да».

Ответы «да»: 2, 4, 7, 9, 11, 14, 16, 19, 21, 23, 26, 28, 31, 33, 35, 38, 40, 43, 45, 47, 50, 52, 55, 57.

Шкала нейротизма помогает определить устойчивость вашей нервной системы. Она расположена вертикально и работать с ней необходимо так же, как в предыдущем пункте.

Ложь

Шкала лжи не отображается на круге, но для ее определения специально выделены несколько вопросов.

Ответы «да»: 6, 24, 36.

Ответы «нет»: 12, 18, 30, 42, 48.

Стоит отметить, что, отвечая на подобные психологические тесты с ответами, вы прежде всего должны быть предельно честны сами с собой. Ключ к данной шкале максимально прост: если вы набираете более 4 баллов по этому пункту, это значит, что вы были неискренны в некоторых вопросах. Отметка 4 и ниже свидетельствует о норме в ответах.

В некоторых интерпретациях существует разделение на психологические тесты для женщин и мужчин, поскольку прекрасная половина человечества более склонна к эмоциональности, что может иметь незначительное влияние на результаты теста.

Пояснения к кругу Айзенка

Тесты по завершаются определением типа нашего темперамента. Еще раз взгляните на круг и найдите точку пересечения двух ваших предыдущих отметок. Новая (третья) точка будет расположена в четверти, символизирующей тип вашего темперамента.

Сангвинистический

Людей данного темперамента считают жизнерадостными. Они часто являются лидерами группы и ведут за собой людей, излучая активность и движение. Настроение этих людей всегда положительное, им легко заводить новые знакомства, они комфортно чувствуют себя среди нового круга людей.

Сангвиники нуждаются в постоянных переменах и новизне. Это самая настоящая потребность, поскольку если заставить сангвиника долго делать нудное дело, его жизнерадостность погаснет, человек станет вялым и неактивным. Потому такие люди легко переезжают с место на место и заводят новые знакомства.

Флегматический

Флегматики - это спокойные люди. Их сложно вывести из себя и заставить проявлять свои эмоции. Флегматики контролируют все свои действия, они редко упускают что-то из виду и обдумывают каждый свой шаг.

Повлиять на смену настроения флегматика не так просто благодаря их хладнокровности. Но людям данного темперамента нужно стараться быть более активными и не допускать чрезмерного погружения в свои мысли, что может повлечь за собой плохое настроение.

Холерический

Холерики живут вспышками. Эмоции их могут меняться по щелчку, как и подъемы, и спады активности. Такие люди берутся за любые дела, но порой не могут их завершить из-за нехватки энергии.

Холерики эмоциональны и вспыльчивы, потому могут легко разругаться с любым человеком. Таким личностям нужно больше контролировать себя.

Меланхолический

Психические процессы меланхоликов протекают крайне медленно. Вывести этих людей из состояния душевного равновесия практически невозможно. Такая личность чувствует себя неуютно в большой компании, в группе их работоспособность падает. Меланхолику комфортнее работать одному.

Такого человека пугает что-то новое. Меланхолики редко делятся своими переживаниями и держат все в себе.

На этом типу темперамента можно закончить. Ваш первый шаг в познание себя совершен. Рассмотрим интересные тесты по психологии дальше.

Тест Люшера

Психологические тесты по цветам широко используются специалистами в работе не только с детьми. Они не менее информативны для оценки взрослых личностей. Данный тест в психологии - это способ понять свое нынешнее душевное состояние. Опросник Люшера основывается на 8 цветах. Интерпретаций данного исследования существует немало, как и вариаций самого интересного теста по психологии. Но мы остановимся на кратком, но не менее точном варианте:

Приготовьте лист и ручку.
Взгляните на картинку (см. выше). Перед вами - 8 цветов. Вам необходимо выбрать наиболее предпочтительный и приятный для вас цвет на данный момент. Обратите внимание, что не нужно соотносить выбираемый вами цвет с любимым цветом в одежде, окружении, с тенденциями моды и пр. Ваш выбор должен быть максимально беспристрастным и не зависящим от ваших личных предпочтений. Вы делаете выбор только исходя из текущих желаний.
Далее вам нужно продолжить выбор по тому же принципу: вы выбираете наиболее приятный для себя цвет из оставшихся. Порядок выбора цветов записываете на бумагу.

На этом первый этап завершен. Но на этом мы не останавливаемся и переходим ко второму этапу:

Вновь воспользуемся новым листком бумаги и ручкой.
Вас может это удивить, но мы вновь повторяем ту же процедуру. Перед вами - опять 8 цветов, и вы начинаете поочередно выбирать наиболее приятный цвет. Не следует пытаться соотносить свой предыдущий и нынешний выбор - отмечайте картинки так, словно вы видите их в первый раз.

Теперь мы закончили проведение психологического тестирования. Почему же потребовалось проводить одну и ту же процедуру дважды? Ответ прост: ваш первый выбор (довольно часто для оценки личности применяется данный тест в психологии) - это то, чего вы хотите. Второй этап же отображает реальную действительность, которая может отличаться от ваших желаний. Перейдем к интерпретации.

Давайте определимся, что обозначает каждая позиция:

Первое выбранное вами значение определяет те средства, которыми вы достигаете поставленную для себя цель. Неважно, имеете ли вы какие-то конкретные намерения в данный момент, ведь мы изучаем то, что заложено в вашем подсознании сейчас.
Вторая позиция характеризует саму цель, которой мы добиваемся.
Далее мы рассматриваем пары позиций. Номера 3 и 4 характеризуют ваше ощущение от сложившейся ситуации.
5-я и 6-я позиции - отображение вашего нейтрального отношения к этим цветам. В определенных ситуациях эти позиции могут нести немалое значение, поскольку они отображают действие или потребность, которую вы сознательно откладываете на задний план до лучших времен;
7-й и 8-й номера - то, к чему испытываете резкую антипатию.

Поняв, что означает каждый номер, можно перейти к конкретным определениям.

Значение цветов

Прежде всего, все используемые цвета мы можем разделить на две группы - основную и дополнительную. В основную группу входит синий, сине-зеленый, оранжево-красный и светло-желтый. При нормальном состоянии сознания человека и его душевном спокойствии, отсутствии внутренних конфликтов эти цвета занимают первые 5 позиций.

Дополнительные оттенки - фиолетовый, черный, коричневый, серый. Эти цвета относят к негативной группе, которая отображает скрытые или явные страхи, тревожность, неудовлетворенность ситуацией.

Синий - символ спокойствия, удовлетворенности. Нахождение его на первом месте в начальном этапе нашего теста говорит о потребности человека в состоянии покоя и отсутствии напряженности. Во втором варианте, символизирующем действительность, выбор синего является наиболее благоприятным исходом. Он отображает, что в данный момент вы умиротворены душевно.

Сине-зеленый. Цвет отображает уверенность и упрямство. Позиция этого цвета говорит о том, что вы в той или иной степени нуждаетесь в уверенности в себе и в вашем окружении. Если данный цвет расположен во втором тесте на последних позициях, это говорит о слабости личности и необходимости поддержки человека.

Оранжево-красный - это цвет действий, возбуждения и иногда агрессии. В зависимости от расположения он говорит о состоянии готовности к активным действиям и борьбе с проблемами.

Светло-желтый - это цвет веселья и общительности. В дуэте с синим дает максимально удачное сочетание.

Психологические тесты по цветам помогут создать вам точную картину вашего текущего душевного состояния.

Оптимист, пессимист, реалист

Рассмотрим последний, но не менее интересный тест по общей психологии. Он позволит наконец-то определить, кто вы - жизнерадостный оптимист, опечаленный пессимист или же мудрый реалист. Необходимо отвечать на вопросы только «да» или «нет»:

Вас привлекает возможность путешествовать?
Вы любите изучать что-то новое?
Есть ли у вас проблемы со сном?
Вы гостеприимный человек?
Имеете склонность предугадывать проблемы в будущем?
Ваши друзья добились в жизни больше, чем вы?
Любите заниматься спортом?
Судьба часто преподносит вам неожиданности?
Вы беспокоитесь за текущее состояние экологии?
Научный прогресс доставил планете слишком много проблем?
Ваша профессия выбрана удачно?
Часто ли вы пользуетесь страхованием?
Вы мобильный человек? Легко ли вам переехать на другое место, если предложат дело по душе?
Вы считаете себя симпатичным?
Вас беспокоит состояние вашего организма?
Вас не смущает нахождение в незнакомом коллективе?
Любите быть в центре событий?
Существует ли дружба без взаимной выгоды?
У вас есть свои личные приметы?
Каждый строит свою судьбу сам?

Ответив на 20 достаточно простых вопросов, перейдем к ключу.

За каждое соответствие ключу ставим себе 1 балл.

Ответы «да»: 1, 2, 4, 7, 11, 13-20.

Ответы «нет»: 3, 5, 6, 8, 9, 10, 12.

0-5 баллов. Вы определенно пессимист. Причем свои невзгоды и проблемы вы явно преувеличиваете, ведь жизнь полна черных полос, но не лишена белых, однако вы видите все в черном цвете. Взгляните на жизнь по-другому - мир не так мрачен, как вам кажется.

6-10 баллов. Вы огорчены происходящим. Вокруг складывается все не так, хотя вы продолжаете бороться. Жизнь преподносит все новые сюрпризы, а друзья справляются с ними лучше вас. Да, вы пессимистично смотрите на жизнь, но у вас есть на это причины. Однако не стоит так огорчаться из-за мелких проигрышей и жизненных неурядиц - вы прекрасно справляетесь и идете в нужном направлении.

11-15 баллов. Ваш взгляд на жизнь очевиден и реален. Вы не преувеличиваете печалей, но и не пьянеете от радости побед. Вашему жизненному настрою можно позавидовать, ведь вы реалист и смотрите на жизнь уверенно. Продолжайте в том же духе и не отступайте!

16-18 баллов. Вы оптимист, в любой проблеме вы видите свои плюсы и стараетесь любую ситуацию обратить в свою пользу. Невзгоды не обходят вас стороной, но вы знаете, как правильно к ним относиться, ваша жизнь сияет красками.

19-20. Такого оптимиста, как вы, нужно поискать. Вы не видите проблем, весь мир для вас - сплошная радуга. Но может быть, стоит посмотреть на жизнь без розовых очков? Ведь иногда несерьезность приводит к печальным последствиям.

Таким образом, мы завершили тесты по психологии личности. Конечно, трех опросников недостаточно, чтобы познать глубокий мир человека, но вы уже встали на путь самопознания и немало узнали о чертах своего характера и душевном состоянии.

Но не забывайте, что тест в психологии - это не простая палочка-выручалочка, которой каждый может воспользоваться. Точную информацию сможет дать только специалист-психолог. Интересные тесты по психологии - это лишь дополнительный метод исследования личности. Они дают лишь актуальный срез исследуемого качества. А многие психологические тесты-опросники, хранящиеся на просторах Сети, вообще не отображают реальной действительности.

Tutorial

Доброго времени суток!

Хочу собрать всю самую необходимую теорию по тестирвоанию, которую спрашивают на собеседованиях у trainee, junior и немножко middle. Собственно, я собрал уже не мало. Цель сего поста в том, чтобы сообща добавить упущенное и исправить/перефразировать/добавить/сделатьЧтоТоЕщё с тем, что уже есть, чтобы стало хорошо и можно было взять всё это и повторить перед очередным собеседованием про всяк случай. Вообщем, коллеги, прошу под кат, кому почерпнуть что-то новое, кому систематизировать старое, а кому внести свою лепту.

В итоге должна получиться исчерпывающая шпаргалка, которую нужно перечитать по дороге на собеседование.

Всё ниже перечисленное не выдумано мной лично, а взято с разных источников, где мне лично формулировка и определение понравилось больше. В конце список источников.

В теме: определение тестирования, качество, верификация / валидация, цели, этапы, тест план, пункты тест плана, тест дизайн, техники тест дизайна, traceability matrix, tets case, чек-лист, дефект, error/deffect/failure, баг репорт, severity vs priority, уровни тестирования, виды / типы, подходы к интеграционному тестированию, принципы тестирования, статическое и динамическое тестирование, исследовательское / ad-hoc тестирование, требования, жизненный цикл бага, стадии разработки ПО, decision table, qa/qc/test engineer, диаграмма связей.

Поехали!

Тестирование программного обеспечения - проверка соответствия между реальным и ожидаемым поведением программы, осуществляемая на конечном наборе тестов, выбранном определенным образом. В более широком смысле, тестирование - это одна из техник контроля качества, включающая в себя активности по планированию работ (Test Management), проектированию тестов (Test Design), выполнению тестирования (Test Execution) и анализу полученных результатов (Test Analysis).

Качество программного обеспечения (Software Quality) - это совокупность характеристик программного обеспечения, относящихся к его способности удовлетворять установленные и предполагаемые потребности.

Верификация (verification) - это процесс оценки системы или её компонентов с целью определения удовлетворяют ли результаты текущего этапа разработки условиям, сформированным в начале этого этапа. Т.е. выполняются ли наши цели, сроки, задачи по разработке проекта, определенные в начале текущей фазы.
Валидация (validation) - это определение соответствия разрабатываемого ПО ожиданиям и потребностям пользователя, требованиям к системе .
Также можно встретить иную интерпритацию:
Процесс оценки соответствия продукта явным требованиям (спецификациям) и есть верификация (verification), в то же время оценка соответствия продукта ожиданиям и требованиям пользователей - есть валидация (validation). Также часто можно встретить следующее определение этих понятий:
Validation - ’is this the right specification?’.
Verification - ’is the system correct to specification?’.

Цели тестирвоания
Повысить вероятность того, что приложение, предназначенное для тестирования, будет работать правильно при любых обстоятельствах.
Повысить вероятность того, что приложение, предназначенное для тестирования, будет соответствовать всем описанным требованиям.
Предоставление актуальной информации о состоянии продукта на данный момент.

Этапы тестирования:
1. Анализ
2. Разработка стратегии тестирования
и планирование процедур контроля качества
3. Работа с требованиями
4. Создание тестовой документации
5. Тестирование прототипа
6. Основное тестирование
7. Стабилизация
8. Эксплуатация

Тест план (Test Plan) - это документ, описывающий весь объем работ по тестированию, начиная с описания объекта, стратегии, расписания, критериев начала и окончания тестирования, до необходимого в процессе работы оборудования, специальных знаний, а также оценки рисков с вариантами их разрешения.
Отвечает на вопросы:
Что надо тестировать?
Что будете тестировать?
Как будете тестировать?
Когда будете тестировать?
Критерии начала тестирования.
Критерии окончания тестирования.

Основные пункты тест плана
В стандарте IEEE 829 перечислены пункты, из которых должен (пусть - может) состоять тест-план:
a) Test plan identifier;
b) Introduction;
c) Test items;
d) Features to be tested;
e) Features not to be tested;
f) Approach;
g) Item pass/fail criteria;
h) Suspension criteria and resumption requirements;
i) Test deliverables;
j) Testing tasks;
k) Environmental needs;
l) Responsibilities;
m) StafÞng and training needs;
n) Schedule;
o) Risks and contingencies;
p) Approvals.

Тест дизайн - это этап процесса тестирования ПО, на котором проектируются и создаются тестовые случаи (тест кейсы), в соответствии с определёнными ранее критериями качества и целями тестирования.
Роли, ответственные за тест дизайн:
Тест аналитик - определяет «ЧТО тестировать?»
Тест дизайнер - определяет «КАК тестировать?»

Техники тест дизайна

Эквивалентное Разделение (Equivalence Partitioning - EP) . Как пример, у вас есть диапазон допустимых значений от 1 до 10, вы должны выбрать одно верное значение внутри интервала, скажем, 5, и одно неверное значение вне интервала - 0.

Анализ Граничных Значений (Boundary Value Analysis - BVA) . Если взять пример выше, в качестве значений для позитивного тестирования выберем минимальную и максимальную границы (1 и 10), и значения больше и меньше границ (0 и 11). Анализ Граничный значений может быть применен к полям, записям, файлам, или к любого рода сущностям имеющим ограничения.

Причина / Следствие (Cause/Effect - CE) . Это, как правило, ввод комбинаций условий (причин), для получения ответа от системы (Следствие). Например, вы проверяете возможность добавлять клиента, используя определенную экранную форму. Для этого вам необходимо будет ввести несколько полей, таких как «Имя», «Адрес», «Номер Телефона» а затем, нажать кнопку «Добавить» - эта «Причина». После нажатия кнопки «Добавить», система добавляет клиента в базу данных и показывает его номер на экране - это «Следствие».

Исчерпывающее тестирование (Exhaustive Testing - ET) - это крайний случай. В пределах этой техники вы должны проверить все возможные комбинации входных значений, и в принципе, это должно найти все проблемы. На практике применение этого метода не представляется возможным, из-за огромного количества входных значений.

Traceability matrix - Матрица соответствия требований - это двумерная таблица, содержащая соответсвие функциональных требований (functional requirements) продукта и подготовленных тестовых сценариев (test cases). В заголовках колонок таблицы расположены требования, а в заголовках строк - тестовые сценарии. На пересечении - отметка, означающая, что требование текущей колонки покрыто тестовым сценарием текущей строки.
Матрица соответсвия требований используется QA-инженерами для валидации покрытия продукта тестами. МСТ является неотъемлемой частью тест-плана.

Тестовый случай (Test Case) - это артефакт, описывающий совокупность шагов, конкретных условий и параметров, необходимых для проверки реализации тестируемой функции или её части.
Пример:
Action Expected Result Test Result
(passed/failed/blocked)
Open page «login» Login page is opened Passed

Каждый тест кейс должен иметь 3 части:
PreConditions Список действий, которые приводят систему к состоянию пригодному для проведения основной проверки. Либо список условий, выполнение которых говорит о том, что система находится в пригодном для проведения основного теста состояния.
Test Case Description Список действий, переводящих систему из одного состояния в другое, для получения результата, на основании которого можно сделать вывод о удовлетворении реализации, поставленным требованиям
PostConditions Список действий, переводящих систему в первоначальное состояние (состояние до проведения теста - initial state)
Виды Тестовых Случаев:
Тест кейсы разделяются по ожидаемому результату на позитивные и негативные:
Позитивный тест кейс использует только корректные данные и проверяет, что приложение правильно выполнило вызываемую функцию.
Негативный тест кейс оперирует как корректными так и некорректными данными (минимум 1 некорректный параметр) и ставит целью проверку исключительных ситуаций (срабатывание валидаторов), а также проверяет, что вызываемая приложением функция не выполняется при срабатывании валидатора.

Чек-лист (check list) - это документ, описывающий что должно быть протестировано. При этом чек-лист может быть абсолютно разного уровня детализации. На сколько детальным будет чек-лист зависит от требований к отчетности, уровня знания продукта сотрудниками и сложности продукта.
Как правило, чек-лист содержит только действия (шаги), без ожидаемого результата. Чек-лист менее формализован чем тестовый сценарий. Его уместно использовать тогда, когда тестовые сценарии будут избыточны. Также чек-лист ассоциируются с гибкими подходами в тестировании.

Дефект (он же баг) - это несоответствие фактического результата выполнения программы ожидаемому результату. Дефекты обнаруживаются на этапе тестирования программного обеспечения (ПО), когда тестировщик проводит сравнение полученных результатов работы программы (компонента или дизайна) с ожидаемым результатом, описанным в спецификации требований.

Error - ошибка пользователя, то есть он пытается использовать программу иным способом.
Пример - вводит буквы в поля, где требуется вводить цифры (возраст, количество товара и т.п.).
В качественной программе предусмотрены такие ситуации и выдаются сообщение об ошибке (error message), с красным крестиком которые.
Bug (defect) - ошибка программиста (или дизайнера или ещё кого, кто принимает участие в разработке), то есть когда в программе, что-то идёт не так как планировалось и программа выходит из-под контроля. Например, когда никак не контроллируется ввод пользователя, в результате неверные данные вызывают краши или иные «радости» в работе программы. Либо внутри программа построена так, что изначально не соответствует тому, что от неё ожидается.
Failure - сбой (причём не обязательно аппаратный) в работе компонента, всей программы или системы. То есть, существуют такие дефекты, которые приводят к сбоям (A defect caused the failure) и существуют такие, которые не приводят. UI-дефекты например. Но аппаратный сбой, никак не связанный с software, тоже является failure.

Баг Репорт (Bug Report) - это документ, описывающий ситуацию или последовательность действий приведшую к некорректной работе объекта тестирования, с указанием причин и ожидаемого результата.
Шапка
Короткое описание (Summary) Короткое описание проблемы, явно указывающее на причину и тип ошибочной ситуации.
Проект (Project) Название тестируемого проекта
Компонент приложения (Component) Название части или функции тестируемого продукта
Номер версии (Version) Версия на которой была найдена ошибка
Серьезность (Severity) Наиболее распространена пятиуровневая система градации серьезности дефекта:
S1 Блокирующий (Blocker)
S2 Критический (Critical)
S3 Значительный (Major)
S4 Незначительный (Minor)
S5 Тривиальный (Trivial)
Приоритет (Priority) Приоритет дефекта:
P1 Высокий (High)
P2 Средний (Medium)
P3 Низкий (Low)
Статус (Status) Статус бага. Зависит от используемой процедуры и жизненного цикла бага (bug workflow and life cycle)

Автор (Author) Создатель баг репорта
Назначен на (Assigned To) Имя сотрудника, назначенного на решение проблемы
Окружение
ОС / Сервис Пак и т.д. / Браузера + версия /… Информация об окружении, на котором был найден баг: операционная система, сервис пак, для WEB тестирования - имя и версия браузера и т.д.
…
Описание
Шаги воспроизведения (Steps to Reproduce) Шаги, по которым можно легко воспроизвести ситуацию, приведшую к ошибке.
Фактический Результат (Result) Результат, полученный после прохождения шагов к воспроизведению
Ожидаемый результат (Expected Result) Ожидаемый правильный результат
Дополнения
Прикрепленный файл (Attachment) Файл с логами, скриншот или любой другой документ, который может помочь прояснить причину ошибки или указать на способ решения проблемы.

Severity vs Priority
Серьезность (Severity) - это атрибут, характеризующий влияние дефекта на работоспособность приложения.
Приоритет (Priority) - это атрибут, указывающий на очередность выполнения задачи или устранения дефекта. Можно сказать, что это инструмент менеджера по планированию работ. Чем выше приоритет, тем быстрее нужно исправить дефект.
Severity выставляется тестировщиком
Priority - менеджером, тимлидом или заказчиком

Градация Серьезности дефекта (Severity)

S1 Блокирующая (Blocker)
Блокирующая ошибка, приводящая приложение в нерабочее состояние, в результате которого дальнейшая работа с тестируемой системой или ее ключевыми функциями становится невозможна. Решение проблемы необходимо для дальнейшего функционирования системы.

S2 Критическая (Critical)
Критическая ошибка, неправильно работающая ключевая бизнес логика, дыра в системе безопасности, проблема, приведшая к временному падению сервера или приводящая в нерабочее состояние некоторую часть системы, без возможности решения проблемы, используя другие входные точки. Решение проблемы необходимо для дальнейшей работы с ключевыми функциями тестируемой системой.

S3 Значительная (Major)
Значительная ошибка, часть основной бизнес логики работает некорректно. Ошибка не критична или есть возможность для работы с тестируемой функцией, используя другие входные точки.

S4 Незначительная (Minor)
Незначительная ошибка, не нарушающая бизнес логику тестируемой части приложения, очевидная проблема пользовательского интерфейса.

S5 Тривиальная (Trivial)
Тривиальная ошибка, не касающаяся бизнес логики приложения, плохо воспроизводимая проблема, малозаметная посредствам пользовательского интерфейса, проблема сторонних библиотек или сервисов, проблема, не оказывающая никакого влияния на общее качество продукта.

Градация Приоритета дефекта (Priority)
P1 Высокий (High)
Ошибка должна быть исправлена как можно быстрее, т.к. ее наличие является критической для проекта.
P2 Средний (Medium)
Ошибка должна быть исправлена, ее наличие не является критичной, но требует обязательного решения.
P3 Низкий (Low)
Ошибка должна быть исправлена, ее наличие не является критичной, и не требует срочного решения.

Уровни Тестирования

1. Модульное тестирование (Unit Testing)
Компонентное (модульное) тестирование проверяет функциональность и ищет дефекты в частях приложения, которые доступны и могут быть протестированы по-отдельности (модули программ, объекты, классы, функции и т.д.).

2. Интеграционное тестирование (Integration Testing)
Проверяется взаимодействие между компонентами системы после проведения компонентного тестирования.

3. Системное тестирование (System Testing)
Основной задачей системного тестирования является проверка как функциональных, так и не функциональных требований в системе в целом. При этом выявляются дефекты, такие как неверное использование ресурсов системы, непредусмотренные комбинации данных пользовательского уровня, несовместимость с окружением, непредусмотренные сценарии использования, отсутствующая или неверная функциональность, неудобство использования и т.д.

4. Операционное тестирование (Release Testing).
Даже если система удовлетворяет всем требованиям, важно убедиться в том, что она удовлетворяет нуждам пользователя и выполняет свою роль в среде своей эксплуатации, как это было определено в бизнес моделе системы. Следует учесть, что и бизнес модель может содержать ошибки. Поэтому так важно провести операционное тестирование как финальный шаг валидации. Кроме этого, тестирование в среде эксплуатации позволяет выявить и нефункциональные проблемы, такие как: конфликт с другими системами, смежными в области бизнеса или в программных и электронных окружениях; недостаточная производительность системы в среде эксплуатации и др. Очевидно, что нахождение подобных вещей на стадии внедрения - критичная и дорогостоящая проблема. Поэтому так важно проведение не только верификации, но и валидации, с самых ранних этапов разработки ПО.

5. Приемочное тестирование (Acceptance Testing)
Формальный процесс тестирования, который проверяет соответствие системы требованиям и проводится с целью:
определения удовлетворяет ли система приемочным критериям;
вынесения решения заказчиком или другим уполномоченным лицом принимается приложение или нет.

Виды / типы тестирования

Функциональные виды тестирования
Функциональное тестирование (Functional testing)
Тестирование безопасности (Security and Access Control Testing)
Тестирование взаимодействия (Interoperability Testing)

Нефункциональные виды тестирования
Все виды тестирования производительности:
o нагрузочное тестирование (Performance and Load Testing)
o стрессовое тестирование (Stress Testing)
o тестирование стабильности или надежности (Stability / Reliability Testing)
o объемное тестирование (Volume Testing)
Тестирование установки (Installation testing)
Тестирование удобства пользования (Usability Testing)
Тестирование на отказ и восстановление (Failover and Recovery Testing)
Конфигурационное тестирование (Configuration Testing)

Связанные с изменениями виды тестирования
Дымовое тестирование (Smoke Testing)
Регрессионное тестирование (Regression Testing)
Повторное тестирование (Re-testing)
Тестирование сборки (Build Verification Test)
Санитарное тестирование или проверка согласованности/исправности (Sanity Testing)

Функциональное тестирование рассматривает заранее указанное поведение и основывается на анализе спецификаций функциональности компонента или системы в целом.

Тестирование безопасности - это стратегия тестирования, используемая для проверки безопасности системы, а также для анализа рисков, связанных с обеспечением целостного подхода к защите приложения, атак хакеров, вирусов, несанкционированного доступа к конфиденциальным данным.

Тестирование взаимодействия (Interoperability Testing) - это функциональное тестирование, проверяющее способность приложения взаимодействовать с одним и более компонентами или системами и включающее в себя тестирование совместимости (compatibility testing) и интеграционное тестирование

Нагрузочное тестирование - это автоматизированное тестирование, имитирующее работу определенного количества бизнес пользователей на каком-либо общем (разделяемом ими) ресурсе.

Стрессовое тестирование (Stress Testing) позволяет проверить насколько приложение и система в целом работоспособны в условиях стресса и также оценить способность системы к регенерации, т.е. к возвращению к нормальному состоянию после прекращения воздействия стресса. Стрессом в данном контексте может быть повышение интенсивности выполнения операций до очень высоких значений или аварийное изменение конфигурации сервера. Также одной из задач при стрессовом тестировании может быть оценка деградации производительности, таким образом цели стрессового тестирования могут пересекаться с целями тестирования производительности.

Объемное тестирование (Volume Testing) . Задачей объемного тестирования является получение оценки производительности при увеличении объемов данных в базе данных приложения

Тестирование стабильности или надежности (Stability / Reliability Testing) . Задачей тестирования стабильности (надежности) является проверка работоспособности приложения при длительном (многочасовом) тестировании со средним уровнем нагрузки.

Тестирование установки направленно на проверку успешной инсталляции и настройки, а также обновления или удаления программного обеспечения.

Тестирование удобства пользования - это метод тестирования, направленный на установление степени удобства использования, обучаемости, понятности и привлекательности для пользователей разрабатываемого продукта в контексте заданных условий. Сюда также входит:
Тестирование пользовательского интерфейса (англ. UI Testing) - это вид тестирования исследования, выполняемого с целью определения, удобен ли некоторый искусственный объект (такой как веб-страница, пользовательский интерфейс или устройство) для его предполагаемого применения.
User eXperience (UX) - ощущение, испытываемое пользователем во время использования цифрового продукта, в то время как User interface - это инструмент, позволяющий осуществлять интеракцию «пользователь - веб-ресурс».

Тестирование на отказ и восстановление (Failover and Recovery Testing) проверяет тестируемый продукт с точки зрения способности противостоять и успешно восстанавливаться после возможных сбоев, возникших в связи с ошибками программного обеспечения, отказами оборудования или проблемами связи (например, отказ сети). Целью данного вида тестирования является проверка систем восстановления (или дублирующих основной функционал систем), которые, в случае возникновения сбоев, обеспечат сохранность и целостность данных тестируемого продукта.

Конфигурационное тестирование (Configuration Testing) - специальный вид тестирования, направленный на проверку работы программного обеспечения при различных конфигурациях системы (заявленных платформах, поддерживаемых драйверах, при различных конфигурациях компьютеров и т.д.)

Дымовое (Smoke) тестирование рассматривается как короткий цикл тестов, выполняемый для подтверждения того, что после сборки кода (нового или исправленного) устанавливаемое приложение, стартует и выполняет основные функции.

Регрессионное тестирование - это вид тестирования направленный на проверку изменений, сделанных в приложении или окружающей среде (починка дефекта, слияние кода, миграция на другую операционную систему, базу данных, веб сервер или сервер приложения), для подтверждения того факта, что существующая ранее функциональность работает как и прежде. Регрессионными могут быть как функциональные, так и нефункциональные тесты.

Повторное тестирование - тестирование, во время которого исполняются тестовые сценарии, выявившие ошибки во время последнего запуска, для подтверждения успешности исправления этих ошибок.
В чем разница между regression testing и re-testing?
Re-testing - проверяется исправление багов
Regression testing - проверяется то, что исправление багов не повлияло на другие модули ПО и не вызвало новых багов.

Тестирование сборки или Build Verification Test - тестирование направленное на определение соответствия, выпущенной версии, критериям качества для начала тестирования. По своим целям является аналогом Дымового Тестирования, направленного на приемку новой версии в дальнейшее тестирование или эксплуатацию. Вглубь оно может проникать дальше, в зависимости от требований к качеству выпущенной версии.

Санитарное тестирование - это узконаправленное тестирование достаточное для доказательства того, что конкретная функция работает согласно заявленным в спецификации требованиям. Является подмножеством регрессионного тестирования. Используется для определения работоспособности определенной части приложения после изменений произведенных в ней или окружающей среде. Обычно выполняется вручную.

Предугадывание ошибки (Error Guessing - EG) . Это когда тест аналитик использует свои знания системы и способность к интерпретации спецификации на предмет того, чтобы «предугадать» при каких входных условиях система может выдать ошибку. Например, спецификация говорит: «пользователь должен ввести код». Тест аналитик, будет думать: «Что, если я не введу код?», «Что, если я введу неправильный код? », и так далее. Это и есть предугадывание ошибки.

Подходы к интеграционному тестированию:

Снизу вверх (Bottom Up Integration)
Все низкоуровневые модули, процедуры или функции собираются воедино и затем тестируются. После чего собирается следующий уровень модулей для проведения интеграционного тестирования. Данный подход считается полезным, если все или практически все модули, разрабатываемого уровня, готовы. Также данный подход помогает определить по результатам тестирования уровень готовности приложения.

Сверху вниз (Top Down Integration)
Вначале тестируются все высокоуровневые модули, и постепенно один за другим добавляются низкоуровневые. Все модули более низкого уровня симулируются заглушками с аналогичной функциональностью, затем по мере готовности они заменяются реальными активными компонентами. Таким образом мы проводим тестирование сверху вниз.

Большой взрыв («Big Bang» Integration)
Все или практически все разработанные модули собираются вместе в виде законченной системы или ее основной части, и затем проводится интеграционное тестирование. Такой подход очень хорош для сохранения времени. Однако если тест кейсы и их результаты записаны не верно, то сам процесс интеграции сильно осложнится, что станет преградой для команды тестирования при достижении основной цели интеграционного тестирования.

Принципы тестирования

Принцип 1 - Тестирование демонстрирует наличие дефектов (Testing shows presence of defects)
Тестирование может показать, что дефекты присутствуют, но не может доказать, что их нет. Тестирование снижает вероятность наличия дефектов, находящихся в программном обеспечении, но, даже если дефекты не были обнаружены, это не доказывает его корректности.

Принцип 2 - Исчерпывающее тестирование недостижимо (Exhaustive testing is impossible)
Полное тестирование с использованием всех комбинаций вводов и предусловий физически невыполнимо, за исключением тривиальных случаев. Вместо исчерпывающего тестирования должны использоваться анализ рисков и расстановка приоритетов, чтобы более точно сфокусировать усилия по тестированию.

Принцип 3 - Раннее тестирование (Early testing)
Чтобы найти дефекты как можно раньше, активности по тестированию должны быть начаты как можно раньше в жизненном цикле разработки программного обеспечения или системы, и должны быть сфокусированы на определенных целях.

Принцип 4 - Скопление дефектов (Defects clustering)
Усилия тестирования должны быть сосредоточены пропорционально ожидаемой, а позже реальной плотности дефектов по модулям. Как правило, большая часть дефектов, обнаруженных при тестировании или повлекших за собой основное количество сбоев системы, содержится в небольшом количестве модулей.

Принцип 5 - Парадокс пестицида (Pesticide paradox)
Если одни и те же тесты будут прогоняться много раз, в конечном счете этот набор тестовых сценариев больше не будет находить новых дефектов. Чтобы преодолеть этот «парадокс пестицида», тестовые сценарии должны регулярно рецензироваться и корректироваться, новые тесты должны быть разносторонними, чтобы охватить все компоненты программного обеспечения, или системы, и найти как можно больше дефектов.

Принцип 6 - Тестирование зависит от контекста (Testing is concept depending)
Тестирование выполняется по-разному в зависимости от контекста. Например, программное обеспечение, в котором критически важна безопасность, тестируется иначе, чем сайт электронной коммерции.

Принцип 7 - Заблуждение об отсутствии ошибок (Absence-of-errors fallacy)
Обнаружение и исправление дефектов не помогут, если созданная система не подходит пользователю и не удовлетворяет его ожиданиям и потребностям.

Cтатическое и динамическое тестирование
Статическое тестирование отличается от динамического тем, что производится без запуска программного кода продукта. Тестирование осуществляется путем анализа программного кода (code review) или скомпилированного кода. Анализ может производиться как вручную, так и с помощью специальных инструментальных средств. Целью анализа является раннее выявление ошибок и потенциальных проблем в продукте. Также к статическому тестирвоанию относится тестирования спецификации и прочей документации.

Исследовательское / ad-hoc тестирование
Простейшее определение исследовательского тестирования - это разработка и выполнения тестов в одно и то же время. Что является противоположностью сценарного подхода (с его предопределенными процедурами тестирования, неважно ручными или автоматизированными). Исследовательские тесты, в отличие от сценарных тестов, не определены заранее и не выполняются в точном соответствии с планом.

Разница между ad hoc и exploratory testing в том, что теоретически, ad hoc может провести кто угодно, а для проведения exploratory необходимо мастерство и владение определенными техниками. Обратите внимание, что определенные техники это не только техники тестирования.

Требования - это спецификация (описание) того, что должно быть реализовано.
Требования описывают то, что необходимо реализовать, без детализации технической стороны решения. Что, а не как.

Требования к требованиям:
Корректность
Недвусмысленность
Полнота набора требований
Непротиворечивость набора требований
Проверяемость (тестопригодность)
Трассируемость
Понимаемость

Жизненный цикл бага

Стадии разработки ПО - это этапы, которые проходят команды разработчиков ПО, прежде чем программа станет доступной для широко круга пользователей. Разработка ПО начинается с первоначального этапа разработки (стадия «пре-альфа») и продолжается стадиями, на которых продукт дорабатывается и модернизируется. Финальным этапом этого процесса становится выпуск на рынок окончательной версии программного обеспечения («общедоступного релиза»).

Программный продукт проходит следующие стадии:
анализ требований к проекту;
проектирование;
реализация;
тестирование продукта;
внедрение и поддержка.

Каждой стадии разработки ПО присваивается определенный порядковый номер. Также каждый этап имеет свое собственное название, которое характеризует готовность продукта на этой стадии.

Жизненный цикл разработки ПО:
Пре-альфа
Альфа
Бета
Релиз-кандидат
Релиз
Пост-релиз

Таблица принятия решений (decision table) - великолепный инструмент для упорядочения сложных бизнес требований, которые должны быть реализованы в продукте. В таблицах решений представлен набор условий, одновременное выполнение которых должно привести к определенному действию.

QA/QC/Test Engineer

Таким образом, мы можем построить модель иерархии процессов обеспечения качества: Тестирование - часть QC. QC - часть QA.

Диаграмма связей - это инструмент управления качеством, основанный на определении логических взаимосвязей между различными данными. Применяется этот инструмент для сопоставления причин и следствий по исследуемой проблеме.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Размещено на http://www.allbest.ru/

1. Тестирование как метод психологических исследований

тестирование интеллектуальный психический личность

В переводе с английского языка «тест» - испытание, проба, проверка. В психологии, социологии, педагогике и других науках о человеке это слово употребляется в качестве термина, обозначающего систему заданий, подобранных с таким расчетом, чтобы можно было точно и обоснованно охарактеризовать конкретные особенности лиц, выполнивших эти задания. Они конструируются, выверяются, используются и интерпретируются по строгим и независящим от специфики той или иной науки правилам, призванным обеспечить качество выводов.

Рассмотрим метод исследования, предусматривающий анализ деятельности испытуемых с такими заданиями. В психодиагностике под тестированием понимают стандартизированное испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий. Подчеркивая точность вычисления результатов и максимальную изолированность их от влияния людей, организующих данную процедуру, о тестировании часто говорят как об «измерении» особенностей психики.

Следует заметить, что ключевое понятие в приведенном выше определении - стандартизированность. Что это такое?

Во-первых, это обозначение единообразия требований ко всем условиям тестирования и инструкциям по его проведению и обработке результатов. В отношении разных лиц тест применяется унифицированно, по одному и тому же стандарту. Тем самым обеспечивается определенная гарантия уравнивания ситуативных факторов, способных поставить часть испытуемых в более выгодное положение по сравнению с остальными. Без стандартизации становится невозможным сопоставление индивидуальных результатов.

Так, например, инструкции обычно предъявляются в письменном виде или (реже) зачитываются, но никак не формулируются по памяти, своими словами. После этого никому не дается персональных пояснений, индивидуальных комментариев и т. п.

Во-вторых, стандартизированностью называют перевод первичных («сырых») тестовых баллов, отражающих количество выполненных заданий, в более обобщенную шкалу, характеризующую степень индивидуальной выраженности данного психического свойства или функции.

Допустим, при выполнении теста интеллекта испытуемый успешно решил определенное количество заданий. Зная только это, мы не можем еще ничего сказать о том, каков уровень его интеллекта. В самом деле, много им сделано или мало? Хорошо прошло для него испытание или плохо? Часто ли такой показатель встречается у других? А сколько заданий следовало бы выполнить, чтобы засвидетельствовать высокий уровень интеллекта?

На все эти вопросы невозможно дать ответ, не имея единой для всех системы отсчета, некоего эталона. В качестве последнего обычно выступают итоги тестирования многочисленной и репрезентативной выборки. Сравнивая одного испытуемого с другими, делавшими ранее тот же тест, мы осуществляем стандартизацию по статистической норме. В последнее время все чаще применяется и несколько иной вид стандартизации, когда результаты испытуемого сопоставляют не с другими результатами, а с описанием требований общества к развитию данной функции или свойства, то есть с социально-психологическим нормативом. Как бы то ни было, стандартизация обеспечивает возможность перехода от сведений по выполнению конкретного теста тем или иным лицом к психологическим характеристикам, лежит в основе единообразия интерпретации.

Обратимся к истории начального этапа развития метода тестов.

Известно, что уже в глубокой древности существовали более или менее типовые процедуры выявления индивидуальных различий между людьми. Так, в Китае более четырех тысяч лет назад высшие чиновники обязаны были выдержать в присутствии императора строгий экзамен по знанию ритуалов и церемоний, стрельбе из лука, верховой езде, умению писать, считать, музицировать. В древнем Вавилоне и в Египте претендент на должность писца должен был доказать обладание соответствующими навыками, разбираться в финансах, законах, сельском хозяйстве. В библии описаны своеобразные способы отбора воинов на особо трудные и опасные задания в зависимости от их действий на привале. В античной Греции и Риме разрабатывались весьма подробные классификации характеров и закономерности их определения по поведенческим признакам...

Несмотря на то, что все это и многое другое исторически предшествовало тестированию, возникновение научных тестов следует отнести лишь к концу девятнадцатого века. Сам термин был введен создателем первых антропометрических тестов Френсисом Гальтоном (1822 -1911), занимавшимся исследованием остроты зрения и слуха, мускульной силы и т. п. Однако наибольшую популярность этот термин приобрел после выхода в свет в 1890 году статьи «Умственные тесты и измерения», написанной американским психологом, родоначальником современного тестирования Джеймсом Кеттеллом (1860-1944). В этой статье Кеттелл писал о том, что применение серии статистически обрабатываемых заданий к большому количеству индивидов как ничто другое способствует преобразованию психологии в точную науку. Им же впервые была высказана мысль о необходимости стандартизации ситуации обследования.

Кеттелл разработал несколько десятков тестов, направленных на оценку элементарных сенсомоторных процессов (чувствительности, времени реакции, количества воспроизводимых звуков после разового прослушивания и др.).

Довольно быстро возникла потребность в ориентации тестов на высшие психические функции. Качественный рывок в этом направлении связан с именем Альфреда Бине (1857-1911), составившего по поручению министерства образования Франции в 1905 году серию тестов интеллекта.

Тестирование по шкале Бине начиналось с предъявления заданий, соответствующих хронологическому возрасту ребенка (то есть тех, которые успешно решались подавляющим большинством его сверстников). Если он успешно справлялся с работой, предлагался материал, рассчитанный на более старших детей. В случае, если ребенок решал лишь часть новых заданий, испытание прекращалось. При этом к количеству лет базового умственного возраста (тому, где были все задания решены) прибавлялось несколько месяцев умственного возраста (пропорционально количеству решенных заданий для более старших). Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давался материал для более младших, пока не доходили до возраста, все задания которого успешно решались.

По А. Бине, характеристикой интеллекта являлась разность между умственным и хронологическим возрастами. Однако, как легко заметить, одна и та же разность для той или иной возрастной ступени приобретает неодинаковое значение. Такое обстоятельство весьма неудобно. Для его устранения немецкий психолог Вильям Штерн (1875-1938) предложил в 1912 году определять не разность, а соотношение (частное) умственного и хронологического возрастов, то есть делить показатели один на другой. Полученное число, умноженное на 100, он назвал величиной коэффициента интеллекта (IQ).

Заметим, что в большинстве современных тестов интеллекта принята иная процедура определения коэффициента, предложенная американским психологом и психиатром Дэвидом Векслером (1896-1981). Она основана на применении единицы стандартных отклонений, показывающей, как соотносятся результаты испытуемого с интеллектом группы его сверстников.

Тесты, созданные в начале века, были индивидуальными. Использовать их могли лишь высококвалифицированные психологи. В период первой мировой войны в Америке возникла необходимость массовых обследований призывников на предмет оптимального распределения их с учетом индивидуальных особенностей. По поручению военного ведомства Артур Отис (1888-1963) разработал первые групповые тесты - «альфа» и «бета». Одна из форм предназначалась для определения интеллекта у лиц, хорошо знающих английский язык, а другая была ориентирована на малограмотных и иностранцев. Эти тесты были значительно упрощены по процедуре применения и оценке результатов.

С 20-х гг. началось широкое распространение тестирования во всем мире. При этом, наряду с тестами общего интеллекта, стало активно развиваться и более конкретное, приближенное к потребностям повседневной диагностической практики тестирование специальных способностей и профессиональных достижений. В 30-е - 40-е гг. происходит становление психодиагностики личности, осуществляемой при помощи тестов, опросников, проективных методик.

Именно тогда на несколько десятилетий были прекращены все психодиагностические исследования в СССР. Это стало следствием постановления ЦК ВКП(б), осудившего (1934 г.) существовавшую в то время педологию - науку о целостном изучении ребенка с помощью комплекса методов психологии, анатомии, физиологии, медицины и педагогики.

В настоящее время в нашей стране, как и во всем мире, тестирование является одним из основных методов психологического исследования. Динамично развивается его инструментарий, непрерывно совершенствуются способы обработки и интерпретации информации.

Одним из наиболее важных вопросов разработки теста следует признать необходимость тщательного выявления качества измерения. На последних страницах журналов иногда печатают так называемые «популярные тесты». В отечественной школе все чаще применяются «тесты учителей». В строгом смысле слова те и другие нельзя отнести к тестам, так как показатели их надежности и валидности не установлены.

Надежность - это помехоустойчивость теста, независимость его результатов от действия случайных факторов.

Можно ли в дальнейшем применять тест, если на этапе проверки его качества испытуемые каждый раз получают оценки, значительно расходящиеся с предыдущими своими оценками? Ведь если исследуемый признак по своей природе стабилен, то результаты повторных тестирований одних и тех же лиц должны быть сходными, почти не отличающимися от полученных ранее. Надежность является характеристикой точности измерения. Она позволяет судить о том, в какой мере можно доверять данным тестирования.

Причинами недостаточной надежности тестов являются:

Разнообразие ситуационных условий испытания, меняющихся от одного случая к другому (различия в манере поведения тестирующего лица, наличие посторонних помех, непредусмотренное присутствие других людей, вариативность освещенности помещения и температуры воздуха и т. д.);

Несовершенство разработанного теста (нечеткость инструкций, принципиальная разнородность заданий, допущение элементов субъективизма при интерпретации выполнений и т. д.);

Изменения внутренних состояний испытуемых (усталость, раздражение, апатия, нервозность и др.), а также их отношений к тестированию.

Максимальное устранение названных причин способствует достижению приемлемой надежности теста.

Количественным выражением данной характеристики служат коэффициенты надежности. Каждый из них освещает какую-либо сторону, определенный аспект точности измерения. Прежде чем мы перейдем к рассмотрению типов надежности, заметим, что процедура исчисления значений коэффициентов обычно предполагает установление корреляции рангов всех членов выборки, в отношении которых тест проверяется составителями перед внедрением его в психодиагностическую практику. В связи с тем, что корреляционный анализ в дальнейшем изучается как самостоятельный метод, укажем лишь одно: величина коэффициента надежности тем больше, чем неизменнее место (ранг) испытуемых по отношению ко всем другим рангам в выборке. Иначе говоря, положение результатов каждого испытуемого в общем ряду показателей выполнения теста должно всякий раз сохраняться.

На практике применяются чаще всего следующие типы данной характеристики теста:

1. Ретестовая надежность, определяемая при повторном обследовании тестом одних и тех же лиц.

Здесь есть одна проблема: если интервал времени между тестированиями небольшой, то заметно влияние эффекта тренировки, если же временной промежуток значителен, то за этот период вполне может измениться сам исследуемый признак. Тем не менее, ретестовая надежность является важной характеристикой, она позволяет установить степень независимости результатов тестирования от воздействий проводящих его людей, а также от возможных изменений ситуаций обследования.

Считается необходимым, чтобы коэффициент такой надежности был не ниже 0,80. В противном случае точность измерения недостаточна, процедура тестирования нуждается в дополнительной стандартизации.

2. Надежность частей теста, которая характеризует степень однородности (или, как говорят, гомогенности) всех его заданий. Это свидетельство, что разработанный тест отражает актуальное состояние только одного психического феномена, а все его задания взаимно согласованы, непротиворечивы и неразнонаправленны.

Чаще всего для применения этого способа задания делятся на четные и нечетные. Результаты выполнения людьми тех и других обрабатываются отдельно, а затем сопоставляются.

Тест считается надежным, если полученный при сопоставлении коэффициент превышает 0,75. В том случае, когда данный показатель не достигает указанной величины (а это не редкость при разработке теста), составителю необходимо выявить, какие именно задания следует переделать или изъять из употребления.

3. Надежность параллельных форм устанавливается, если составителем разработано несколько взаимозаменяемых наборов заданий, то есть тех, которые по своему содержанию являются весьма сходными, но не идентичными, напоминая варианты заданий школьной контрольной работы.

Принятая процедура определения такой надежности предусматривает, что выборка делится на две равные части, затем одной из них предлагается первая форма теста, а другой - вторая. Через некоторое время производится повторное тестирования, но в обратном порядке. Коэффициент надежности устанавливается методом корреляционного анализа результатов обоих тестирований. Его величина не должна быть менее 0,75. В противном случае становится необходимой проверка степени стандартизированности испытания и изменение содержания тех заданий, которые оказались несоответствующими своим аналогам из параллельной формы.

Итак, надежность теста характеризует степень точности измерения, не сообщая о том, что же именно измеряется. Она является предпосылкой наличия другого важного качества - валидности.

Валидность (от англ. «действительный», «пригодный», «имеющий силу») - комплексная характеристика теста, указывающая на обоснованность и эффективность его применения.

В классической тестологии выделяется множество типов валидности. Проанализируем наиболее распространенные из них.

Такая валидность имеет особое значение в критериально-ориентированных тестах (КОРТ) и тестах достижений, о которых речь пойдет ниже.

2. Конструктная валидность отражает степень соотнесения результатов теста с базовыми для него теоретическими понятиями (конструктами). Определяется, когда предмет измерения существует в неявном, комплексном виде, требует специального анализа.

Например, если тест разрабатывается для установления степени понимания речи, то необходимо, как минимум, представлять, какие компоненты образуют этот конструкт. Выберите из предложенного здесь перечня только те пункты, которые относятся к «пониманию речи»:

Ребенок может ответить на вопросы;

Он очень внимателен при слушании;

Он может пересказать услышанное своими словами;

Он может дословно запомнить текст с первого раза;

Он может составить план текста;

Он задает экспериментатору много вопросов по услышанному...

Очевидно, что только часть из них имеет отношение к рассматриваемому конструкту. Осуществив анализ проблемы, мы можем в дальнейшем составить задания, отражающие разные аспекты понимания речи.

После этого формулируется ряд гипотез о том, каким образом данные разрабатываемого теста будут коррелировать с широким кругом других тестов, направленных как на близкие конструкты, так и на отдаленные. Гипотезы проверяются методами корреляционного и факторного анализа. Подтверждение или опровержение совокупности теоретически ожидаемых связей становится характеристикой конструктной валидности теста.

3. Критериальная валидность показывает, как результаты тестирования соотносятся с теми оценками измеряемого качества или свойства, которые получены другими (нетестовыми) способами, а именно: с мнениями специалистов, данными наблюдений и экспериментов, анализом продуктов деятельности испытуемых и т. д. Она может быть двух типов:

Валидностью текущей, когда результаты теста сопоставляются с данными из других источников, собираемых одновременно с тестированием;

Валидностью прогностической (предсказывающей), когда результаты теста сопоставляются с более поздним поведением испытуемого в данной сфере. К примеру, итоги тестирования учебных достижений в выпускном классе могут быть подтверждены, а могут быть и опровергнуты фактами о поступлении членов выборки в высшие учебные заведения.

Иногда применительно к некоторым из описанных типов валидности употребляют обозначение «эмпирическая валидность». Так называют те из них, при определении степени выраженности которых использовались статистические способы анализа данных, то есть коэффициенты вычислялись путем корреляций.

Каким образом соотносятся между собой характеристики эмпирической валидности и надежности?

Если высокая надежность теста свидетельствует, что он точно измеряет нечто, то высокая валидность указывает, что тест измеряет именно то, для чего он был разработан. Поэтому коэффициенты валидности не могут превышать значений коэффициентов надежности.

Обе рассмотренные характеристики непременно определяются составителями в ходе подготовки теста. Психолог, использующий тест в своей работе, благодаря этому получает представление о качестве измерения. Следует сказать и о том, что повторную проверку на надежность и валидность обычно проходят тесты, заимствованные, переведенные на другой язык. Без этого невозможно судить о качестве их социокультурной адаптации к новым условиям использования.

Бывает так, что тест обладает адекватной валидностью и надежностью, но тем не менее, почти не находит применения в исследовательской практике. Это может быть обусловлено излишней сложностью процедуры интерпретации, чрезмерно высокими требованиями к квалификации тестирующего, значительной трудоемкостью и длительностью применения и т. д. Необходимо считать существенной еще одну характеристику психологического измерения - его экономичность.

Под экономичностью понимают целесообразность применения теста, определяемую наличием допустимого соотношения затрат на тестирование (времени, труда, финансов) и пользы от него.

Сказанное, разумеется, не означает, что тестирование непременно должно быть легким, коротким и «дешевым», пусть даже в ущерб другим качествам измерения. Речь идет именно о допустимом соотношении надежности, валидности и экономичности.

Перейдем к изучению основных видов тестов. Для этого воспользуемся одной из наиболее распространенных классификаций. В зависимости от особенностей интерпретации выполнения тесты подразделяются на два вида:

Ориентированные на статистическую норму;

Критериально-ориентированные (КОРТ).

Первые из них предполагают использование традиционного приема математической статистики - «нормирования» результатов. Что это такое?

Процедура разработки такого теста обязательно предусматривает установление норм его выполнения путем предварительного тестирования репрезентативной выборки лиц, для которых он предназначен. При этом выявляется диапазон тестовых баллов, характерный для низкого уровня развития данного психического свойства или функции, среднего уровня и высокого. В дальнейшем результаты испытуемого сравнивают с данными, полученными при тестировании выборки, определяя тем самым относительное его место в общем ряду.

Следует заметить, что задания ориентированного на статистическую норму теста подбираются таким образом, чтобы итоги их выполнения выборкой приближались к кривой нормального распределения Гаусса.

Описание подобного распределения результатов может быть сделано с помощью двух показателей: среднего арифметического (х) и стандартного отклонения (у). Оба они получается путем несложных расчетов:

формула среднего арифметического и стандартного отклонения

Где n - число членов выборки, ?N - сумма полученных ими результатов, ?d - сумма значений всех индивидуальных отклонений от среднего арифметического.

Нормальным считается такое распределение результатов, при котором в пределах одного стандартного отклонения (х ± у) находится 68 % испытуемых (то есть 34 % меньше среднего, 34 % больше среднего). Тогда в пределах двух стандартных отклонений останется 94,45 % испытуемых, а в пределах трех стандартных отклонений - почти все из них (99,73 %). Зачем это все необходимо?

Тем самым и достигается возможность классифицировать испытуемых по отношению ко всей популяции, то есть судить о том, что они входят в группу людей с показателями выше или ниже нормы.

Для удобства работы осуществляют преобразование «сырых» баллов в стандартные единицы (стандартизацию). Сохраняя относительные позиции испытуемых, изменяют среднее арифметическое и стандартное отклонение путем добавления некоей константы к каждой отдельной величине. В психологии широко используется несколько таких шкал стандартных норм. Например, шкала Т-величин имеет среднее арифметическое 50 и стандартное отклонение 10, а, скажем, шкала коэффициента интеллекта имеет среднее равным 100, со стандартным отклонением 15 и т.д.

Интерпретируются эти показатели следующим образом: все результаты, которые не выходят за границы (х ± у), находятся в пределах нормы. Те же лица, кто по тесту интеллекта получил значение IQ менее 85, находятся ниже нормы, а те, чьи результаты более 115 - выше нормы, далее, результаты от 115 до 130 интерпретируются как «несколько выше нормы», а от 130 до 145 - «значительно выше нормы». Соответственно классифицируются и результаты, располагающиеся ниже нормы.

Критериально-ориентированные тесты не предполагают подобного сопоставления данных испытуемых с итогами предварительного тестирования выборки. За точку отсчета в них принято не нормальное распределение, а определенный объем требований общества к психическому и личностному развитие его членов. Этот весьма обобщенный по своей природе феномен выражается в разрабатываемой составителями совокупности конкретных критериев.

В формулировке каждого такого критерия выделяется две части:

Соотносительно-предметная, детально описывающая тот или иной фрагмент области содержания знания на материале которого составлены тестовые задания. Обычно эта часть получает конкретизацию в ходе анализа составителями учебных программ, образовательных стандартов, действующих учебно-методических пособий и указаний.

Другими словами, одна часть критерия определяет, как надо сделать работу (каким образом), а другая - что надо сделать из предназначенного для усвоения (какой материал).

Разумеется, не каждая область знания поддается последовательной формализации для выражения в виде совокупности критериев. КОРТы, как правило, разрабатываются для диагностики сформированности умственных действий, а также для контроля за состоянием знаний, умений и навыков обучаемых. В этих случаях их применение позволяет, по словам А. Анастази, осуществлять интерпретацию с упором на то «что индивид может делать и что он делает, а не на то, как он выглядит на фоне других».

Заметно большее распространение в настоящее время имеют тесты, интерпретация выполнения которых ориентирована на статистическую норму.

В зависимости от предмета измерения выделяют тесты:

Интеллекта, обеспечивающие изучение уровня развития мышления и познавательных процессов в целом;

Способностей, оценивающие обучаемость, возможность и легкость овладения определенными знаниями, умениями и навыками. Сюда относят тесты общих и специальных способностей;

Достижений, определяющие обученность, то есть уровень овладения знаниями, умениями и навыками в какой-либо области (учебной, профессиональной, спортивной);

Личности, направленные на изучению различных аспектов личностного развития, таких как интересы, мотивы, эмоции, отношения и др.;

Межличностные, предусматривающие оценку человеческих отношений в группе, выявление специфики коммуникативных процессов.

По характеру тестовых заданий различают следующие виды тестов:

Вербальные, материал которых представлен в словесной форме;

Образные, где работа испытуемых производится с рисунками, схемами на основе возникающих при этом наглядных представлений;

Практические, выполняемые при манипулировании реальными объектами или их заместителями;

Комбинированные, объединяющие в себе как вербальный, так и невербальный материал заданий.

По форме предъявления заданий тесты подразделяются на бланковые («бумаги и карандаша»), аппаратурные, рисуночные и устные.

В зависимости от количества испытуемых тесты делятся на индивидуальные и групповые.

По времени выполнения тесты бывают двух видов:

Скорости, в которых основным показателем работы испытуемых является темп решения заданий. Оценивается либо общее количество правильно выполненных заданий за отведенное время, либо объем времени, затраченного на выполнение теста;

Результативности, где показатель скорости работы испытуемых не имеет соотнесения с результатами тестирования, не влияет на них. Временное ограничение (если оно есть) не является жестким, оно служит лишь целям обеспечения стандартизации процедуры измерения.

Следует заметить, что в психодиагностической практике наряду с тестами находят активное применение личностные опросники. Это методики, задания которых представлены в виде вопросов или утверждений. Задача испытуемого - дать письменные или устные ответы, сообщить информацию о себе, выразить отношение, сформулировать мнения.

По своей сути, опросники предполагают осуществление испытуемым субъективного самоотчета. От анкет, которые будут детально рассмотрены нами в дальнейшем, личностные опросники отличаются следующим:

2) стандартизацией процедур применения и интерпретации;

3) опорой на содержание определенной научной концепции, теории;

4) наличием норм выполнения или соответствующих критериев развития, по отношению к которым осуществляется стандартизация индивидуальных результатов.

5) проверкой степени валидности и надежности.

Все это, а также нередко более искусная постановка вопросов, маскирующая их диагностическую специфику, и тщательная разработка контроля за достоверностью и искренностью ответов («шкалы лжи»), позволяют считать их «тестами-опросниками», а не методиками самонаблюдения или традиционного опроса.

Примерами таких тестов-опросников являются Миннесотский многоаспектной личностный перечень (ММРI), разработанный С. Хатуэем и Дж. Маккинли в 1940 году и до сих пор широко использующийся в клинической психодиагностике, Патохарактерологический диагностический опросник (ПДО), предложенный А. Е. Личко (1970) для определения психопатического развития личности и акцентуаций характера, методика многофакторного исследования личности Р. Кеттелла (16-ти факторный опросник) и т. д.

В заключение, необходимо отметить следующее: использование метода тестов для исследований требует наличия как общепсихологических знаний, так и компетентности в области теории и практики измерения. Дело в том, что изучение сложных психических феноменов не сводится к чисто «технической» деятельности по предъявлению заданий и регистрации решений. Недостаток квалификации нередко оборачивается потерей индивидуального подхода, грубейшими дефектами интерпретации результатов, увеличением числа ошибок при организации процедуры испытания.

Размещено на Allbest.ru

...

Подобные документы

Понятие и виды эксперимента, его организация. Этические проблемы при его проведении. Использование теста для объективной оценки индивидуально-психологических различий. Сущность исследований человека в социальном контексте посредством качественных методов.

реферат , добавлен 16.02.2011

Диагностирование развития и функционирования когнитивных психических процессов и состояний, индивидуальных нейрофизиологических особенностей. Изучение эмоционально-волевой и мотивационной сферы. Анализ индивидуально-психологических особенностей.

курсовая работа , добавлен 24.06.2011

Понятие о генетической психофизиологии. Роль генетических и средовых факторов в формировании физиологических систем организма и индивидуально-психологических различий личности. Место психофизиологических исследований в системе психогенетических знаний.

реферат , добавлен 09.12.2014

Взаимосвязь профессионализма и индивидуальных психологических особенностей личности. Актуальность диагностики профессиональной пригодности людей, ее взаимосвязь с дальнейшим становлением профессионализма. Понятие личность в психологии, свойства личности.

курсовая работа , добавлен 14.08.2010

Группы методов психологических исследований, их классификация. Сущность и основные задачи анкетирования, наблюдения, беседы. Особенности проведения естественного, лабораторного и моделирующего эксперимента. Анализ методов психологических исследований.

курсовая работа , добавлен 05.03.2012

Актуальность диагностики профпригодности людей, ее взаимосвязь с дальнейшим становлением профессионализма. Влияние психологических факторов на эффективность обучения. Различные подходы к пониманию структуры личности. Условия развития способностей.

контрольная работа , добавлен 15.01.2016

Психодиагностика как метод психологического исследования. Психологическое тестирование и опрос. Характерологический опросник Леонгарда. Уровень субъективного контроля Дж. Роттера, опросник Р. Кеттела. Индивидуально-типологический опросник Л.Н. Собчик.

курсовая работа , добавлен 22.01.2012

Связь методологии и методов в социально-психологическом исследовании. Характеристика избирательного внимания к различным методам в современных социально-психологических исследованиях. Метод наблюдения, тестирование, методика опроса и эксперимент.

курсовая работа , добавлен 06.01.2015

Типы и формы зависимого поведения. Психологические риски формирования зависимостей в юношеском возрасте. Представление и анализ индивидуально-психологических особенностей личности юношей и девушек. Задачи многофакторного личностного опросника Р. Кеттела.

дипломная работа , добавлен 09.10.2013

Изучение индивидуально-психологических особенностей подростков. Исследование воздействия биологических ритмов на физическую работоспособность школьников. Методики определения хронотипа, анаэробной производительности и уровня тревожности индивида.

ных затратах, чем свободный опрос. 3. Тесты являются специализированными методами психодиагностического обследования, применяя которые можно получить точную количественную или качественную характеристику изучаемого явления. От других методов исследования тесты отличаются тем, что предполагают четкую процедуру сбора и обработки первичных данных, а также своеобразие их последующей интерпретации. С помощью тестов можно изучать и сравнивать между собой психологию разных людей, давать дифференцированные и сопоставимые оценки. Варианты теста: тест – опросник и тест-задание. Тест-опросник основан на системе заранее продуманных, тщательно отобранных и проверенных с точки зрения их валидности и надежности вопросов, по ответам на которые можно судить о психологических качествах испытуемых. Тест-задание предполагает оценку психологии и поведения человека на базе того, что он делает. В тестах этого типа испытуемому предлагается серия специальных заданий, по итогам выполнения которых судят о наличии или отсутствии и степени развития у него изучаемого качества. Тест-опросник и тест-задание применимы к людям разного возраста, принадлежащим к различным культурам, имеющим разный уровень образования, разные профессии и неодинаковый жизненный опыт. Это - их положительная сторона. А недостаток состоит в том, что при использовании тестов испытуемый по желанию может сознательно повлиять на получаемые результаты, особенно если он заранее знает, как устроен тест и каким образом по его результатам будут оценивать его психологию и поведение. Кроме того, тест-опросник и тест-задание неприменимы в тех случаях, когда изучению подлежат психологические свойства и характеристики, в существовании которых испытуемый не может быть полностью уверен, не осознает или сознательно не хочет признавать их наличие у себя. Такими характеристиками являются, например, многие отрицательные личностные качества и мотивы поведения. В этих случаях обычно применяется третий тип тестов - проективные. В основе таких тестов лежит механизм проекции, согласно которому неосознаваемые собственные качества, особенно недостатки, человек склонен приписывать другим людям. Проективные тесты предназначены для изучения психологических и поведенческих особенностей людей, вызывающих негативное отношение. Применяя тесты подобного рода, о психологии испытуемого судят на основании того, как он воспринимает и оценивает ситуации, психологию и поведение людей, какие личностные свойства, мотивы положительного или отрицательного характера он им приписывает. Пользуясь проективным тестом, психолог с его помощью вводит испытуемого в воображаемую, сюжетно неопределенную ситуацию, подлежащую произвольной интерпретации. Такой ситуацией может стать, например, поиск определенного смысла в картинке, где изображены неизвестно какие люди, непонятно, чем занятые. Нужно ответить на вопросы, кто эти люди, чем они озабочены, а чем думают и что произойдет дальше. На основании содержательной интерпретации ответов судят о собственной психологии отвечающих. Тесты проективного типа предъявляют повышенные требования к уровню образованности и интеллектуальной зрелости испытуемых, и в этом состоит основное практическое ограничение их применимости. Кроме того, такие тесты требуют большой специальной подготовки и высокой профессиональной квалификации со стороны самого психолога. Сегодня тесты - это наиболее широко используемый метод психологического исследования. Все же необходимо отметить тот факт, что тесты занимают проме- жуточное положение между субъективными и объективными методиками. Это обусловлено большим разнообразием тестовых методик. Существуют тесты, ос- нованные на самоотчете испытуемых, например тесты-опросники. При выполнении данных тестов испытуемый может сознательно или неосознанно повлиять на результат тестирования, особенно если он знает, как будут интерпретироваться его ответы. Но существуют и более объективные тесты. К их числу прежде всего необходимо отнести проективные тесты. Данная категория тестов не использует самоотчеты испытуемых. Они предполагают свободную интерпретацию исследователем выполняемых испытуемым заданий. Например, по наиболее предпочтительному для испытуемого выбору цветовых карточек психолог определяет его эмоциональное состояние. В других случаях испытуемому предъявляют картинки с изображением неопределенной ситуации, после чего психолог предлагает описать события, отраженные на картинке, и на основе анализа интерпретации испытуемым изображенной ситуации делается вывод об особенностях его психики. Однако тесты проективного типа предъявляют повышенные требования к уровню профессиональной подготовки и опыту практической работы психолога, а также требуют наличия достаточно высокого уровня интеллектуального развития у испытуемого.

Разделы