Требования к тестам
Тесты должны удовлетворять определенным требованиям, так как случайно подобранный набор заданий нельзя назвать тестом.
Надежность контрольного задания - это его способность с достаточной для практики одинаковостью характеризовать, исследуемый в дидактических экспериментах, показатель, как заданий в целом, так и его частями, или по другому, тот же показатель одним и тем же заданиям, но в разные моменты времени.
Для пояснения понятия надежности контрольного задания обратимся к таблице умножения, убрав в ней правые части всех равенств и рассматривая оставшиеся выражения, как перечень контрольных заданий. Если группе испытуемых выдать некоторое число этих заданий и оценить их знания дважды: по ответам на задания из четных строк, то очевидно, у каждого из испытуемых получается приблизительно одни и те же оценки.
Также очевидно, что одинаковые оценки у каждого из испытуемых получатся и в том случае, если контроль знания таблицы умножения будет проведен по некоторой совокупности заданий дважды, но в разные моменты времени. )например, через два дня). Приблизительное совпадение рядов оценок в обоих случаях как раз и говорит о надежности комплекта рассматриваемых контрольных заданий, то есть таблицы умножения.
Валидность (или адекватность целям проверки)
а) содержательная валидность теста, т.е. задание теста построено на основе только технических учебных элементах, которые изучались студентами и на той степени абстракции, на которой они излагались. По содержанию тест соответствует образовательному стандарту.
б) функциональная валидность теста, т.е. задания теста соответствуют выявленному уровню усвоения –уровню заданному образовательным стандартом. При составлении задания выделяются существенные и несущественные признаки элементов знаний. Существенные признаки закладываются в эталонный ответ. В другие ответы закладываются несущественные признаки с учетом характерных ошибок. Если учащиеся при работе с заданием знают и выделяют существенные признаки, а не формальные, то задание отвечает критерию валидности. Другими словами валидностью контрольного задания называется степенью соответствия своему назначению.
К критериям валидности относятся ответы на вопросы типа: "Соответствует ли задание программы курса или его раздела?"; "Охватывает ли задание достаточно полно весь курс или его раздел?"; "Достаточна ли вероятность того, что если испытуемый успешно справился рассматриваемым контрольным заданием, то он наверняка знает соответствующий материал в целом?"
Другими словами, показатель валидности отвечает на вопрос: "а то ли, что сформулировано в назначении контрольного задания, измеряется с его помощью?"
Очевидно задание может быть надежным , но невалидным. Также очевидно, что имеется прямая связь между надежным и валидным : задание с низкой надежностью не может быть валидным.
Например, если с целью проверки знания таблицы умножения, воспользоваться заданиями, составленными из произведений только одинаковых цифр (2*2, 3*3 ….) , то оно, конечно, будет достаточно надежным: при проведении с ним серии экспериментов, описанных выше, будут получаться одинаковые оценки у большинства испытуемых. Но, очевидно, зарегистрированные при этом успехи не говорят о знании всей таблицы умножения. Следовательно, если целью контроля является проверка знаний всей таблицы умножения, то валидность задания, составленного из произведений только одинаковых цифр, явно недостаточна.
С использованием понятий надежности и валидности контрольных задания можно дать следующие определение:
Дидактическим тестом называется совокупность задания, которые составлены в собирательной форме, предназначены для сравнительной оценки знаний, умений, навыков, способностей, умственного развития и удовлетворяют заданным требованиям надежности и валидности.