Виды валидации - Лена Капаца
Виды валидации by Лена Капаца May 2, 2023 Основы

Кросс-валидация (Cross-Validation – CV) – это метод оценки Моделей (Model) Машинного обучения (ML) в условиях небольшого объема данных. Датасет (Dataset) разделяют на N равных частей разными способами, затем обучают на первой и вычисляют эффективность с помощью второй части. Затем дообучают на второй и снова обсчитывают эффективность на третьей.

Такая перекрестная проверка используется для обнаружения Переобучения (Overfitting), т.е. неспособности распознать паттерн. Выделяют следующие виды кросс-валидации:

Отдельным видом выделяют:

Итоговая эффективность – это среднее всех итераций.

Автор изображений: Vladimir Lyashenko

Подари чашку кофе дата-сайентисту ↑

© Лена Капаца. Все права защищены.