- Описание
- Отправленные решения
559. Медаль за сжатие
Даны объектов, у которых есть признаков. Количество признаков достаточно большое, что приводит к проблемам в обучении моделей. Возможно, какие-то из этих признаков являются бесполезными - соответственно, их можно отбросить или преобразовать в другие признаки. Необходимо уменьшить количество используемых признаков не менее чем на , потеряв при этом не более точности (accuracy).
Формат ввода
В первой строке входных данных заданы три числа , и , где - количество объектов, - количество признаков у каждого объекта, а - допустимая потеря точности. На следующих строках задается таблица с объектами, содержащая столбец. В первых столбцах перечисляются признаки объектов, являющиеся числами с плавающей точкой, а в столбце задается метка класса в виде целого числа для каждого из объектов.
Ссылка на файл с тестовыми входными данными: https://disk.yandex.ru/d/XOQvEmlgf2VbsQ
Формат вывода
В качестве ответа на задачу необходимо отправить код.
На первой строке ваша программа должна вывести - количество признаков после сжатия объектов. На следующих строках должны быть перечислены сжатые признаки объектов, поданных на вход вашей программе. Количество признаков в результате должно удовлетворять неравенству
Для оценки точности будет использоваться усредненная точность линейной регрессии, обученной на кросс-валидации на закрытой выборке. В результате точность не должна упасть больше чем на в сравнении с точностью модели, полученной с такими же параметрами обучения на неизменённых признаках на кросс-валидации.
Ограничения
Ограничение времени
1 с
Ограничение памяти
64 МБ