Напишите нам сообщение. Мы ответим вам в ближайшее время!


Стоимость:

ROC-анализ, бинарная классификация - до 10 показателей - 8 000

Здесь вы можете заказать услугу roc-анализа или бинарной классификации и узнать стоимость roc-анализа. Заказать помощь в статистических расчетах.

Когда требуется услуга roc-анализа

Этот анализ необходим тогда, когда имеется некий способ классификации данных по двум противоположным категориям и нужно проверить его эффективность и точность. То есть выяснить, насколько часто этот метод дает ошибки и определяет данные в неправильную категорию.

Если в основе классификации лежит определенный численный показатель, метод поможет определить, какое его значение является оптимальным для проведения наиболее точной классификации (так называемая точка отсечения), при каких значениях показателя мы можем определить данные в одну группу, при каких в другую, а при каких значениях классификация не может быть выполнена точно и данные нуждаются в дополнительном исследовании (так называемая серая зона).

Такой метод очень часто используется при классификации пациентов по показателям их анализов в категории здоров/болен или аналогичные. Или, например, классификация заемщиков по признаку возврата или невозврата кредита.

При этом выделяют два типа ошибок: определение здорового пациента в категорию больных и наоборот, так как с практической точки зрения, они дают совершенно разные результаты: например, больного пациента не лечат, и он может умереть, а здоровому делают ненужную операцию, что также ему навредит.

Основная цель анализа – определить ту точку разделения данных, которая будет давать наибольшую эффективность модели (cut off), а также понять, какова точность такого разделения, каков процент ошибок каждого типа, насколько показатель вообще пригоден для проведения такой классификации.

В результате roc-анализа вы получаете следующую информацию

  • чувствительность и специфичность модели (то есть доля ошибок первого и второго типов),
  • точность модели,
  • оптимальную точку разделения данных,
  • серую зону (при наличии),
  • вывод о применимости показателя для классификации,
  • применимость показателя для бинарной классификации и AUC (площадь под кривой).

Если групп классификации более двух, метод также может быть применим для попарной классификации данных по группам, а затем для выявления точек разделения всех групп на основе полученных результатов. Также для этой задачи хорошо подходит кластерный анализ, а также регрессионный анализ нечисловых данных.

Нередко для наших клиентов мы строим несколько моделей классификации, так как каждая из них имеет определенную точность и в совокупности они дают более достоверный результат. У нас имеются патенты на полученные модели и зарегистрированные программы ЭВМ, их реализующие. Мы можем вам предложить также получить патент на заказанную модель, чтобы ее никто не опубликовал и не использовал ранее вас, и зарегистрировать программу ЭВМ, ее реализующую.