Рассмотрим график.
На графике: синяя и желтая кривые - из статьи Олега Хрулева "Признаки Рейнина с точки зрения математики". Голубая кривая - модель самообучающейся системы распознавания ТИМ, которая в качестве критерия завершения распознавания ТИМ использует состояние, когда все 15 признаков Рейнина самосогласованы. Уравнение такой системы:
y=P(x)/(P(x)+Q(x)),
где P(x) = x15 - вероятность того, что все 15 признаков распознаны верно.
Q(x) = 15*x7*(1-x)8 - вероятность того, что 7 признаков из 15 распознаны верно, а 8 признаков из 15 распознаны неверно.
Сиреневая прямая y = (1/2+15*|x-1/2|)/8 - описывает функцию самообучения системы и соответствует допущению о том, что при формировании наполнения эталонных образов признаков Рейнина по накопленной эмпирической базе зашумленность этих образов прямо пропорциональна зашумленности опорной базы.
Темная заливка обозначает "мертвую зону" — интервал точностей [3% — 53%], внутри которого распознающая система Хрулева, использующая признаки Рейнина как самовосстанавливающийся код, будет самообучаться со все возрастающей потерей точности.
Вопрос о мертвой зоне актуален, так как согласно нашим оценкам (см. таблицу на ru.laser.ru), в этой зоне точности находится подавляющее большинство экспертов. Тенденция падения частоты сходимости социоников, которую мы наблюдаем последние 10 лет, объясняется именно практикой применения ими недостаточно строгих критериев завершения распознавания.
Иточник — сообщение Руслана Степанова от 21.02.05 на форуме socionics.org. Возражения оппонетов вызвало тогда отсутствие внятного обоснования применения линейной аппроксимации. Действительно, на первый взгляд логичнее было бы использовать кривую y = x4. Однако эта кривая описывает идеальный случай, когда ошибки по каждому из 4-х бинарных признаков, составляющих базис, равновероятны, а направления осей бинарных признаков в пространстве наблюдаемых черт объекта определены однозначно. Если же основной вес ошибки приходится на один из бинарных признаков, зависимость вырождается в линейную (y = x), график которой проходит значительно выше y = (1/2+15*|x-1/2|)/8. На практике решающее значение имеет другой фактор — неопределенность направлений бинарных признаков. В результате система координат, сотоящая из бинарных признаков, как бы вращается в пространстве наблюдаемых черт объекта, когда одна и та же черта приписывается то одному признаку, то другому. Мало того, если система координат не снабжена упругими внутренними связями, ее направления легко теряют ортогональность. Иногда она "схлопывается" таким образом, что подавляющее большинство наблюдаемых черт приписывается одному единственному бинарному признаку, например экстраверсии-интроверсии. Этому способствует и стремление человеческого мышления привести все наблюдаемые черты к единой дихотомии. Так, например, в литературе по типоведению можно встретить большинство черт вторичных признаков Рейнина, но эти черты почему-то приписаны свойствам Юнговских дихотомий. С учетом вышесказанного, в качестве грубого описания процесса самообучения была выбрана простейшая функция, график которой лежит выше y = x4, но ниже y = x, причем y(1) = 1 (полная определенность), а y(1/2) = 1/16 (полная неопределенность). В действительности зависимость может принимать разнообразные формы при той или иной конкретной реализации системы распознавания. Важно, что существует предел "засоренности" базы образцов ошибками, начиная с которого обучение по базе в совокупности с пополнением базы образцами, распознанными путем "самовосстановления кода" признаков Рейнина, будет приводить к падению точности распознавания.
С другой строны, применение строго критерия на ранних этапах самообучения даст слишком маленький выход. Практика показывает, что начинающий соционик "угадывает" тип в 15% – 30% случаев, в зависимости от своих способностей. Что соответствует верному распознаванию отдельного признака Рейнина с вероятностью 62% – 74%. При таких вероятностях все 15 признаков образуют непротиворечивую картину лишь в одном из 1000 – 100 случаев, соответственно. См. следующий график.
Поэтому на этапе обучения практически неизбежно использование опорной базы, элементы которой распределены по вероятности верного распознавания.
esta.ru