Реализация алгоритмов индуктивного вывода
0,275)
Таблица 9. База фактов F - (Х1 < 0,275)
Наглядно разбиение множества объектов на классы изображено на диаграмме 1. Диаграмм 1. Пространство параметров
где через D обозначены точки, соответствующие плохим кредитам, а через · - точки, соответствующие хорошим кредитам. Теперь - для сравнения - построим на исходной статистики (табл.5) двухфакторную модель следующего вида: Result = a*X1 + b*X2 , где a, b - коэффициенты модели. В качестве значений параметра Result будем использовать числовые значения 1, если заключение {bad}, и 2, если заключение {good}. Построение осуществим в программной оболочке Statistica. Результаты построения модели приведены в Приложении №3. В итоге имеем модель со следующими параметрами: Result = 1,791045*X1 + 0,023881*X2 (*) Для графического отображения модели (*) на плоскости примем значение параметра result равным 1,5. При этом точки, соответствующие параметрам Х1 и Х2, которые лежат ниже построенной линии, будут относится к плохим кредитам, и, наоборот, точки выше линии будут относиться к хорошим кредитам (см. диаграмму 2) Диаграмма 2. Пространство параметров
На диаграмме 2 хорошо видно, что факторная модель недостаточно четко разграничивает множество параметров на подмножества, относящиеся к хорошим и плохим кредитам. Заметим также, что линия разбивает пространство параметров на две плоскости. В отличии от этого, метод индуктивного вывода делит пространство уже на четыре плоскости, и тем самым более качественно выделяет параметры, относящиеся к разным классам заключений. Приведенный пример является наипростейшим, так как использует всего два параметра, которые в свою очередь характеризуются числовыми значениями. При возрастании набора показателей, в том числе и качественных, в значительной степени усложняется использование статистических методов построения моделей. В этом случае алгоритм индуктивного вывода представляется более гибким, так как он может работать с большим количеством показателей разного рода, и при этом быть менее требовательным к количеству и качеству статистики по каждому из них. |