Kolloquium 04.06.2012, 15:00 Uhr, Raum  F21/381 

F. Wysotzki, TU Berlin:

Lernen von Entscheidungsbäumen bei Trainingsobjekten mit objektabhängigen Kosten für Fehlentscheidungen

 

Am Beispiel eines konkreten Lernalgorithmus (CAL5) zum Klassifizierungslernen wird gezeigt, wie mit den Trainingsobjekten gegebene objekt- (bzw. situations-) abhängige Kosten für Klassenfehlentscheidungen  benutzt werden können, um kostenoptimale statt fehleroptimale Entscheidungsbäume zu lernen. Ein Anwendungsbeispiel sind optimale Entscheidungen bei der Vergabe von Krediten durch Banken. Im Vortrag wird der durch Kosten modifizierte Lernalgorithmus dargestellt, entscheidungstheoretisch begründet und über Experimente mit künstlichen und Anwendungsdatensätzen berichtet. Als  überraschendes Resultat ergibt sich, dass für die Klassentrennung objektiv irrelevante Merkmale durch die Einbeziehung von Kosten relevant werden können. Die Entscheidungsgebiete im Merkmalsraum werden für die „wichtigen“, d.h. mit hohen Kosten für Fehlentscheidungen behafteten Klassen vergrößert. Ein durch die Einbeziehung von Fehlentscheidungskosten verallgemeinertes Informationsmaß (Verallgemeinerung der Shannon-Information) bestimmt die Reihenfolge der der zu testenden Merkmale. Es ergibt sich auch eine Erklärung für bestimmte psychopathologische Phänomene, auf die ausführlicher eingegangen wird. Beispielsweise kann es durch einen automatisch einsetzenden rekursiven Prozess zu einer totalen Übergeneralisierung der  Entscheidung für die Klasse mit den größten Fehlentscheidungskosten kommen, wenn nicht rechtzeitig (vorhersagbare) äußere Gegenmaßnahmen getroffen werden