V ideálním případě se sejde věřitel s žadatelem o úvěr, věřitel zváží
svoje riziko a peníze půjčí, nebo ne. Takhle to fungovalo tak možná
za Shakespeara, ale dnes už se situace liší: věřitelem je velká instituce
a není v silách ředitele popovídat si s každým žadatelem zvlášť, takže
za instituci s žadatelem jedná – říkejme mu třeba poradce.
Tento poradce narozdíl od instituce žádné riziko nenese, jeho zajímá,
kolik úvěrů odpapíruje, protože za to je koneckonců placen. Je to takhle
špatně? Mělo by to být tak, že by za „své” smlouvy ručil?
To by asi instituce moc (levných) poradců nesehnala. Takže žadatele
nutně musí kontrolovat někdo jiný. V našem případě se instituce obrátila
na renomovanou společnost, říkejme jí třeba EY, která jí slíbila dodat
software, který o žadatelově úspěchu rozhodne na základě údajů z žádosti.
Chlapci a děvčata v EY zkusí pár statistických udělátek a zjistí, že jelikož
skoro všichni dluh splácejí, není co řešit a že statistika jim vždycky poradí
úvěr schválit. Co teď?
Zde přicházíme na scénu my, podobni zoufalému detektivovi ze
Záhady úhlů v
trojúhelníku. Máme zkusit pokročilejší metody strojového učení, zda by
nepomohly. Počítače se vaří, každé jádro procesoru na stejných datech zkouší
jiné parametry, ohýbá čísla logaritmem, zkouší najít tu správnou oddělující
rovinu ve vyšších a vyšších dimenzích. Mezitím se snažíme zjistit víc o těch
číslech: kolik údajů je jen nevyplněných, kolik jich je pravděpodobně chybných,
jaké jsou mezi nimi vztahy.
Základním problémem přitom zůstává, že instituce úvěr neschválí každému, čímž
nám chybějí příklady těch „špatných”, kterým by se úvěr dát neměl.
Skoro všichni, kdo ho dostali, ho i splácejí a poznat na základě těch několika
veličin, kdo patří k těm pár nešťastníkům, se prostě nedá.
Závěr: My napíšeme zprávu, že při tak špatné úspěšnosti nestojí za to používat
náš řádově složitější model, když výsledky dává jen o trošku lepší než model
původní, a tím pro nás projekt končí, protože dál nás nepotřebují. EY je trochu
líto, že za nás vyhodili peníze, ale aspoň můžou mít lepší spaní, že opravdu
udělali, co mohli. Instituce je spokojená, že má software, který jí pěkně
schvaluje úvěry. Poradci jsou spokojení, že je nikdo neprudí. Žadatelé jsou
spokojení, že dostanou úvěr. Všechno jde jak na drátkách a nikde se nestala
chyba.