Intelligente documentverwerking door Document Understanding
Barend van Rooij
RPA Developer
Handgeschreven schadeclaims verwerken met UiPath (RPA & AI)
Tacstone heeft voor een grote verzekeraar in het Caribisch gebied een onderzoek uitgevoerd naar het geautomatiseerd verwerken van handgeschreven schadeclaim formulieren. Met jaarlijks zo’n 17.000 schadeclaims zijn de besparingen voor deze case evident. De vraag is echter in hoeverre de technologie anno 2021 in staat is om deze handgeschreven formulieren op een juiste manier uit te lezen. Welke Handwriting Recognition tooling en Optical Character Recognition (OCR) engines zijn het meest geschikt? En hoe onderzoek je de technische haalbaarheid zonder hoge investeringen vooraf?
Out-of-the-box AI met UiPath Document Understanding
Voor dit onderzoek hebben we een framework ontworpen wat gebruik maakt van UiPath Document Understanding. Deze oplossing maakt een combinatie van RPA & AI om op een intelligente manier informatie te extraheren, interpreteren en verwerken in eigen systemen. Met een combinatie van out-of-the-box AI en een human in the loop is het mogelijk om de software robots steeds intelligenter te maken. Door de laagdrempeligheid van het UiPath Platform is de technische haalbaarheid van een soortgelijke case in een aantal dagen te onderzoeken. Deze input resulteert in een transparante business case voor besluitvorming, alvorens vooraf te investeren. In deze pilot hebben we met 30 handgeschreven schadeclaims als sample set de performance van de UiPath en Google Cloudvision OCR engines vergeleken.
Vergelijking OCR engines met Levenshtein
Binnen de informatica is de Levenshteinafstand een bekende methode voort soortgelijke onderzoeken. Hiermee bereken je het minimaal aantal bewerkingen om een tekst string (uitgelezen resultaat) te veranderen in een andere tekst string (verwachte resultaat). In deze pilot waren de gemiddelde similariteit scores 78,3% (UiPath) en 73,9% (Google). Ook is er gekeken naar het percentage van de datavelden welke 100% correct is uitgelezen. In deze vergelijking bleek de OCR engine van UiPath opnieuw de meest betrouwbare: 29,2% versus 27,4% (Google).
Verder bleken getallen beter te worden uitgelezen dan leestekens. Ook geldt dat hoe meer leestekens een tekst bevat, hoe minder betrouwbaar het resultaat is. Een logische verklaring is de hoeveelheid witruimte welke beschikbaar is op het formulier. Hoe minder witruimte, hoe hoger de densiteit en daardoor minder nauwkeurigheid.
Op basis van deze resultaten is de voorlopige conclusie dat de UiPath OCR engine het meest betrouwbaar is. Uiteraard is een grotere dataset nodig om definitieve conclusies te trekken.
Breng de Human-in-the-loop
In deze case is de belangrijkste vraag natuurlijk in hoeverre het lukt om de informatie uit de handgeschreven schadeclaims te extraheren. In deze pilot is het ons gelukt om op basis van een aantal correct uitgelezen velden een match te maken met de betreffende polishouder. Door middel van deze match en het gebruik van RPA kunnen we de missende informatie in het formulier automatisch ophalen uit de applicaties. Vervolgens gebruiken we UiPath Action Center om de “human in the loop” te brengen en het uitgelezen resultaat te valideren. Met deze automatisering kunnen we de verwerkingstijd per formulier significant verminderen. Zoals vooraf verwacht is het niet mogelijk om de handgeschreven schadeclaims 100% foutloos uit te lezen, maar lukt het wél om de Robot uit de mens te halen.
Combineer RPA, OCR en Document Understanding
Door een slimme koppeling te maken met de bestaande klantsystemen en het gebruik van UiPath Studio, UiPath Action Center, en UiPath Document Understanding kunnen we end-to-end processen met ongestructureerde documenten grotendeels geautomatiseerd verwerken. Door het verminderen van de gemiddelde verwerkingstijd van 5 naar 2 minuten bespaart onze opdrachtgever met zo’n 17.000 formulieren per jaar al meer dan 850 manuren.
Meer over UiPath Document Understanding?
Al bekend met de RPA software van UiPath, en geïnteresseerd om zelf aan de slag te gaan met UiPath Document Understanding? Neem contact met ons op voor een vrijblijvende kennismaking.