Medische informatie is veelal als vrije tekst in het elektronische patiëntendossier vastgelegd. Handmatige data-extractie van deze vrije tekst is arbeidsintensief en foutgevoelig vanwege het ontbreken van structuur, spelfouten en het gebruik van afkortingen en jargon. Een oplossing hiervoor is text mining, een techniek waarmee informatie efficiënter vanuit vrije tekst kan worden gestructureerd en geanalyseerd.