Onderzoekers van Amsterdam UMC hebben de behoefte om in ongestructureerde documenten binnen het EPD (notities, brieven, verslagen) bepaalde termen op te zoeken. Dit kan zijn om in het kader van AI algoritmes ontwikkeling deze documenten, eventueel in combinatie met gestructureerde data, te screenen. De onderzoeker wil zowel syntactisch (naar de opgegeven trefwoorden) als semantisch (het systeem stelt documenten voor die woorden bevatten die semantisch dicht zijn bij de opgegeven trefwoorden) kunnen zoeken. Daarnaast moet de hiervoor ingerichte software ondersteunen bij het annoteren van de tekst (toevoegen van labels aan woorden / termen) en deze automatisch linken aan een classificatiesysteem zoals SNOMED.

Hiertoe willen we een testimplementatie doen van Cogstack (https://cogstack.org/). Dit is een reeks Python modules, ontwikkeld door Kings College London, met mogelijkheden als NLP, MedCat, MedCat trainer, Gateway (koppeling met databases) en DEDUCE (anonimisatie). We werken hierin nauw samen met een consortium van UMC Utrecht, UMCG, ErasmusMC en Radboud UMC en delen onderling onze ervaringen.

 

Wat vragen we?

We zoeken een (klinisch) informaticus of student medische informatiekunde met:

  • Analytische vaardigheden
  • Kennis van tekst mining technieken en van machine learning
  • Kennis van ontologie├źn
  • Ontwikkelvaardigheden (bij voorkeur Python)
  • Linux kennis en ervaring

Het project heeft een omvang van in eerste instantie 6 maanden voor tenminste 8 uur per week. Hier staat een vergoeding, passend naar opleiding en ervaring, tegenover.

Voor vragen kun je contact opnemen met Rudy Scholte, domeinhoofd Research Data Management: r.a.scholte@amsterdamumc.nl.

 

  • Amsterdam UMC
  • Amsterdam
  • 8 uur p/week voor 6 maanden