De eerste PDF teksten zijn ontsloten

Posted on 25 May 2021

Verheugend nieuws: in de vorige maand hebben we in samenwerking met Isala de eerste PDFs kunnen ontsluiten! Een feature waar veel vraag naar is, dus we zijn blij dat we de eerste stappen daarnaartoe hebben weten te concretiseren. Twee mensen hebben in deze ontwikkeling een hoofdrol gespeeld: Clarinda van den Bosch, datamanager en expert CTcue gebruiker in Isala en Ruben, data engineer bij CTcue. Aan beide hebben we enkele vragen gesteld, en een verslag daarvan lees je hieronder terug.

Waarom zijn PDFs zo belangrijk?
Clarinda legt uit dat er naast HiX ook nog andere software bestaat waar data in opgeslagen wordt. Bij de cardiologie gebruiken ze bijvoorbeeld een apart systeem voor de data registratie van de hartkatheterisaties. Deze data wordt zeer geordend opgeslagen, maar in HiX – het EPD – komt het als een PDF terecht. Artsen en verpleegkundigen kunnen dan wel teruglezen wat er precies gebeurd is tijdens een procedure, maar een PDF is moeilijk te hergebruiken voor evaluatie van de zorg en data analyse.

Bovendien is het niet zo dat we ervan uit kunnen gaan dat deze aparte systemen in de nabije toekomst langzaam uitgefaseerd zullen worden, vertelt Clarinda. Het is nou eenmaal zo dat niet alle data goed in HiX geregistreerd kan worden. Data uit apparatuur bijvoorbeeld. Gezien deze realiteit is het dus van grote meerwaarde als de PDF teksten op een andere manier beschikbaar worden gemaakt voor onderzoek en data analyse.

Aan de slag
Voor Ruben was ‘project PDF’ al wat langer aan de gang; in oktober vorig jaar zijn er al wat voorbereidende technische taken uitgevoerd. Daarna was het alleen nog wachten op de inrichting van een nieuwe server waar getest kon worden. Toen die er was zijn Clarinda en Ruben 2 uur virtueel ‘naast elkaar gaan zitten’ (Clarinda: “dat gaat ideaal”) om met elkaar af te stemmen welke PDF teksten geschikt zouden zijn voor een eerste test. Er is besloten om met de verslagen van de hartkatheterisaties aan de slag te gaan, omdat deze alleen tekst bevatten – geen schema’s of tabellen – en dus goed te verwerken zijn. Ruben kon bovendien in de database zien dat het bij dit type verslag om een relatief laag aantal teksten ging, wat het dus ook ideaal maakte voor een test.

Het is Ruben na die meeting in een relatief korte periode gelukt om een oplossing te ontwikkelen die ervoor zorgt dat de PDF teksten meegenomen kunnen worden in de nachtelijke data-update van CTcue. Hoewel het voor Ruben voornamelijk als “work as usual” voelde, waren de reacties van degenen die nu voor het eerst op de PDFs konden zoeken bijzonder enthousiast. Met deze implementatie is er duidelijk iets moois geboren.

Toekomst
Nu het gelukt is om de verslagen van de hartkatheterisaties te ontsluiten is de grote vraag natuurlijk: hoe nu verder? Voor Isala geldt dat er gekeken wordt of er een up-to-date database met PDF teksten beschikbaar gemaakt kan worden, zodat de verslagen in Isala ook daadwerkelijk nachtelijks geüpdatet kunnen worden. Daarnaast zal er onderzocht worden of er nog meer PDF teksten beschikbaar gemaakt kunnen worden. Het is namelijk niet zo dat nu de eerste teksten gelukt zijn, we dan direct alles binnen kunnen halen. Er moet per tekst-type onderzocht worden of het goed ontsloten kan worden.

Wel is het zo dat de oplossing die we nu gemaakt hebben zeer gemakkelijk te vertalen is naar andere ziekenhuizen en EPD’s is. We kijken er dus naar uit om hier op korte termijn nog veel meer gebruikers blij mee te kunnen maken!

 

 

Back to overview

Contact

CTcue B.V.
Science Park 406
1098XH Amsterdam
The Netherlands
+31 (0)85 600 1037
info@ctcue.com