Data- en privacywaarborging

Het belang van data en annotatie

Om de kwaliteit van onze spraak-naar-tekstmodellen te garanderen, is het belangrijk dat de data die wordt gebruikt om de modellen te trainen, zoveel mogelijk lijkt op de data waarmee de modellen in de toekomst moeten werken. Dat houdt in dat de modellen bekend moeten zijn met woorden die vaak in dezelfde context voorkomen en met woorden die in een specifiek zorgdomein worden gebruikt.

De modellen worden daarom continu verbeterd door binnenkomende data te annoteren. In dit proces wordt het transcript dat door ons spraak-naar-tekstmodel is gegenereerd, gecontroleerd en waar nodig gecorrigeerd door een persoon. Deze verbeterde data gebruiken we om onze modellen te trainen en te evalueren, wat uiteindelijk nauwkeurigere modellen oplevert.

Privacygevoelige data

Omdat de data die binnenkomt privacygevoelig kan zijn en er door mensen wordt geannoteerd, ontstaan er risico’s. We hebben daarom de volgende maatregelen genomen om te zorgen dat de data op een veilige manier kan worden geannoteerd:

1. Wij hebben niet zomaar toegang tot de data

Wanneer wij toegang willen tot data voor trainingsdoeleinden, kan dit enkel wanneer een zorgorganisatie daar expliciet toestemming voor geeft. In dat geval spreken we samen met de zorgorganisatie af wie er bij de data mag en hoe lang de data mag worden bewaard.

2. De data van iedere zorgorganisatie wordt gescheiden opgeslagen

We slaan de data van iedere zorgorganisatie op in een aparte database. Wanneer de bewaartermijn van de data is verstreken, wordt de gehele database verwijderd.

3. Alle afspraken die worden gemaakt, worden vastgelegd in een verwerkersovereenkomst

Alle afspraken die we maken met een zorgorganisatie worden vastgelegd in een verwerkersovereenkomst. Deze overeenkomst sluit aan op de de standaard modelverwerkersovereenkomst, die de Brancheorganisaties Zorg (BoZ) heeft ontwikkeld voor de zorgsector in samenwerking met zorgorganisaties, leveranciers en deskundigen.

4. Annotatoren zijn bij ons in dienst

Wij nemen annotatoren bij ons in dienst en doen dit enkel wanneer zij een Verklaring omtrent het Gedrag (VOG) bezitten die aantoont dat ze een goede voorgeschiedenis hebben rondom informatiebeveiliging. Als een annotator toegang heeft tot de data van de samenwerkende organisatie, delen we zijn of haar VOG ook met de zorgorganisatie.

5. Annoteren gebeurt in onze eigen annotatieomgeving

We hebben een eigen omgeving opgezet waarin onze annotatoren kunnen annoteren. Hierdoor hebben wij zelf de volledige controle over wie er toegang heeft tot de data. Deze annotatieomgeving en onze databases worden gehost bij Microsoft Azure in Nederland en zijn daarom onderhevig aan de Nederlandse wet- en regelgeving voor dataverwerking.

Elke annotator krijgt een eigen account binnen onze Azure Active Directory. Wanneer zijn of haar dienstverband eindigt, wordt het account verwijderd, waardoor deze persoon de toegang tot de data automatisch wordt ontzegd. Bovendien is de annotatieomgeving alleen toegankelijk vanaf ons eigen netwerk via een VPN. Alle data wordt tijdens transitie en opslag volledig versleuteld met de modernste encryptietechnieken.

Heeft u vragen, opmerkingen of suggesties over de beveiliging van Attendi? Neem dan contact op met onze Privacy Officer: berend@attendi.nl.