spacer
  home/ internet/ Legal Review & Predictive coding    
spacer

Legal Review & Predictive coding
gebouwLegal Review is het onderdeel van E-Discovery waarbij advocaten elektronische documenten bekijken en beoordelen. In de regel worden de elektronisch documenten niet uitgeprint maar door middel van een software programma aan de advocaten getoond. Het oordelen van de documenten wordt aan de hand van tags (labels) en invoer velden gedaan. Deze tags worden digitaal opgeslagen in een database. Een voorbeeld van een tag is "Relevant = Yes". Het doel van een Legal Review is om documenten te classificeren voor een juridisch dispuut (informatieverzoeken vanuit toezichthouders, overheid of rechtszaken). De belangrijkste classificatie hierbij is of een document relevant is voor het juridisch dispuut of niet. Andere tags kunnen zijn: "Privileged", "Hot Item" , "Language", etc. Gemiddeld is zo een 2,5 % van de documenten die gereviewed worden "relevant" voor de zaak.

Naast het taggen van een document kan het nodig zijn dat een document ge-redact moet worden. Dit houdt in dat delen van een document zwart gemaakt worden zodat deze delen niet meer leesbaar zijn. In een review betekent dit dat er een zwart kader over de tekst wordt getrokken. Tijdens de review kan dit kader altijd nog van het document verwijderd worden. Pas bij de productie wordt de redaction in het document gebrand.

waterDe hoeveelheid documenten die bekeken moet worden hangt af van de hoeveelheid verdachten in een zaak (custodians) , de hoeveelheid data die de verdachte heeft verzameld, het type data dat gebruikt wordt en de tijdsspanne die de zaak omvat. In een E-discovery gaat het al gauw om meer dan 150 GB aan data wat neerkomt op één miljoen documenten die door de advocaten bekeken moeten worden. Dit kost een bedrijf met een juridisch dispuut geld, veel geld.

Een advocaat kan ongeveer 60 documenten per uur bekijken wat neerkomt op 480 documenten per dag. Wanneer er 1000.000 documenten bekeken moeten worden zijn dat 2083 review dagen. Een gemiddelde review advocaat kost ongeveer 700 euro per dag. Alleen al voor het bekijken van de eigen data is een bedrijf in dit voorbeeld ongeveer 1.458.100 euro kwijt, of te wel bijna anderhalf miljoen euro. Meestal zijn dit niet de enige kosten die een bedrijf moet maken. Bijkomende kosten kunnen zijn: Het bekijken van de data van de tegenpartij, energie en tijd spenderen van eigen mensen voor het juridisch dispuut zoals IT en juridische afdeling, de eventuele straf die opgelegd wordt, etc.

Voor bedrijven is het belangrijk dat de review kosten zo laag mogelijk zijn zonder dat er belangrijke documenten over het hoofd worden gezien. Een aantal maatregelen dat ondernomen kunnen worden om de hoeveelheid documenten die bekeken moeten worden te reduceren zijn:

  • Aantal custodians beperken
  • Verwijderen van Dubbele documenten
  • Tijdspanne bepalen waarin de documenten aangepast of verzonden moeten zijn
  • Zoekwoorden vaststellen waaraan de documenten moeten voldoen
  • Verwijderen van kleine plaatjes
  • Alleen bepaalde filetypes verwerken

Al deze maatregelen kunnen er voor zorgen dat er slechts 10% van de originele data overblijft. Dat reduceert de kosten aanzienlijk. Bij de grotere zaken gaat het echter gemakkelijk over 2 TB aan data wat neerkomt op 13 miljoen documenten waarvan 1,3 miljoen documenten overblijven na de reductie stappen. De kosten voor de Legal Review lopen dan nog steeds tegen de 2 miljoen euro.

trapOm de review kosten toch te kunnen drukken is er een systeem ontwikkeld wat de review tijd drastisch kan verminderen. Dit systeem heet Predictive Coding, een methode om met een computer algoritme te bepalen hoe de documenten beoordeeld moeten worden. De werkwijze van Predictive Coding gaat als volgt; De advocaten beoordelen willekeurig zo een 10% van de documenten. De computer bekijkt deze documenten en zoekt naar documenten die lijken op de beoordeelde documenten. Vervolgens geeft de computer deze documenten dezelfde waarde als de advocaat heeft gegeven. Een deel van de documenten zal geen oordeel krijgen omdat ze niet genoeg lijken op een van de documenten die al beoordeeld is. Een deel van de niet beoordeelde documenten wordt door de advocaten beoordeeld waarna het proces zich herhaald. Tevens wordt er een deel van de documenten manueel bekeken die door de computer zijn beoordeeld om te controleren of het computer oordeel accuraat is. Bij iedere ronde van manuele beoordeling leert de computer meer over de dataset en hoe zij beoordeeld moet worden. Nadat ongeveer 25% van de dataset door de advocaten beoordeeld is, kan de computer 100% van de dataset met redelijke zekerheid beoordelen. Hiermee wordt dus een winst van 75% op de kosten geboekt wat al snel neerkomt op enkele honderd duizenden euro's. Predictive Coding is daarom een methode die graag door bedrijven wordt ingezet bij een juridisch dispuut.

Voor meer informatie: email

 

 


spacer
       
spacer