“Kunstmatige intelligentie is niet kunstmatig. En al helemaal niet intelligent,” leert ons De Correspondent via een column van Evgeny Morozov. Maar de toepassing is natuurlijk wel binnengedrongen in Audioland.
Doordat ik weet wat het schriftelijk uitwerken van een opgenomen interview aan tijd en energie kost, ben ik zeker geïnteresseerd in transcriptie services en software.
Voor het uittypen van gesprekken zou die AI dus heel nuttig kunnen zijn. Als het tenminste niet weer extra ander gedoe geeft. En dat lijkt het geval met Good Tape. De kwaliteit verraste me, net als vertaalhulp Deepl dat eerder deed ten opzichte van Google Translate.
Good Tape is bedacht door het Deense bedrijf Zetland dat journalistieke producties maakt vergelijkbaar met De Correspondent in Nederland. Met tekst, beeld en geluid en alles online.
Voor het uitwerken van interviews zijn kostbare dienstverleners beschikbaar of geautomatiseerde systemen die dat in het Engels kunnen. Voor kleinere taalgebieden zoals Deens en Nederlands werkt dat vaak belazerd. Dat moest beter kunnen.
Van mp3 naar tekst
Om die wens te vervullen, maakte Zetland dus gebruik van Whisper, een toepassing van OpenAI, ook bekend van ChatGPT. Met een oud interview heb ik een test gedaan met een gratis account.
Je bestand (mp3) gaat dan in de wachtrij en je krijgt na een tijdje een link terug met de tekst. Die komt terug als drie platte tekstbestanden (met en zonder tijdcode en met gesuggereerde ondertitels).
Het ging om een oud gesprek over media en activisme. In de media kwamen de Anders-globalisten er ‘bekaard’ af (bekaaid), teveel aandacht ging uit naar het ‘in kinkelen’ van ruiten, de demonstratie begin jaren 80 over ‘kruisroketten’ (kruisraketten) en het boek Doenvlucht (Doemvlucht) over de Bijlmerrand (Bijlmerramp): dat waren de meest opvallende fouten. Eigenlijk erg goed te gebruiken dus, zo’n tekst.
Nieuwe concurrent
Inmiddels heeft een ander systeem zich bij me gemeld, dat ik nog niet heb kunnen testen. Maar je kunt dat gratis doen (max. 60 minuten) bij AIrite, ook een afgeleide toepassing van ChatGPT. De online demo die ik kreeg van een medewerker zag er op zich veelbelovend uit. Je kunt het overigens ook direct testen via hun website.
Beide systemen kunnen meerdere talen aan en leveren 3 typen bestanden af: integrale tekst, met tijdcodes en als ondertitels (voor videoproducties).
Bij beide systemen is de snelheid waarmee je de transcriptie krijgt afhankelijk van je abonnement. Bij Good Tape duurde het ruim een dag, maar tot 20 minuten audio blijft het gratis.
Bart van Maanen zegt
Binnenkort volgt een test van AIrite.