Tools voor Automatische Spraakherkenning

Automatische transcriptietools (ASR) zetten spraak snel om in tekst, maar de kwaliteit varieert en vereist vaak correctie. Op deze pagina vind je een overzicht van automatische transcriptietools, van eenvoudige functies tot geavanceerde software met extra opties voor nauwkeurigheid, samenwerking en meertaligheid. Zo kies je de tool die het beste past bij jouw project en werkwijze.

Automatic spraakherkenning tools

aTrain

aTrain is een krachtige tool voor automatische transcriptie, inclusief sprekerherkenning. Alles gebeurt lokaal op je apparaat, volledig AVG-proof.

  • Privacy: Geen data-opslag in de cloud
  • Sprekerdetectie: Herkent wie wat zegt
  • Snel: Ondersteuning voor NVIDIA GPU
  • Compatibel: Werkt met o.a. MAXQDA
  • Windows: Via Microsoft Store of BANDAS-Center (vanaf Windows 10 v17763)
  • macOS: Bètaversie 1.2.4 via alternatieve installatie

Subtitle Edit

Subtitle Edit ondersteunt spraakherkenning via twee systemen:

  • Vosk/Kaldi: een oudere methode
  • Whisper: moderne AI-technologie met hogere nauwkeurigheid
  • Whisper-engines: Sommige (zoals OpenAI, WhisperX, CTranslate2) vereisen Python. Andere (zoals Purfiew’s Faster Whisper-XXL en CPP) werken zonder Python.
  • Download Whisper via het menu: Video → Audio naar tekst (Whisper)
  • Modelkeuze: Selecteer large-v2 onder Model kiezen voor de beste resultaten
  • Instellingen: Geavanceerde opties en nabewerking vind je onder Audio to text

MacWhisper

MacWhisper zet audiobestanden om in tekst met Whisper-technologie van OpenAI. Alles gebeurt lokaal, waardoor jouw gegevens veilig blijven.
  • Privacy gegarandeerd – Alle transcripties worden lokaal verwerkt.
  • Veelzijdige bestandsformaten – Ondersteunt mp3, wav, m4a en mp4.
  • Handige exportopties – Exporteer ondertitels (.srt, .vtt) of tekst (.csv).
  • Meer dan 100 talen – Automatische herkenning en transcriptie.
  • Slimme extra’s – Verwijdert opvulwoorden zoals “uh” en “um”.
  • Gebruiksvriendelijk – Doorzoek en markeer tekst, synchroniseer audio.
Voor €59,- krijg je toegang tot krachtigere Whisper-modellen voor nauwkeurigere transcripties.

DoblAI

DoblAI is een online tool voor transcriberen, vertalen en nasynchroniseren van multimedia. Het is gratis, platformonafhankelijk en biedt automatische sprekerherkenning voor overzichtelijke transcripties.
  • Direct aan de slag – Geen installatie nodig, werkt in je browser.
  • Sprekerherkenning – Herkent automatisch verschillende stemmen.
  • Uitbreidbare opties – Betaalde functies voor snellere verwerking en extra controle.
  • Privacy – Bestanden worden versleuteld en voldoen aan AVG.
  • Bestandsformaat – Exporteert .srt met sprekerkleuren.
Ideaal voor toegankelijke, flexibele transcripties.

Riverside

Riverside zet audio en video moeiteloos om in tekst, rechtstreeks in je browser. Geen downloads, geen installatie, gratis te gebruiken en ondersteunt meer dan 100 talen.
  • Ongelimiteerd uploaden – Verwerk MP3, WAV, MP4 en MOV-bestanden zonder beperkingen.
  • Handige exportopties – Exporteer ondertitels (.srt) of tekstbestanden (.txt).
  • Supereenvoudig – Start de transcriptie binnen enkele klikken.
  • Privacy – Bestanden worden online geüpload.
  • Verwerkingstijd – Afhankelijk van bestandsgrootte en serverdrukte.
Ideaal voor snelle, eenvoudige transcripties zonder software.

CLARIN Transcriptie Portaal

Het CLARIN Transcriptie Portaal is een gebruiksvriendelijke tool voor automatische spraakherkenning, ontwikkeld door LMU München. Het is ontworpen voor academisch gebruik en ondersteunt meerdere ASR-diensten.
  • Meertalig – Ondersteunt transcriptie in meerdere talen.
  • Bewerkbaar – Corrigeer en bewerk transcripties in het OH-Portal.
  • Bestandsformaat – Alleen .wav-bestanden worden ondersteund.
  • Toegankelijkheid – Gratis voor academici met een CLARIN-account.
Het portaal schakelt tussen audiobestanden en ASR-diensten, met export- en bewerkingsopties voor transcripties.

CLARIAH ASR

De CLARIAH ASR-tool, ontwikkeld door de Radboud Universiteit, biedt een krachtige online dienst voor automatische transcriptie en sprekerherkenning. Door de inzet van WhisperX (spraakherkenning) en PyAnnote (sprekerdiarisatie) levert de tool nauwkeurige en helder gestructureerde transcripties in meerdere talen.
  • Meertalige ondersteuning – Geschikt voor transcriptie in verschillende talen.
  • Sprekerherkenning – Herkent en scheidt automatisch verschillende sprekers binnen één opname.
  • Veilige verwerking – Alle gegevens blijven eigendom van de gebruiker en zijn alleen toegankelijk voor technische medewerkers.
  • Data-opslag en beheer – Projecten kunnen zelf verwijderd worden en worden automatisch gewist na 30 dagen.
  • Geen encryptie, wel afgeschermd – Data wordt niet gedeeld met derden en enkel gebruikt voor transcriptiedoeleinden.

Deze dienst biedt een flexibele en betrouwbare oplossing voor onderzoekers die transcripties met sprekerinformatie nodig hebben. Let op: sla transcriptieresultaten tijdig lokaal op, want data wordt na 30 dagen verwijderd.