Wanneer je overweegt automatische spraakherkenning (ASR) te gebruiken, is het belangrijk te beseffen dat bepaalde AV-bronnen geschikter zijn dan andere. Hier zijn enkele zaken om in gedachten te houden. Ten eerste, de audiokwaliteit moet hoog zijn. Dit betekent dat stemmen duidelijk moeten zijn, niet echoën, en bij voorkeur dicht bij de mond opgenomen met adequate microfoons.
Ten tweede werkt ASR het best bij monologen. Als een audiobestand vol is met mensen die elkaar onderbreken en door elkaar heen praten, kunnen de resultaten verwarrend zijn om te lezen, aangezien niet alle software in staat is verschillende mensen aan de hand van hun stem te herkennen. Idealiter zou het bestand voor elke spreker een apart kanaal moeten hebben.
Tenslotte is ASR over het algemeen niet erg goed in het omgaan met accenten en dialecten. Wanneer je te maken hebt met migranten of plattelandsbewoners met een accent dat voor jou misschien gemakkelijk te verstaan is, kan ASR daar toch grote moeite mee hebben. Laat staan met accenten die voor buitenstaanders moeilijk te begrijpen zijn.
ASR software
Bedenk bij het gebruik van online-software dat je privacy-gevoelige bestanden upload.
Lees altijd de voorwaarden van een ASR-dienst, voordat je beslist of deze aan je privacy-eisen voldoet.
Vanaf januari 2023 (versie 3.6.12) is er een nieuwe optie voor automatische spraakherkenning in Subtitle Edit ingebouwd.
Bij deze versie van Subtitle Edit zijn onder het tabblad Video twee spraakherkenningsfuncties ondergebracht:
Korte installatiebeschrijving voor Subtitle Edit 3.6.12, om het programma het best te laten werken voor Whisper spraakherkenning:
Snel en gemakkelijk audiobestanden omzetten in tekst met OpenAI’s geavanceerde transcriptietechnologie Whisper.
Voor de Pro versie is een kleine bijdrage vereist van € 16,-
De Pro-versie maakt gebruik van Medium and Large models, waarbij het transcriptieresultaat vaak nog veel beter is.
Automatische spraakherkenning
Automatische spraakherkenning met Word in Office 365.
Met een Microsoft registratie is de service online gratis te gebruiken.
Nadeel is dat het resultaat een document is zonder tijdcodes.
Via een optie in YouTube Studio zijn hier ondertitels met tijdcodes van te maken.
DOWNLOAD het aparte instructie-document.
Instructie-document voor automatische spraakherkenning in Word is hier te downloaden:
Automatische transcriptie
Automatische transcriptie met Word in Office 365.
Alleen met een Office 365-premium abonnement is de service te gebruiken.
(300 minuten spraakherkenning per maand)
Het resultaat is een document met begintijden per alinea. Om er een leesbaar ondertitel-bestand met tijdcodes van te maken kan gebruik worden gemaakt van een optie in YouTube Studio.
Download het aparte instructie-document.
Instructie-document voor automatische transcriptie in Word is hier te downloaden:
De automatische spraakherkenning is te gebruiken met een Google Account.
Nadeel is dat het resultaat een document is zonder tijdcodes.
Via een optie in YouTube Studio zijn hier ondertitels met tijdcodes van te maken.
DOWNLOAD het aparte instructie-document.
Instructie-document voor automatische spraakherkenning in Google Docs is hier te downloaden:
De automatische ondertitels zijn te maken met een Google / YouTube-account.
Alleen geschikt voor video-bestanden.
Als je een geluidsbestand (mp3, wav, ogg, etc.) automatisch wil laten transcriberen, moet dat eerst omgezet worden naar een video-bestand om te kunnen uploaden naar YouTube. Daar zijn allerlei gratis programma’s voor te vinden. De truc is een geluidsspoor in te laden en een willekeurige foto over de hele lengte van het geluidsbestand te zetten. Het geheel dan wegschrijven als mp4-bestand. En het geluidsbestand is klaar om te uploaden naar YouTube.
Instructie-document is hier te downloaden
Transcriptie Portal
Het Transcriptie Portaal is een online ASR tool ontwikkeld en gehost door LMU München voor academische transcriptie doeleinden. De tool is zelf geen ASR-dienst, maar maakt het mogelijk om je audiobestanden via veel verschillende ASR-diensten te verwerken. Vervolgens kun je de resultaten binnen het OH-Portal corrigeren en bewerken, of exporteren in een bestandstype naar keuze.
Als je geïnteresseerd bent in hulpprogramma’s bij het maken van transcripties kijk dan hier: