Ljuddiktering har funnits långt innan den generativa AI-boomen. Mjukvara som Dragon NaturallySpeaking har varit det bästa för många. Nu med AI i mixen skapar transkriptionsverktyg (som förvandlar det talade ordet till dokument och kommandon) som Otter.ai vågor.
Appen vi kommer att titta på i den här artikeln är VoiceType, som lovar att svara på alla dina transkriptionsbehov samtidigt som den integreras med andra appar. Men levererar det? Låt oss ta reda på det.
Tekniken bakom kulisserna
VoiceType, som de flesta AI-transkriptionsprogram, förlitar sig starkt på OpenAI:s Whisper för att få jobbet gjort. Dessa modeller kan laddas ner för mer kraftfulla datorer och köra öppen källkod, vilket ger alla teknikföretag tillgång till sina möjligheter.
Utöver denna grundläggande röstfångst är funktionerna du betalar för. Tjänster som formatering, ljudrensning och efterbehandling är alla tillägg som enskilda LLM:er och företag kommer att debitera dig extra för. Utbuden varierar, och det gör även deras betalningsalternativ. Vissa paketfunktioner, medan andra tillåter API-integration och debitering per funktion.
VoiceType AI och vad de erbjuder

Med grunden lagd, låt oss se vad VoiceType lovar och erbjuder:
Drag
VoiceType har en tvättlista med funktioner som den har som gör den överlägsen andra. Dessa inkluderar:
- Appintegration på din maskin, inklusive jobbappar (Slack, Teams, Gmail) och fler sociala (X, Instagram, WhatsApp)
- Förmågan att diktera på 35 språk
- Kontextkänslighet, enligt appen du använder för närvarande
- Hög noggrannhet, stabil formatering och snabbare transkription än att skriva
- End-to-end-kryptering (E2EE) för att hålla ditt innehåll säkert
På första sidan är dessa fantastiska funktioner. Det är dock viktigt att notera att nästan alla dessa (förutom kontextkänsligheten) är inbyggda funktioner i OpenAI:s Whisper. Detta hindrar dem inte från att vara användbara, men det betyder att du kan hitta många andra transkriptionsverktyg där ute som kan lova samma saker.
Något mer suspekt är det faktum att VoiceType fritt kan skryta med sin användarstatistik och ord som transkriberas samtidigt som de annonserar sin E2EE-kryptering. Båda verkligheterna kan inte vara sanna, och det är något att överväga.
Transkriptionens fallgropar
Att köras med Whisper innebär att VoiceType är känsligt för samma brister som sin moderprogramvara. Tunga accenter kommer att kämpa för att producera helt korrekt diktering. AI-transkriptionsverktyg är ännu inte så perfekta som företagen som använder dem skulle få oss att tro, och det är uppenbart att det fortfarande finns en lång väg kvar att gå på den här avdelningen.
Priset
Prissättningen för VoiceType är ett särskilt tvist. Ordinarie priser är $29,00 per månad, $14,89 per månad och år och $875,00 för livstidsåtkomst. I skrivande stund är dessa priser för närvarande sänkta som ett specialerbjudande ($19,50 per månad och $475,00 för en livstid).
Som sagt, när man tittar på konkurrenterna och de möjligheter som erbjuds, verkar det som att VoiceTypes begärda pris är lite brant. Det finns ingen gratis nivå, bara en tredagars provperiod, och andra konkurrenter erbjuder bättre priser för fler funktioner.
VoiceInk har en aktivt bidragande användarbas till verktygets övergripande framgång och har ett livstidspris på endast $25 per enskild enhet. Visst, det är bara diktering, men skillnaden är stor. På samma sätt är Otters Pro-nivå för individer eller små team $8,33 per månad.
API:er är i allmänhet mycket billigare per funktion än det totala utropspriset för VoiceType. Detta är inte att säga att deras tjänsteutbud inte är solid, bara inte tillräckligt annorlunda för att motivera det nuvarande begärda priset.