Obsah článku
Chcete nabídnou návštěvníkům webu poslech vašich textů? Chcete udělat z vašich textů podcast, ale nemáte ve svém okolí nikoho, kdo umí mluvit na mikrofon? Svěřte to umělé inteligenci. Umí už i česky a jde to i zdarma.
Proč poskytovat text jako audio?
Důvodů bude víc, mě napadají minimálně dva:
- pokud máte obsahový web nebo blog, můžete audioverzí oslovit nové čtenáře, nebo spíše posluchače, kteří se pohybují například jen na YouTube a texty nečtou.
- máte ve své cílové skupině zrakově postižené čtenáře nebo je nemáte, ale chtěli byste mít
Ještě před pár měsíci byla taková výroba audioverze textového obsahu poměrně komplikovaná a drahá záležitost. Museli jste najít někoho, kdo umí mluvit na mikrofon, aby se audioverze dala vůbec poslouchat. Museli jste si koupit nebo pronajmout zařízení, které hlas použitelně zaznamená (na mobil to fakt namluvit nejde), museli jste umět záznam sestříhat nebo najít někoho, kdo ho sestříhá a dá do formátu, který nahrajete na zamýšlenou platformu. A nakonec jste všechny ty lidi museli zaplatit. Takže udělat audioverzi jednoho článku mohlo snadno vyjít i na tisíce korun.
Tomu je ale konec. Audio vašeho textu můžete mít doslova za pár korun a za pár minut.
Nechte audio namluvit AI od Elevenlabs
Pokud nevěříte, tak zamiřte na web elevenlabs.io a vyzkoušejte si zdarma možnosti tohoto Ai nástroje. Přímo na titulní stránce si můžete nechat namluvit 333 znaků a udělat si představu o tom, jak nástroj funguje. Na výběr máte asi třicítku mluvčích s různým hlasem a projevem. Dobře zní třeba Matylda, ale bacha na její omezení, viz dále.
Tarif zdarma
Většina podobných služeb obvykle nenabízí zdarma nic moc použitelného, což je logické. Elevenlabs vám ale poskytne docela slušné možnosti i bez placení. V tarifu zdarma si můžete každý měsíc nechat namluvit 10 tisíc znaků, což jsou třeba dva články na blogu. A to může někomu bohatě stačit. Proti placeným verzím je jediným výrazným omezením to, že můžete najednou namlouvat jen 2 500 znaků. Pokud je text delší, musíte ho udělat po částech a výsledný záznam spojovat z více souborů. Při namlouvání kratších textů ale toto omezení nevadí. A při použití varianty zdarma byste také měli uvádět, že audio vzniklo s pomocí Elevenlabs a odkázat na něj.
Placené tarify
Nejlevnější placený tarif stojí 5 dolarů a v době psaní článku běží akce, že první měsíc je za 1 dolar (asi 23 korun). Zaplacením tarifu si zvýšíte počet znaků, které lze najednou načítat na 5 000. To už stačí na středně dlouhý článek a nemusíte pak nic spojovat. Stáhnete výstup jako jeden soubor, umístíte ho např. na YouTubu a hotovo. Tento nejlevnější tarif vám umožní měsíčně namluvit 30 tisíc znaků. Podle výpočtů na webu by to mělo být asi 35 minut audiozáznamu. A součástí tarifu je i licence pro komerční použití – nemusíte už odkazovat na Elevenlabs.
Následují tarify za 22 dolarů (v akci je první měsíc za 11 dolarů), kde máte měsíčně 100 tisíc znaků, což jsou podle Elevenlabs asi dvě hodiny záznamu. Za 99 dolarů máte 500 tisíc znaků, což je asi 10 hodin záznamu a za 330 dolarů 2 miliony znaků a 40 hodin záznamu. A pokud je vám to málo, můžete si domluvit individuální plán.
Tarify se liší ještě počtem uživatelsky upravených hlasů – u všech mluvčích si můžete měnit různé parametry toho, jak mluví. Na kompletní srovnání tarifů se podívejte sami.
Na co si dát pozor
Služba vám nemilosrdně sebere předplacené znaky kdykoliv, kdy spustíte generování audia. Doporučuji tedy vyladit si hlas na nějaké kratší větě, abyste pokud možno nemuseli přegenerovávat celý článek o pěti tisících znacích, protože pokud se vám výsledek nebude líbit a spustíte generování znovu, přijdete o dalších pět tisíc znaků z tarifu.
A taky bacha na to, když vám u nějakého hlasu doporučují změnit model. Hlas trénovaný v jedničce se totiž chová ve dvojce hodně divně. Třeba Matilda mi během namlouvání článku málem usnula a na konci už jen šeptala. Na podpoře mi poradili právě to, abych nevybírat hlasy trénované na na verzi jedna do verze dva.
AI může mluvit i vaším hlasem
Chcete text načíst vaším hlasem, ale přitom se vůbec nenamáhat čtením? I to je možné. Do Elevenlabs můžete nahrát nahrávky svého hlasu a on se vás naučí imitovat. Že z toho trochu mrazí? Co se dá dělat. Budoucnost je tady.
A herci nebudou mít co žrát?
Zatím bych se asi na místě skvělého mluvčího nebál, pořád je z výsledku patrné, že nemluví člověk, případě že je ten člověk trochu divný. Ale při tom, jakou šílenou rychlostí pádí AI kupředu, bych se vůbec nedivil, kdyby například béčkové filmy brzy dabovala AI a nikomu to nebude vadit. A navíc klidně hlasem oblíbených herců, protože se je naučí. Takže o práci se narozdíl od herců určitě zatím nemusí bát právníci, kteří budou řešit spory na tomto poli.
A co by to bylo za článek o namlouvání textu, kdyby v něm nebyla ukázka, jak to vypadá v praxi a nebyl k dispozici namluven přímo v Elevenlabs (tady i na Youtube):