Čeští vývojáři vyvinuli unikátní AI řešení pro přepis textů s citlivým obsahem

PIXLA si poradí s přepisem textu z audiovizuálních souborů obsahujících mluvené slovo ve více než 30 jazycích / Venlan
Přepis řeči není žádnou novinkou. Aktuálně dostupná řešení však pracují jako cloudové služby. To znamená, že pro převod mluveného slova do textu je třeba odeslat zdrojový audio nebo video soubor do cloudu, kde je využíváno úložiště a výpočetní výkon třetích stran.

Zadavatel pak zpravidla platí podle časové délky zdrojového audiovizuálního souboru. Tento postup je dle webu Venlan pro řadu potřeb a společností plně vyhovující. Jsou zde však i instituce, jejichž data jsou buď velmi citlivá, nebo potřebují převádět pravidelně velké množství mluveného slova. Příkladem mohou být soudy, státní či městské úřady, nemocnice, callcentra nebo například televizní a rozhlasové stanice.

V době, kdy se většina vývojářů soustředí téměř výhradně na cloudová řešení, se společnost Venlan věnovala vývoji specifického komplexního on-premise řešení AI Transriber PIXLA určeného pro přepis mluveného slova do textu. Díky unikátnímu konceptu, který pracuje výhradně s daty uvnitř zabezpečené sítě zákazníka, cílí projekt na subjekty pracující s přísně důvěrnými či datově velmi objemnými soubory.  

Vzhledem k multijazyčnosti má toto nové řešení ambice proniknout nejen na lokální trh, ale také do zemí Evropské unie. Ohlasy na pilotní testování projektu je velmi úspěšné.

PIXLA si poradí s přepisem textu z audiovizuálních souborů obsahujících mluvené slovo ve více než 30 jazycích, přičemž základ tvoří všechny jazyky používané v EU. Díky využití pokročilých nástrojů umělé inteligence využívá nejen rozpoznávání slov či hlásek, ale při převodu bere v úvahu i kontext konkrétního textu.

Díky tomu je výsledkem přirozeně znějící text, který se velmi blíží původnímu vzoru a současně jsou do značné míry eliminovány přeřeknutí, odkašlání nebo často se opakující citoslovce (éééé, áááá atd.).

Základem on-premise řešení Venlan AI Transriber PIXLA je hardwarové zařízení určené k instalaci do infrastruktury vnitřní zabezpečené sítě. Ovládání je velmi snadné, pomocí správce souborů stačí přetáhnout audiovizuální soubor do okna aplikace, která zajistí jeho zkopírování do zabezpečeného úložiště PIXLY, kde je zvuk pomocí integrovaných výpočetních prostředků převeden na text a soubor je následně automaticky smazán.

Z videí získá uživatel kromě čistého textu také soubor typu .srt s předpřipravenými titulky. Části textu, kterým transcriber dobře nerozuměl, jsou barevně zvýrazněny. Aplikace je k dispozici pro operační systémy Windows, macOS i Linux. Kromě toho lze systém integrovat i přímo do firemního systému či spisové služby pomocí protokolu restAPI.

Výsledky převodu jsou k dispozici během okamžiku. Praktické zkušenosti získané v rámci jedné z pilotních testovacích instalací na vybraných magistrátech a univerzitách ukazují, že například převod sedmihodinového zvukového záznamu s účastí několika osob trvá pomocí Venlan AI Transriber PIXLA méně než jednu hodinu.

Přesto, že možnosti převodu závisí na kvalitě zvukového záznamu, si transcriber díky precizní práci vývojářů při učení poradí dobře i s nežádoucími ruchy v záznamu.

Aktuální čerstvou novinkou implementovanou do řešení Venlan AIT Pixla je převod hlasu do textu v reálném čase. Prostřednictvím aplikace běžící na počítači uživatele nebo na mobilním telefonu se systémem Android je možné převádět na text zvukový záznam snímaný vestavěným mikrofonem nebo pomocí jiného kompatibilního připojeného audio zařízení. Tuto funkci lze vhodně využít například pro diktování lékařských zpráv nebo titulkování mluvčích na konferencích.

Zdroj: Venlan

Mohlo by vás zajímat

Reklama