bljesak-logo
search icon
sun icon
open-nav
Svakakvih čudesa

Predstavljen Voicebox: Open-source alat koji klonira glas iz nekoliko sekundi snimke

Novi open-source alat Voicebox omogućuje kloniranje glasa na vlastitom računalu bez slanja podataka u oblak, koristeći model Qwen3-TTS.

Predstavljen je novi open-source alat za kloniranje glasa pod nazivom Voicebox, koji omogućuje stvaranje digitalne kopije glasa na temelju samo nekoliko sekundi snimke, a sav proces odvija se lokalno na računalu korisnika.

Prema dostupnim informacijama, Voicebox koristi model Qwen3-TTS, sustav za sintezu govora koji je razvila kineska tehnološka kompanija Alibaba. Alat omogućuje korisnicima da učitaju kratki audio zapis, nakon čega sustav generira gotovo identičan glas koji se može koristiti za stvaranje govora na različitim jezicima.

Za razliku od mnogih sličnih rješenja, Voicebox ne zahtijeva pretplatu niti slanje audio podataka u oblak. Svi procesi obrade i generiranja glasa odvijaju se izravno na korisničkom uređaju, čime se povećava razina privatnosti i sigurnosti podataka.

Alat uključuje i napredne funkcije za audio produkciju. Među njima su višekanalni vremenski editor nalik onima u programima za audio obradu, koji omogućuje stvaranje podcasta i dijaloga s više glasova, kao i mogućnost snimanja zvuka sustava uz integriranu transkripciju pomoću modela Whisper.

Voicebox također omogućuje takozvano predmemoriranje glasovnih upita, što omogućuje brzo ponovno generiranje govora bez ponovnog procesiranja svih podataka.

Program je razvijen uz pomoć Tauri okvira, koji koristi programski jezik Rust, zbog čega je aplikacija znatno manja i brža od tradicionalnih rješenja temeljenih na Electron platformi.

Projekt je objavljen kao potpuno open-source softver pod MIT licencom. Trenutačno je dostupan za operativne sustave macOS i Windows, dok je verzija za Linux najavljena za naredno razdoblje.

POVEZANO