Zdaniem eksperta
Microsoft ogłosił wprowadzenie nowej wersji swojego zaawansowanego modelu generowania mowy, Vall-E 2. Ten innowacyjny system sztucznej inteligencji charakteryzuje się wyjątkową naturalnością oraz zdolnością do naśladowania ludzkiego głosu. Mimo osiągnięcia imponujących rezultatów, firma zdecydowała, że Vall-E 2 nie zostanie udostępniony publicznie ze względu na potencjalne ryzyko nadużyć.
Microsoft przeprowadził szczegółowe testy Vall-E 2 z wykorzystaniem zbiorów danych LibriSpeech i VCTK. Wyniki były niezwykle pozytywne. Model osiągnął równowagę z ludzkim głosem pod względem rozbudowania, podobieństwa oraz naturalności. Próbki generowane przez Vall-E 2 są niemal nie do odróżnienia od mowy prawdziwego człowieka, co świadczy o jego zaawansowaniu technologicznym.
Jednym z głównych ulepszeń w Vall-E 2 jest zastosowanie modelowania kodu grupowego. Ta technika pozwala na lepsze zarządzanie kodekami, co skutkuje skróceniem długości sekwencji oraz zwiększeniem szybkości wnioskowania. Dzięki temu Microsoft skutecznie radzi sobie z wyzwaniami związanymi z modelowaniem długich sekwencji, co znacząco poprawia efektywność działania systemu.
Nowa metoda próbkowania uwzględniająca powtórzenia zmienia tradycyjny proces próbkowania jądra. Podczas dekodowania system szuka powtórzeń tokenów, co pomaga w stabilizacji dekodowania i zapobiega problemowi nieskończonej pętli, który występował w poprzednich wersjach Vall-E. Dzięki temu Vall-E 2 osiąga jeszcze większą precyzję i spójność w generowaniu mowy.
Microsoft udostępnił na swojej stronie internetowej dziesiątki próbek generowanych przez Vall-E 2. Próbki te pokazują, że narzędzie jest zdolne do wiernego odwzorowywania nie tylko barwy głosu, ale także subtelnych niuansów, takich jak akcent i intonacja. Dzięki temu Vall-E 2 może być wykorzystywane w wielu zastosowaniach, od edukacji po tłumaczenia i dziennikarstwo.
Pomimo swoich zalet, Vall-E 2 niesie ze sobą również ryzyko nadużyć. Możliwość podszywania się pod konkretne osoby czy fałszowanie identyfikacji głosowej to realne zagrożenia, które skłoniły Microsoft do decyzji o nieudostępnianiu narzędzia publicznie. Firma podkreśla, że Vall-E 2 pozostaje projektem badawczym, a jego komercjalizacja nie jest planowana.
Najnowsze poradniki
Obsługa klienta
Informacje
Zakupy
Moje konto
Pomoc
Zadzwoń do nas
Tel. 756 756 756
Pon - Pt
08:00 - 20:00
Sob
10:00 - 18:00
Niedz
10:00 - 18:00
Fax 22 122 31 11
Інфолінія:
пн-пт: 8:00 - 20:00
Infoline:
Mon-Fri: 8:00 - 20:00
Znajdź swój sklep
Właściciel serwisu: TERG S.A. Ul. Za Dworcem 1D, 77-400 Złotów; Spółka wpisana do Krajowego Rejestru Sądowego w Sądzie Rejonowym w Poznań-Nowe Miasto i Wilda w Poznaniu, IX Wydział Gospodarczy Krajowego Rejestru Sądowego pod nr KRS 0000427063, Kapitał zakładowy: 40 943 750,00 zł; NIP 767-10-04-218, REGON 570217011; numer rejestrowy BDO: 000135672. Sprzedaż dla firm (B2B): dlabiznesu@me.pl INFOLINIA: 756 756 756