Poradniki Eksperta

Zdaniem eksperta

Vall-E - nowe AI od Microsoftu jest zbyt ludzkie?

Paweł Matyjewicz
Data dodania: 18-07-2024
AI Microsoftu za bardzo przypomina człowieka?

Microsoft ogłosił wprowadzenie nowej wersji swojego zaawansowanego modelu generowania mowy, Vall-E 2. Ten innowacyjny system sztucznej inteligencji charakteryzuje się wyjątkową naturalnością oraz zdolnością do naśladowania ludzkiego głosu. Mimo osiągnięcia imponujących rezultatów, firma zdecydowała, że Vall-E 2 nie zostanie udostępniony publicznie ze względu na potencjalne ryzyko nadużyć.

Testy i wyniki

Microsoft przeprowadził szczegółowe testy Vall-E 2 z wykorzystaniem zbiorów danych LibriSpeech i VCTK. Wyniki były niezwykle pozytywne. Model osiągnął równowagę z ludzkim głosem pod względem rozbudowania, podobieństwa oraz naturalności. Próbki generowane przez Vall-E 2 są niemal nie do odróżnienia od mowy prawdziwego człowieka, co świadczy o jego zaawansowaniu technologicznym.

Laptopy w naszej ofercie:

Zaawansowane Funkcje Vall-E 2

Jednym z głównych ulepszeń w Vall-E 2 jest zastosowanie modelowania kodu grupowego. Ta technika pozwala na lepsze zarządzanie kodekami, co skutkuje skróceniem długości sekwencji oraz zwiększeniem szybkości wnioskowania. Dzięki temu Microsoft skutecznie radzi sobie z wyzwaniami związanymi z modelowaniem długich sekwencji, co znacząco poprawia efektywność działania systemu.


Nowa metoda próbkowania uwzględniająca powtórzenia zmienia tradycyjny proces próbkowania jądra. Podczas dekodowania system szuka powtórzeń tokenów, co pomaga w stabilizacji dekodowania i zapobiega problemowi nieskończonej pętli, który występował w poprzednich wersjach Vall-E. Dzięki temu Vall-E 2 osiąga jeszcze większą precyzję i spójność w generowaniu mowy.

Realistyczne próbki głosu

Microsoft udostępnił na swojej stronie internetowej dziesiątki próbek generowanych przez Vall-E 2. Próbki te pokazują, że narzędzie jest zdolne do wiernego odwzorowywania nie tylko barwy głosu, ale także subtelnych niuansów, takich jak akcent i intonacja. Dzięki temu Vall-E 2 może być wykorzystywane w wielu zastosowaniach, od edukacji po tłumaczenia i dziennikarstwo.

Co z etyką i nadużyciami?

Pomimo swoich zalet, Vall-E 2 niesie ze sobą również ryzyko nadużyć. Możliwość podszywania się pod konkretne osoby czy fałszowanie identyfikacji głosowej to realne zagrożenia, które skłoniły Microsoft do decyzji o nieudostępnianiu narzędzia publicznie. Firma podkreśla, że Vall-E 2 pozostaje projektem badawczym, a jego komercjalizacja nie jest planowana.

Smartfony w naszej ofercie:

Powrót

Właściciel serwisu: TERG S.A. Ul. Za Dworcem 1D, 77-400 Złotów; Spółka wpisana do Krajowego Rejestru Sądowego w Sądzie Rejonowym w Poznań-Nowe Miasto i Wilda w Poznaniu, IX Wydział Gospodarczy Krajowego Rejestru Sądowego pod nr KRS 0000427063, Kapitał zakładowy: 40 618 750 zł; NIP 767-10-04-218, REGON 570217011; numer rejestrowy BDO: 000135672. Sprzedaż dla firm (B2B): dlabiznesu@me.pl INFOLINIA: 756 756 756