Zdaniem eksperta
Firma Google ogłosiła dużą aktualizację dla swojego projektu sztucznej inteligencji - Gemini 1.5 Pro. W jaki sposób zmiany wpłyną na działanie narzędzia? Czy AI zyska nowe rewolucyjne funkcje?
Google Gemini jest zaawansowanym modelem sztucznej inteligencji Google. Technologia została zaprojektowana w taki sposób by jednocześnie i zarazem szybko przetwarzać wiele rodzajów danych. Dzięki temu AI jest w stanie radzić sobie ze złożonymi zadaniami w różnych dziedzinach.
Według najnowszych informacji, które udostępniło The Verge, nowa aktualizacja umożliwi słuchanie i rozumienie zawartych w plikach audio nagrań, bez dodatkowych źródeł danych, np. bez pisemnych transkrypcji audycji. Ta zmiana przyniesie ze sobą bardzo wiele, nowych możliwości. AI będzie potrafiło przetworzyć pliki dźwiękowe, filmy czy rozmowy biznesowe, a następnie wykorzystać do dalszych działań, np. w postaci przygotowania podsumowania z nagrania. Jest to kolejny krok w szybszym uczeniu się sztucznej inteligencji.
Firma Google poinformowała na wydarzeniu Google Next o aktualizacjach innego modelu AI, Imagen 2. Jest to technologia, która generuje obraz na podstawie tekstu. Według zapowiedzi wprowadzone zostaną funkcję inpainting oraz outpainting, które umożliwią dodawanie lub usuwanie elementów obrazu.
Zdjęcia zmienione przez nowe funkcje mają zostać oznaczone niewidzialnym dla oka znakiem wodnym, tak by można było je zidentyfikować.