Google Docs odczyta Twoje dokumenty na głos. Gemini AI wprowadza funkcję audio

3 godzin temu

Google wprowadziło do Dokumentów funkcję odczytu dokumentów na głos dzięki integracji z Gemini AI. Użytkownicy mogą wybierać spośród różnych głosów, a choćby wbudowywać przyciski audio bezpośrednio w tekst. Funkcja działa jednak (póki co) tylko po angielsku.

Google zapowiedziało nową funkcję w Google Dokumenty, która pozwala na automatyczny odczyt dokumentów dzięki technologii Gemini AI. Rozwiązanie “Listen to this tab” jest dostępne w menu Narzędzia pod opcjami Audio. Użytkownicy mogą wybierać spośród siedmiu różnych stylów głosu: Narrator, Educator, Teacher, Persuader, Explainer, Coach oraz Motivator, a także regulować prędkość odtwarzania.

Funkcja została zaprojektowana z myślą o dwóch grupach użytkowników. Odbiorcy mogą korzystać z pływającego odtwarzacza, który pokazuje czas trwania treści i umożliwia nawigację po dokumencie podczas odtwarzania. Z kolei autorzy dokumentów mogą wbudowywać przyciski audio bezpośrednio w swoje pliki poprzez menu Wstaw > Przyciski audio. Dzięki temu czytelnicy uzyskują dostęp do funkcji odczytu jednym kliknięciem, bez konieczności nawigowania przez system menu.

Google podkreśla, iż technologia wykorzystuje zaawansowane możliwości przetwarzania języka naturalnego Gemini, aby generować “czyste, naturalnie brzmiące głosy”. To znaczący postęp w porównaniu z tradycyjnymi systemami text-to-speech, które często produkują robotyczne lub monotonne brzmienie. System zachowuje również świadomość formatowania dokumentu podczas konwersji tekstu na mowę, co stanowi wyzwanie dla typowych rozwiązań tego typu.

Niestety, funkcja na razie działa wyłącznie z treściami w języku angielskim i tylko na komputerach stacjonarnych. Zgodnie z oficjalną dokumentacją Google, większość funkcji Gemini w Google Dokumenty obsługuje polski język, w tym panel boczny Gemini i generowanie obrazów AI, ale funkcja odczytu audio nie została jeszcze rozszerzona na inne języki. Google nie podało też jeszcze harmonogramu wprowadzenia wsparcia dla języka polskiego ani innych języków, podobnie jak nie zapowiedział wsparcia dla urządzeń mobilnych, ale oba rozwiązania wydają się kwestią czasu.

Idź do oryginalnego materiału