Nvidia może wreszcie pomyślnie prowadzić wideokonferencje

Nvidia może wreszcie pomyślnie prowadzić wideokonferencje

Nvidia wprowadziła nowy oparty na chmurze pakiet oprogramowania do wideokonferencji AI akcelerowanego przez GPU, którego celem jest poprawa jakości strumieniowania wideo i ogólna poprawa jakości wideokonferencji. Nvidia Maxine to natywna w chmurze platforma AI do strumieniowego przesyłania wideo, która umożliwia usługodawcom wprowadzanie nowych funkcji opartych na sztucznej inteligencji do ponad 30 milionów spotkań internetowych, które mają odbywać się każdego dnia. Uruchamiając nową platformę na firmowych procesorach graficznych w chmurze, dostawcy usług wideokonferencji mogą zaoferować użytkownikom nowe efekty AI, w tym korekcję wzroku, super rozdzielczość i usuwanie cieni. hałas, restart twarzy itp. Jedną z najlepszych rzeczy w Nvidia Maxine jest to, że użytkownicy końcowi mogą korzystać ze wszystkich nowych funkcji bez konieczności posiadania specjalistycznego sprzętu, ponieważ dane dotyczące połączeń wideokonferencyjnych są przetwarzane w chmurze, a nie na urządzeniach lokalnych. Wiceprezes Nvidii i dyrektor generalny ds. Accelerated Computing Ian Buck przedstawił dodatkowe informacje na temat nowej platformy firmy w komunikacie prasowym, mówiąc: „Wideokonferencje stały się częścią codziennego życia, pomagając milionom ludzi pracować, uczyć się, bawić, a nawet oglądać doktor. NVIDIA Maxine integruje nasze najbardziej zaawansowane funkcje AI w zakresie dźwięku, wideo i konwersacji, aby zapewnić przełomową wydajność i nowe możliwości platformom, które zapewniają nam wszystkim łączność. "

nvidia maxine

Platforma Nvidia Maxine jest również w stanie radykalnie zmniejszyć przepustowość wymaganą do rozmów wideo, ponieważ oprogramowanie AI analizuje kluczowe punkty twarzy każdej osoby podczas połączenia, a następnie inteligentnie przywraca twarz na filmie. druga strona. Korzystając z nowej technologii kompresji wideo opartej na sztucznej inteligencji, działającej na procesorach graficznych Nvidia, programiści mogą zmniejszyć zużycie przepustowości wideo do jednej dziesiątej wymagań standardu kompresji strumieniowego wideo H. .264. To nie tylko zmniejsza koszty dla dostawców, ale także zapewnia płynniejszą obsługę wideokonferencji, nawet użytkownikom z mniejszą niż idealna szybkością Internetu. Maxine pomoże również uczynić wideokonferencje bardziej zbliżonymi do rozmów twarzą w twarz, ponieważ dostawcy usług będą mogli wykorzystać badania Nvidii nad generatywnymi sieciami kontradyktoryjnymi (GAN) do oferowania szeregu nowych funkcji. Niektóre z nich obejmują wyrównanie twarzy, dzięki któremu ludzie wyglądają, jakby byli zwróceni twarzą do siebie podczas rozmowy, korekcję spojrzenia, która pomaga symulować kontakt wzrokowy, oraz animowane awatary z realistyczną animacją automatycznie sterowaną Twoim głosem i tonem. emocjonalne w czasie rzeczywistym. Dzięki pakietowi Nvidia Jarvis SDK programiści mogą nawet zintegrować wirtualnych asystentów, którzy korzystają z najnowocześniejszych modeli językowych AI do rozpoznawania mowy, rozumienia języka i generowania mowy. Ci wirtualni asystenci mogą także robić notatki, wyznaczać działania i odpowiadać na pytania za pomocą ludzkich głosów. Jednocześnie dodatkowe usługi konwersacyjne AI, takie jak tłumaczenia, napisy dla kodowanych i transkrypcje, pomagają mieć pewność, że uczestnicy wiedzą, o czym mowa w rozmowie. Twórcy sztucznej inteligencji z zakresu widzenia komputerowego, partnerzy oprogramowania, start-upy i producenci komputerów tworzący aplikacje audio i wideo mogą teraz ubiegać się o wcześniejszy dostęp do platformy Nvidia Maxine.