NVIDIA сегодня анонсировала платформу NVIDIA Maxine, которая предоставляет разработчикам облачное GPU-ускоренное программное обеспечение на базе искусственного интеллекта (ИИ) для видеоконференций, созданное для улучшения потокового видео — источника трафика № 1 в интернете.
NVIDIA Maxine - это облачная платформа искусственного интеллекта для потоковой передачи видео, которая позволяет поставщикам услуг использовать новые возможности ИИ для более чем 30 миллионов веб-встреч, проходящих каждый день. Провайдеры видеоконференцсвязи, использующие платформу на графических процессорах NVIDIA в облаке, могут предложить пользователям новые возможности искусственного интеллекта, включая коррекцию взгляда, сверхвысокое разрешение, шумоподавление, повторное освещение лица и другие.
Так как данные обрабатываются в облаке, а не локально, то конечные пользователи могут наслаждаться этими возможностями без специального аппаратного обеспечения.
“Видеоконференции стали частью нашей жизни, помогая миллионам людей работать, учиться и играть, и даже консультироваться у врачей, - говорит Ян Бак (Ian Buck), вице-президент и директор NVIDIA по ускоренным вычислениям. – NVIDIA Maxine объединяет наши самые передовые возможности видео, аудио и разговорного ИИ, чтобы обеспечить революционную эффективность и новые возможности платформ, позволяющих нам всем оставаться на связи.”
Платформа Maxine значительно уменьшает требуемую для видеозвонков полосу пропускания. Вместо потоковой передачи всех пикселей экрана умное программное обеспечение анализирует ключевые черты лица каждого человека, участвующего в звонке, и затем интеллектуально воссоздает лицо с другой стороны. Это позволяет сильно сократить объем данных потокового видео, пересылаемых по Сети туда и обратно.
Используя эту новую технологию сжатия видео на основе ИИ, работающую на графических процессорах NVIDIA, разработчики могут снизить нагрузку на полосу пропускания до одной десятой от требований стандарта сжатия потокового видео H.264. Это сократит расходы для поставщиков и обеспечит более плавную видеоконференцию для конечных пользователей, которые получат еще больше сервисов на базе ИИ при меньшем объеме данных, пересылаемых на компьютеры, планшеты и телефоны.
Новые разработки исследователей NVIDIA, которые будут включены в Maxine, сделают видеоконференцсвязь более похожей на личную беседу. Поставщики услуг видеоконференцсвязи смогут воспользоваться исследованиями NVIDIA в генеративно-состязательных сетях (GAN), чтобы предложить множество новых функций.
Например, функция выравнивания лица позволяет автоматически выравнивать позицию лица таким образом, чтобы казалось, что во время разговора люди смотрят друг другу в лицо, а функция коррекции взгляда помогает имитировать зрительный контакт, даже если камера не совмещена с экраном пользователя. Поскольку объем видеоконференций с начала года увеличился в 10 раз, эти функции помогают людям сосредоточиться на разговоре, а не на камере.
Разработчики также могут добавлять функции, которые позволяют участникам звонка выбирать собственные анимированные аватары с реалистичной анимацией, автоматически управляемой их голосом и эмоциональным тоном в реальном времени. Опция автоматического кадра позволяет видеопотоку отслеживать того, кто говорит в данный момент, даже если он удаляется от экрана.
Используя функции диалогового ИИ на базе SDK NVIDIA Jarvis, разработчики могут интегрировать виртуальных помощников, использующих современные языковые модели ИИ для распознавания речи, понимания языка и генерации речи. Виртуальные помощники могут делать заметки, задавать действия и отвечать на вопросы человеческим голосом. Дополнительные сервисы диалогового ИИ, такие как переводы, субтитры и транскрипция, помогают участникам понять, что обсуждается во время видеоконференции.
Спрос на видеоконференцсвязь трудно предсказать на определенный момент времени, если к звонку будут пытаться присоединиться сотни или даже тысячи пользователей. NVIDIA Maxine использует микросервисы ИИ, работающие в кластерах контейнеров Kubernetes на графических процессорах NVIDIA, чтобы помочь разработчикам масштабировать свои услуги в соответствии с текущими потребностями. Пользователи могут запускать несколько функций ИИ одновременно, совершенно не превышая требований приложений по задержкам.
Поставщики услуг видеоконференций могут использовать Maxine, чтобы предоставить передовые возможности ИИ сотням тысяч пользователей, выполняя инференс на графических процессорах NVIDIA в облаке. Модульная конструкция платформы Maxine позволяет разработчикам легко выбирать возможности ИИ для интеграции в свои решения для видеоконференцсвязи.
Платформа Maxine объединяет технологии из нескольких SDK NVIDIA и API. В дополнение к NVIDIA Jarvis, платформа Maxine также использует SDK NVIDIA DeepStream для высокоскоростной потоковой передачи аудио и видео и SDK NVIDIA TensorRTTM для высокопроизводительного инференса.
Возможности искусственного интеллекта для аудио, видео и естественного языка в SDK NVIDIA, используемом в платформе Maxine, были разработаны в ходе сотен тысяч учебных часов на системах NVIDIA DGXTM - ведущей в мире платформе для обучения, инференса и обработки данных.
Разработчики ИИ-приложений компьютерного зрения, партнеры по программному обеспечению, стартапы и производители компьютеров, создающие аудио- и видео-приложения и сервисы, могут подать заявку на ранний доступ к платформе NVIDIA Maxine.
Последние новости
- Бизнес | Сегодня, 9:45
У Польщі назвали головну проблему при працевлаштуванні іноземців. - Бизнес | Сегодня, 9:15
Львів матиме пряме залізничне сполучення з Кишиневом - Безопасность | Сегодня, 8:45
На Львівщині викрили контрабанду електронок на 24 млн гривень - Бизнес | Сегодня, 8:15
Топ-5 різдвяних ярмарків Європи, які варто відвідати - Технологии | Вчера, 15:29
У Міноборони Канади підтвердили передачу ППО NASAMS - Бизнес | Вчера, 14:24
В США хотят вынудить Google продать свой браузер Chrome - Связь | Вчера, 13:15
Vodafone пропонує абонентам три місяці безплатного домашнього інтернету - Гаджеты | Вчера, 12:45
Официальный анонс Razer Kraken V4 Pro - Железо | Вчера, 12:15
Напольные весы Scarlett SC-BS33E028 – контроль веса с идеальной точностью
Последние материалы
- Фотогалереи | 17 ноября, 19:41
Як виглядає аеропорт Луксор, Єгипет - Обзоры | 17 ноября, 12:43
Maxxter MX-CHR-1224V25M – інтелектуальний зарядний пристрій для АКБ - Обзоры | 10 ноября, 22:23
Maxxter MX-TST-1224 - протестує будь-який акумулятор - Обзоры | 5 ноября, 23:02
Gelius GP-PK008 - дитячий 4G-смартгодинник з персоналізацією - Обзоры | 3 ноября, 20:01
be quiet! Pure Wings 3 140 – 140-мілліметровий вентилятор для прогресивних систем - Обзоры | 27 октября, 20:58
Gelius Nexus Magnetic Wireless Charge GP-PBW100i – бездротовий 15Вт повербанк - Обзоры | 26 октября, 15:28
Gelius GP-FK001 – ліхтарик - брелок за 149 гривень - Обзоры | 22 октября, 13:04
RIVACASE 7661 – практично "армійський" рюкзак для великого міста - Фотогалереи | 16 октября, 13:29
Важкий бомбардувальний дрон використовують наші воїни проти окупанта
Популярные новости
- Бизнес | 19 ноября, 14:15
Знижки на Black Friday з OPPO AED Україна 5.00 - Технологии | Вчера, 11:45
ViewSonic зміцнює позиції лідера серед світових брендів інтерактивних дисплеїв 5.00 - Бизнес | 19 ноября, 13:45
Binance оголошує про партнерство з брендом Battery 5.00 - Бизнес | Сегодня, 9:45
У Польщі назвали головну проблему при працевлаштуванні іноземців. 0.00 - Бизнес | Сегодня, 9:15
Львів матиме пряме залізничне сполучення з Кишиневом 0.00 - Безопасность | Сегодня, 8:45
На Львівщині викрили контрабанду електронок на 24 млн гривень 0.00 - Бизнес | Сегодня, 8:15
Топ-5 різдвяних ярмарків Європи, які варто відвідати 0.00 - Технологии | Вчера, 15:29
У Міноборони Канади підтвердили передачу ППО NASAMS 0.00 - Бизнес | Вчера, 14:24
В США хотят вынудить Google продать свой браузер Chrome 0.00