13 сентября 2016, 9:45

Новые графические процессоры на архитектуре NVIDIA Pascal

NVIDIA представила новейшие решения для платформы глубокого обучения на базе архитектуры Pascal - графические ускорители NVIDIA Tesla P4 и P40 и программное обеспечение, которое значительно ускоряет и оптимизирует анализ информации для сервисов, использующих искусственный интеллект (ИИ).

Современные сервисы ИИ, такие, как активируемая голосом помощь, почтовые фильтры спама и движки генерации рекомендуемых фильмов и продуктов, становятся все сложнее. Нейронным сетям, которые для них нужны, требуется в 10 раз больше вычислений по сравнению с нейронными сетями еще год назад. Современные центральные процессоры не способны оперативно реагировать на запросы сервисов ИИ, что не лучшим образом сказывается на возможностях пользователей.

Ускорители Tesla P4 и P40 специально созданы для ускорения операций инференса – применения обученных глубоких нейронных сетей для распознавания речи, изображений и текста в ответ на запрос пользователей или устройств. Основанные на архитектуре Pascal, новые графические процессоры использую специальные инструкции инференса на базе 8-битных (INT8) данных, обеспечивая ответную реакцию в 45 раз быстрее по сравнению с CPU и в 4 раза быстрее по сравнению с GPU, представленными меньше года назад.

Ускорители Tesla P4 отличаются высочайшей экономичностью и предназначены для гипермасштабируемых дата-центров. Благодаря малым размерам и низкому энергопотреблению (от 50Вт), они подходят для любых серверов, что делает их в 40 раз экономичнее центральных процессоров в задачах использования результатов обучения нейронных сетей при обработке данных. Сервер с одним Tesla P4 может заменить 13 серверов на базе CPU, предназначенных для анализа данных, что сокращает общую стоимость владения в 8 раз, включая затраты на сервер и электричество.

Tesla P40 обеспечивает максимальную пропускную способность для задач глубокого обучения. С производительностью в 47 тера-операций в секунду (TOPS) с инструкциями INT8 сервер с восемью ускорителями Tesla P40 может заменить 140 серверов на базе CPU. С учетом средней стоимости одного сервера с CPU порядка $5000, общая экономия составит более $650 000.

“В лице Tesla P100, а теперь и Tesla P4 и P40, компания NVIDIA предлагает единственную комплексную платформу глубокого обучения для дата-центров, раскрывая огромные возможности искусственного интеллекта для решения самого широкого круга задач, - говорит Ян Бак (Ian Buck), директор по ускоренным вычислениям в NVIDIA. – Новые процессоры сокращают время обучения нейронных сетей с нескольких дней до нескольких часов. Они позволяют мгновенно извлечь данные из анализируемых материалов. И они выдают ответы в реальном времени пользователям сервисов ИИ”.

Решения Tesla P4 и P40 дополняют два новых программных продукта, предназначенных для ускорения работы ИИ-сервисов: NVIDIA TensorRT и NVIDIA DeepStream SDK.

TensorRT – это библиотека, созданная для оптимизации моделей глубокого обучения, которая обеспечивает мгновенную ответную реакцию для самых сложных сетей. Она увеличивает пропускную способность и эффективность приложений глубокого обучения путем оптимизации обученных нейронных сетей – обычно в форме 32-битных или 16-битных операций – для операций INT8 пониженной точности.

NVIDIA DeepStream SDK использует мощь сервера на базе решений на архитектуре Pascal для одновременного декодирования и анализа до 93 видеопотоков в разрешении HD в реальном времени, в отличие от семи потоков в случае с серверами на базе двух CPU(6). Это позволяет решить одну из сложнейших задач в области применения искусственного интеллекта: восприятие масштабируемого видеоконтента – что является критически важным для таких областей применения ИИ, как самоуправляемые автомобили, интерактивные роботы, фильтрация и размещение рекламы. Интеграция глубокого обучения в видеоприложения позволит компаниям создавать умные инновационные сервисы, которые раньше были просто невозможны.

Оцените новость:

0 оценок

Последние новости

Технологии | Позавчера, 13:45
Як OPPO розробила стабільне активне шумозаглушення для комфортних вкладишів
Связь | Позавчера, 13:15
Понад 400 тисяч киян вже скористалися 5G від Vodafone
Технологии | Позавчера, 12:45
ЕС объявил тендер на строительство семи гигафабрик ИИ за €30 млрд
Бизнес | Позавчера, 12:15
Кабмін підтримав законопроєкт про податки на посилки з TEMU
Технологии | Позавчера, 11:45
РФ впервые ударила по заводу американского производителя дронов в Киеве
Технологии | Позавчера, 11:15
Росія виходить на польові випробування лазерного комплексу проти дронів
Технологии | Позавчера, 10:45
Податковий номер онлайн: українцям за кордоном спростили процедуру
Бизнес | Позавчера, 10:15
Німеччина та Франція готують промисловий союз для захисту автопрому
Бизнес | Позавчера, 9:45
Казахстан ведет переговоры с Россией о переработке нефти

Еще новости

Последние материалы

Фотогалереи | Вчера, 22:36
ЄЦБ представив 10 фінальних варіантів нових банкнот євро
Обзоры | 29 июля, 7:50
REAL-EL KM-850 – ваш особистий бездротовий караоке-дует
Аналитика | 27 июля, 9:09
Дайджест ключових новин тижня №9 (2026) - EcoFlow анонсує STREAM 5000, а "вбивцю HIMARS" випробують в Україні
Фотогалереи | 26 июля, 10:41
Прогресивна збірка COLORFUL з двома "горячими" новинками
Обзоры | 19 июля, 21:26
ColorWay CW-CHE4W – надкомпактний 3,6 кВт розгалужувач
Обзоры | 19 июля, 18:13
Matrix AGM 12V-26Ah - компактний 26A AGM-акумулятор для резервного живлення
Обзоры | 13 июля, 9:40
EcoFlow Solar Connector Solar Extension Cable - подовжувач для сонячних панелей
Аналитика | 13 июля, 6:58
Дайджест ключових новин тижня №8 (2026) - EcoFlow NextGen зі знижкою 25% та анонс Logitech Mobi Fold
Аналитика | 6 июля, 22:53
Дайджест ключових новин тижня №7 (2026) - знижка на EcoFlow Lightweight та анонс Logitech Spotlight 2