На этой неделе в Сан-Хосе проходит ежегодная конференция NVIDIA по GPU-технологиям.
7000 участников, 600 технических сессий, 150 стендов, 310 сессий по искусственному интеллекту и 67 лабораторий по технологиям глубокого обучения (Deep Learning).
Сегодня, в рамках выступления CEO NVIDIA Дженсена Хуанга, были представлены новая архитектура графических процессоров NVIDIA Volta и серия аппаратно-программных решений, призванных ускорить и упростить работу с искусственным интеллектом.
Архитектура NVIDIA Volta – Volta – это самая мощная в мире архитектура GPU, призванная стать катализатором новой волны достижений в области искусственного интеллекта и высокопроизводительных вычислений. Первый процессор на базе Volta – это GPU для дата-центров Tesla V100, который обеспечивает сверхвысокую скорость и масштабируемость обучения и инференса глубоких нейронных сетей, а также ускоряет высокопроизводительные и графические вычисления.
В основе Volta, седьмого поколения графических архитектур NVIDIA, находится 21 млрд транзисторов, обеспечивающих производительность задачах в глубокого обучения, эквивалентную 100 CPU. Пиковая производительность Volta в 5 раз выше архитектуры Pascal - текущей графической архитектуры NVIDIA, и в 15 раз выше Maxwell, представленной два года назад. Эта цифра вчетверо больше того, что предсказывал закон Мура.
Volta станет новым стандартом высокопроизводительных вычислений. Благодаря объединению ядер CUDA® и нового ядра Volta Tensor в унифицированной архитектуре, один сервер на базе GPU Tesla V100 сможет заменить сотни центральных процессоров в высокопроизводительных вычислениях.
Ключевые технологии GPU Tesla V100,которые позволили преодолеть 100-терафлопсный рубеж в задачах глубокого обучения:
• Специализированные ядра Tensor, созданные для ускорения работы искусственного интеллекта. Оснащенный 640 ядрами Tensor, процессор V100 обеспечивает производительность 120 терафлопс в глубоком обучении, что эквивалентно производительности 100 CPU.
• Новая архитектура GPU с более чем 21 млрд транзисторов. Она объединяет ядра CUDA и Tensor в рамках унифицированной архитектуры, обеспечивая производительность суперкомпьютера для ИИ в одном GPU.
• NVLink™ поднимает на новый уровень высокоскоростной интерфейс между графическими процессорами и между графическим и центральным процессорами, вдвое увеличивая пропускную способность по сравнению с предыдущим поколением NVLink.
• Память 900 ГБ/с HBM2 DRAM, разработанная совместно с Samsung, увеличивает полосу пропускания на 50% по сравнению с предыдущим поколением.
• Оптимизированное под Volta программное обеспечение, включая CUDA, cuDNN и TensorRT™, которое ведущие фреймворки и приложения для ускорения ИИ и исследований могут взять на вооружение.
Подробнее об архитектуре NVIDIA Volta - https://devblogs.nvidia.com/parallelforall/inside-volta/.
Новые DGX системы на базе Volta – Анонсирована новая линейка суперкомпьютеров с искусственным интеллектом NVIDIA DGX AI с исключительными вычислительными возможностями. Системы построены на GPU NVIDIA Tesla V100 на базе новой архитектуры Volta и используют полностью оптимизированное для задач ИИ программное обеспечение. Производительность такой системы втрое выше, чем у предыдущего поколения DGX, и соответствует мощности примерно 800 CPU в рамках всего одной системы.
Платформа NVIDIA GPU Cloud – NVIDIA GPU Cloud (NGC) – это облачная платформа, которая предоставляет разработчикам удобный доступ — с помощью ПК, системы DGX или облака — к полноценному программному набору инструментов внедрения ИИ. Благодаря NGC разработчики смогут легче получать доступ к новейшим оптимизированным фреймворкам и передовым ускорителям.
Сотрудничество с Toyota – Toyota начнет внедрение автомобильной вычислительной платформы с поддержкой искусственного интеллекта NVIDIA DRIVE™ PX в системы автономного вождения, запланированные к выводу на рынок в течение ближайших лет. Команды инженеров обеих компаний уже работают над созданием программного обеспечения на высокопроизводительной ИИ-платформе NVIDIA, которое позволит лучше понимать огромные объемы данных, получаемых с автомобильных датчиков, и автономно справляться с широким спектром ситуаций на дороге.
Для того чтобы справляться с задачами подобного уровня вычислительной сложности, в прототипах автомобилей зачастую используют мощные компьютеры, которые занимают весь багажник. Платформа NVIDIA DRIVE PX на базе процессора нового поколения Xavier легко помещается в руке, обеспечивая при этом 30 млрд операций глубокого обучения в секунду.
SAP Brand Impact – Проект SAP Brand Impact на базе решений NVIDIA для глубокого обучения измеряет атрибуты бренда (например, логотипы) практически в реальном времени. Эффективный анализ видеоконтента стал возможен благодаря использованию для анализа глубоких нейросетей, обученных на NVIDIA DGX-1 и TensorRT.
Isaac Robotics Simulator – В нашем новом имитаторе роботов по имени Isaac применяются сложные игровые и графические технологии, чтобы быстро и эффективно обучать машины в сымитированных условиях реального мира. NVIDIA также представила набор референсных платформ на базе NVIDIA Jetson™, которые позволят ускорить процесс создания умных машин.