краткий анализ эффективности GPU — i2HARD
Статьи
Евгений Серов
24 июня 2020
Первые 3D-видеокарты появились 25 лет назад, и с тех пор их мощность и сложность выросли в таком масштабе, как ни один другой чип компьютера. В те времена графические процессоры были меньше 100 мм2 размером, имели около 1 миллиона транзисторов и потребляли всего несколько ватт энергии.
Сегодня же типичная видеокарта может иметь 14 миллиардов транзисторов на кристалле размером 500 мм2 и потреблять более 200 Вт энергии. Возможности этих бегемотов будут неизмеримо больше, чем у их древних предшественников, но стали ли они эффективнее со всеми этими транзисторами и ваттами энергии?
Сказка о Двух Числах
В этой статье мы рассмотрим, насколько хорошо разработчики GPU смогли воспользоваться увеличением размеров кристалла и энергопотребления, чтобы предложить нам больше вычислительной мощности. Прежде чем идти дальше, вы можете освежить в памяти устройство видеокарты или пройтись по истории современного GPU.
Чтобы понять, как менялась эффективность графического процессора, и менялась ли вообще, мы использовали отличную базу данных TechPowerUp, выбрав образцы процессоров за период последних 14 лет. Такой период обусловлен тем, что именно 14 лет назад GPU перешли на унифицированную структуру шейдеров.
Вместо того чтобы выделять отдельные вычислительные блоки процессора для обработки треугольников и пикселей, унифицированные шейдеры являются арифметическими логическими единицами, предназначенными для любых вычислений, связанных с трехмерной графикой. Благодаря этому, мы можем последовательно замерить относительную производительность каждого GPU по параметру количества его операций с плавающей точкой в секунду (FLOPS – FLoating-point Operations Per Second).
AMD использует унифицированную шейдерную архитектуру почти 12 лет
Вендоры часто стараются указывать значения FLOPS в качестве показателя максимальной производительности GPU. И хотя на самом деле это далеко не единственный показатель, определяющий скорость работы графического процессора, FLOPS дает нам цифры, с которыми мы можем работать.
То же касается и размеров кристалла, означающего рабочую площадь чипа. Однако чипы могут быть одинаковы по размеру, но сильно отличаться по количеству транзисторов.
Например, процессор Nvidia G71 (GeForce 7900 GT) 2005 года имеет размер 196 мм2 и имеет 278 миллионов транзисторов, а TU117, выпущенный в начале прошлого года (GeForce GTX 1650), всего лишь на 4 мм2 больше, но в нём 4,7 миллиарда этих маленьких переключателей.
Диаграмма основных GPU Nvidia, показывающая изменения в плотности транзисторов за последние годы
Источник изображения: techspot.com
Естественно, из этого следует, что современные транзисторы намного меньше, чем в старых чипах, и это очень важно. Так называемый технологический процесс – общая разрешающая способность при изготовлении процессора, – используемый производителями оборудования, с годами менялся и постепенно становился все меньше и меньше.
Пожалуй, самым спорным показателем, который мы будем использовать, является показатель энергопотребления GPU. Многие читатели отнесутся скептически, ведь мы используем значение теплопакета (TDP), заявленное производителем. На самом деле это значение отражает (или, по крайней мере, должно отражать) количество тепла, выделяемого в среднем всей видеокартой при высокой нагрузке.
Потребляемая кремниевыми чипами энергия действительно в основном превращается в тепло, но проблема использования TDP не в этом. Дело в том, что разные вендоры указывают это число при разных условиях, не обязательно во время пиковых FLOPS. Кроме того, это значение мощности для всей видеокарты в целом, включая встроенную память, а не только для основного её потребителя – собственно GPU. Можно измерить энергопотребление видеокарты напрямую, как это делали, например, TechPowerUp для своих обзоров GPU.
Но всё-же мы решили учитывать показатель TDP в нашем анализе ради простоты и удобства, условившись весьма осторожно делать любые выводы касаемо производительности, основанные исключительно на её зависимости от номинальной тепловой мощности.
Сейчас мы проведем прямое сравнение по двум показателям: GFLOPS и плотность кристалла. Один GFLOPS равен 1000 миллионам операций с плавающей точкой в секунду, и мы имеем дело со значением для вычислений одинарной точности (FP32), выполняемых исключительно унифицированными шейдерами. Наше сравнение примет форму графика:
Источник изображения: techspot.com
Ось X отображает GFLOPS на единицу TDP – чем больше, тем лучше. Чем меньше, тем нерациональней используется энергопотребление. То же справедливо для оси Y, где у нас GFLOPS на единицу плотности кристалла. Чем больше транзисторов удастся поместить на один квадратный мм, тем выше получится производительность. Таким образом, общая эффективность работы GPU (учитывая количество транзисторов, размер кристалла и TDP) возрастает по мере приближения к правому верхнему углу графика.
Все значения в районе верхнего левого угла в основном говорят о том, что «благодаря вычислительной мощности кристалла, этот GPU обеспечивает хорошую производительность, но за
счет использования относительно большого количества энергии». Идем к правому нижнему углу, и там у нас будут GPU, которые «очень энергоэффективные, но сравнительно слабенькие».
Короче говоря, мы оцениваем эффективность работы GPU исходя из его потребляемой мощности пропорционально количеству транзисторов.
Эффективность GPU: TDP vs количество транзисторов
Церемониться мы не будем, вот результаты:
Источник изображения: techspot.com
Но некоторые результаты представляют особый интерес. Прежде всего, это TU102 и GV100. Оба чипа сделаны Nvidia и используются в видеокартах GeForce RTX 2080 Ti и Titan V, соответственно.
Можно возразить, что ни один из них не был разработан для общепотребительского рынка. Особенно это касается GV100, поскольку он действительно предназначен для рабочих станций и вычислительных серверов. Поэтому, хотя они и являются самыми эффективными из всех процессоров, но они предназначены для специализированных рынков и стоят намного дороже стандартных.
Еще один GPU, который выделяется как белая ворона – это GP108. Этот чип от Nvidia чаще всего встречается в GeForce GT 1030 – недорогом продукте, выпущенном в 2017 году, и имеющем очень маленький размер. Процессор размером всего 74 мм2 с TDP всего 30 Вт.
Графический процессор Nvidia G80. Источник
По другую сторону от GP108 находится чип AMD Fiji, который использовался в серии Radeon R9 Fury. Это получилось не слишком энергоэффективное решение, особенно учитывая, что использование HBM-памяти должно было помочь в этом отношении. Фиджи сильно греется, что плохо сказывается на экономичности полупроводников из-за возросшей утечки. Именно здесь потребляется электрическая энергия, а не в схеме как таковой. Все чипы имеют токи утечки, но с температурой скорость потерь увеличивается.
Но самым интересным моментом является, пожалуй, Navi 10. Это новейший GPU от AMD, производимый TSMC на их передовом 7-нм техпроцессе. В то же время, Vega 20 произведён на том же техпроцессе почти два года назад, но выглядит более эффективным. В чём же дело?
Под этими вентиляторами стоит GPU Vega 20. Источник
Vega 20 (AMD использовала его только в одной потребительской видеокарте – Radeon VII) был последним процессором, созданным AMD в архитектуре GCN (Graphics Core Next). Она объединяет огромное количество унифицированных шейдерных ядер в единый узел, в котором основное внимание уделено формату FP32. Однако программирование устройства для достижения этой производительности было нелегким делом, и ему не хватало гибкости.
Navi 10 использует новейшую архитектуру RDNA, которая решает эту проблему. Решение новое, созданное на относительно новом техпроцессе, поэтому можно ожидать повышения эффективности по мере того, как TSMC развивает свой техпроцесс, а AMD обновляет архитектуру.
Если брать во внимание только массовые продукты, то наиболее эффективные GPU на нашем графике – это GP102 и GP104. Это чипы Nvidia на архитектуре Pascal и мы найдём их в таких видеокартах как GeForce GTX 1080 Ti, GTX 1070 и GTX 1060. Рядом с GP102, не обозначенный меткой, расположился TU104. Это новейший Turing-чип от Nvidia, устанавливаемый в линейку GeForce RTX: 2060, 2070 Super, 2080, 2080 Super и многие другие.
Обзор и тестирование видеокарты MSI GeForce GTX 1080 Ti GAMING X TRIO
Они также изготовлены TSMC, но с использованием техпроцесса, специально разработанного для продуктов Nvidia, называемого 12FFN, который сам по себе является усовершенствованной версией 16FF.
Улучшения направлены на увеличение плотности кристалла при одновременном уменьшении утечек. Этим, возможно, объясняется то, что процессоры Nvidia выглядят более эффективными.
Эффективность GPU: TDP vs площадь кристалла
Если не учитывать техпроцесс, и вместо количества транзисторов на кристалле использовать в анализе лишь площадь кристалла, то мы увидим совершенно иную картину…
На этом графике эффективность увеличивается так же, но теперь мы видим, что некоторые ключевые позиции поменялись местами. TU102 и GV100 «осыпались», тогда как Navi 10 и Vega 20 подпрыгнули. Это связано с тем, что первые два процессора представляют собой огромные чипы (754 мм2 и 815 мм2), тогда как последние два от AMD намного меньше (251 мм2 и 331 мм2).
Оставим на графике только самые последние разработки, чтобы подчеркнуть различия:
Становится очевидным, что AMD пренебрегает энергоэффективностью в пользу уменьшения размеров кристалла.
Другими словами, AMD хотят получить больше GPU чипов с каждой произведённой кремниевой пластины, в то время как Nvidia, похоже, придерживается стратегии увеличения энергоэффективности каждого чипа в ущерб его размеру и, соответственно, стоимости изготовления (чем больше чип, тем меньше их можно разместить на одной пластине).
Продолжат ли AMD и Nvidia впредь следовать выбранным стратегиям? Первые уже заявили, что в RDNA 2.0 они намерены на 50% улучшить соотношение «производительность на ватт», поэтому мы ждём их новые GPU дальше справа, по нашему графику. А что насчет Nvidia?
А они, к сожалению, печально известны своей молчаливостью относительно своих планов. Но известно, что их новые процессоры будут производить TSMC и Samsung на том же техпроцессе, который использовался для Navi. Были некоторые заявления о том, что мы увидим значительное снижение энергопотребления, и в то же время большое увеличение количества унифицированных шейдеров. Поэтому, судя по всему, Nvidia также не нарушит тенденций на нашем графике.
Так как же повышалась эффективность GPU?
Вышесказанное довольно убедительно показало, что за прошедшие годы AMD и Nvidia повысили производительность на единицу плотности кристалла и на единицу TDP. Иногда рывки в производительности были впечатляющими…
Взять к примеру Nvidia G92 и TU102. Первый из них это сердце GeForce 8800 GT и 9800 GTX, на его кристалле площадью 324 мм2 размещено 754 миллиона транзисторов. Когда он появился в октябре 2007 года, он был высоко оценен за свою производительность и экономичность.
Через одиннадцать лет Nvidia предложила нам TU102 в виде GeForce RTX 2080 Ti. Этот процессор имеет почти 19 миллиардов транзисторов на площади 754 мм2 – то есть, в 25 раз больше микроскопических компонентов на поверхности, которая лишь в 2,3 раза больше.
Всё это не было бы возможным без усилий TSMC по совершенствованию своей производственной технологии. G92 в 8800 GT был построен на 65-нм техпроцессе, тогда как для производства новейшего TU102 используется специальный масштаб 12FFN. Названия этих методов производства на самом деле ничего не говорят нам о разнице между ними, но зато говорят показатели GPU. Плотность кристалла у нового процессора –24,67 миллиона транзисторов на мм2, тогда как у старого – 2,33 млн.
Более чем десятикратное увеличение плотности кристалла в основном и обуславливает огромную разницу в эффективности двух GPU. Меньшие логические блоки требуют меньше энергии для работы, а сокращение длины проводников между ними увеличивает и скорость обмена данными. Наряду с улучшением производства кремниевых чипов (уменьшение количества дефектов и совершенствование изоляции), всё это приводит к возможности работать на более высоких тактовых частотах при той же мощности, или наоборот – использовать меньшее энергопотребление при той же тактовой частоте.
Процессор AMD Vega 10 с двумя чипами HBM-памяти по 4 Гб слева.
Кстати о частотах. Давайте сравним RV670 от ноября 2007 года в Radeon HD 3870 с Vega 10 в Radeon RX Vega 64, выпущенной в августе 2017 года.
Первый имеет фиксированную тактовую частоту около 775 МГц, тогда как последний имеет как минимум три доступные частоты:
- 850 МГц – при обычной работе на компьютере, 2D-обработка.
- 1250 МГц – для сложных 3D-задач (базовая частота, «base clock»)
- 1550 МГц – для переменных легких/средних 3D-нагрузок («boost clock»)
Мы говорим «как минимум», потому что видеокарта динамически изменяет свою тактовую частоту и потребляемую мощность, между вышеуказанными значениями, в зависимости от текущей рабочей нагрузки и рабочей температуры. Это сегодня мы воспринимаем это как само собой разумеющееся, но 13 лет назад такого управления частотами просто не существовало. Оно, правда, никак не влияет на результаты наших анализов эффективности, поскольку мы брали только пиковую производительность обработки (т. е. на максимальных частотах), но оно влияет на оценку работы карты в глазах потребителя.
Но самым главным поводом постоянного повышения эффективности GPU в течение многих лет послужили изменения в использовании процессора как такового. В июне 2008 года лучшие суперкомпьютеры в мире были оснащены центральными процессорами от AMD, IBM и Intel; спустя одиннадцать лет к этой компании присоединился ещё один производитель: Nvidia.
Nvidia Tesla P100 с процессором GP100
Их процессоры GV100 и GP100 были разработаны почти исключительно для вычислительного сегмента рынка, в них заложено множество ключевых архитектурных функций, и многие из них очень похожи на CPU. Например, их внутренняя память (кэш) напоминает типичный серверный CPU:
- Регистровый файл (register file) на 1 SM = 256 кБ
- L0 кэш на 1 SM = 12 кБ инструкции
- L1 кэш на 1 SM = 128 кБ инструкции/данные
- L2 кэш на GPU = 6 МБ
Для сравнения: Intel Xeon E5-2692 v2, который использовался во многих вычислительных серверах:
- L1 кэш на ядро = 32 кБ инструкции/данные
- L2 кэш на ядро = 256 кБ
- L3 кэш на CPU = 30 МБ
Логические блоки внутри современного GPU поддерживают ряд форматов данных; некоторые имеют специализированные блоки для целочисленных вычислений, вычислений с плавающей точкой и матриц, в то время как другие имеют сложные структуры сразу для всех видов вычислений. Блоки соединены с кэшем и внутренней памятью широкими высокоскоростными интерконнектами. Безусловно, все эти нововведения положительно сказываются на обработке 3D-графики, но для большинства игр они избыточны. Но такие GPU разрабатывались не только для графики, а для более широкого спектра рабочих нагрузок, и для них есть специальное название: GPU общего назначения (GPGPU).
Machine Learning и Data Mining – это те две области, которые извлекли наибольшую выгоду из разработки GPGPU и поддерживаемых пакетов программного обеспечения и API (например, CUDA от Nvidia, FireStream от AMD, а также OpenCL), поскольку они объединяют в себе множество сложных массивно-параллельных вычислений.
Большие GPU, с тысячами унифицированных шейдерных блоков, идеально подходят для таких задач, и AMD с Nvidia (а теперь ещё и Intel присоединяется к их веселью) вкладывают миллиарды
долларов в разработку чипов, обеспечивающих все более высокую вычислительную производительность.
Первая дискретная видеокарта Intel за последние 20 лет. Превью видеокарт Intel Xe, часть 2
На данный момент обе компании разрабатывают универсальные архитектуры для своих GPU, которые могут использоваться в различных секторах рынка, как правило избегая создания полностью специфичных решений отдельно для графики и отдельно для вычислений. Это связано с тем, что основная часть прибыли от производства GPU по-прежнему поступает от продажи 3D-видеокарт, но уже неясно, сохранится ли такое положение дел в дальнейшем. Поскольку спрос на compute-мощности продолжает расти, вполне возможно, что AMD или Nvidia начнут выделять больше своих ресурсов на повышение эффективности чипов для этих рынков и меньше – на рендеринг.
Но что бы ни случилось дальше, мы знаем одно: на следующем этапе высокопроизводительные GPU с миллиардами транзисторов по-прежнему будут чуточку эффективнее своих предшественников. И это хорошая новость, независимо от того, кто это делает и для чего.
По материалам Techspot.com
Техпроцесс видеокарты что это такое и на что он влияет?
Привет, друзья! Возможно, погружаясь в тематику компьютерного железа, вы встречали такое понятие как техпроцесс видеокарты, что это такое, на что влияет и какой из них лучший, расскажу в сегодняшней публикации. Все готово, поехали.)
Где там транзисторы
Любой процессор состоит из огромного количества микроскопических транзисторов – что ЦП, что графический чип. Однако транзисторы здесь не совсем привычные – например, не такие, как в радиоприемнике. Реализованы они на куске кремния, из которого состоит процессор.
Сегодня размеры этих компонентов измеряются уже в нанометрах – одной миллиардной части метра – например, 40 нм, 22 нм или 16 нм. Чем меньше цифра, тем тоньше техпроцесс и тем больше транзисторов умещается на той же площади кристалла.
Вообще, техпроцессом называется совокупность действий оборудования по изготовления какой-либо детали, в нашем случае микросхемы. Однако применительно к процессорам и графическим чипам такое обозначение – разрешение печатного оборудования, которое создает компоненты на поверхности кристалла.
Как узнать техпроцесс конкретной детали? Он всегда указан в сопроводительной документации.
Однако учитывайте, что во многих интернет-магазинах, в характеристиках товара этого параметра нет, поэтому при заказе комплектующих, необходимо уточнять детали у консультанта. Как вариант, можно узнать эту информацию на официальном сайте производителя.
Влияние техпроцесса
Технологии делаются все совершеннее, позволяя уменьшить техпроцесс, увеличив тем самым количество транзисторов на одной и той же площади. Что значит это в практическом плане?Увеличение количества транзисторов позволяет увеличить количество логических блоков и тем самым производительность процессора при тех же физических размерах. Как вариант, можно не изменять количество транзисторов, но уменьшить размеры компонента.
При уменьшении размеров транзисторов, снижается тепловыделение и энергопотребление. Благодаря этому, можно увеличить количество ядер процессора без риска перегрева, что негативно сказывается на производительности. Особенно это актуально для лэптопов и планшетов – да, в крутых моделях тоже установлены видеокарты, созданные по тому же принципу.
Переход на новый, более совершенный техпроцесс, требует от производителя железа проведения фундаментальных исследований, разработки нового оборудования, его создания и обкатки.
По этой причине новые модели центральных и графических процессоров стоят чрезвычайно дорого. Но за то, чтобы быть на гребне волны прогресса, никаких денег не жалко, не правда ли?
Также хочу акцентировать внимание на том, что обкатка нового техпроцесса происходит не сразу, и поэтому первые партии новых комплектующих могут получиться откровенно неудачными.
При увеличении площади кристалла, сложность только возрастает. Увы, лепить многоядерные процессоры по новой технологии вот так «с лету», не получится – никто не хочет работать себе в убыток и разбираться потом с возмущенными покупателями.
Дальнейшие перспективы
Некоторые из вас, вероятно, подумали, что развитие технологий – дело времени, и техпроцесс можно уменьшать до бесконечности. Увы, это не совсем верно. Физические свойства материи имеют определенные рамки, и со временем настанет тот предел, меньше которого создавать транзисторы, попросту не получится.Вот только каким будет их размер и когда это будет – пока не совсем понятно. Вполне вероятно, что к тому времени изобретут какую-нибудь принципиально иную технологию, а процессоры на основе кремниевого кристалла канут в Лету, как это случилось с ламповой электроникой.
Надеюсь, исходя из вышеизложенного, вам уже понятен ответ на вопрос: 14 нм или 28 нм — что лучше. Если я не вполне понятно излагал свои мысли, то лучше 14 нм, однако стоят, созданные по такому техпроцессу компоненты, дороже.
А вообще, чтобы разобраться, какой девайс вам лучше купить при сборке или апгрейде компа, советую ознакомиться с публикациями «Из чего состоит современная видеокарта для ПК» и «Правильный выбор видеокарты по параметрам для компьютера». О том, где лучше покупать комплектующие для системного блока, вы можете почитать здесь.
В качестве возможного варианта, советую обратить внимание на видеокарты серии 1060 – например, ASUS GeForce GTX 1060 DUAL OC [DUAL-GTX1060-O3G]. За приемлемую цену вы сможете с комфортом обрабатывать видеоролики и запускать новые игры (правда, некоторые из них не на максимальных, а на средних настройках качества графики). На ближайшие несколько лет такого девайса, вам хватит с головой, я это гарантирую.
На этом я с вами прощаюсь. Не забудьте поставить лайк репосту этой статьи в социальных сетях. Также подпишитесь на новостную рассылку, чтобы быть в курсе последних обновлений моего чрезвычайно полезного блога.
С уважением, Андрей Андреев
Nvidia представляет графический процессор GeForce RTX 3080 с 28 миллиардами транзисторов. Зарегистрируйтесь здесь.
Nvidia представила свои 28-миллиардные графические чипы Ampere серии 30 для геймеров. Новые чипы укрепят возможности компьютерных игр, как раз в тот момент, когда на праздники появятся консоли нового поколения от Microsoft и Sony.
В мае компания из Санта-Клары, штат Калифорния, представила архитектуру своего графического процессора (GPU) Ampere. Но она построила первый чип A100 с 54 миллиардами транзисторов — двухпозиционными переключателями, которые являются строительными блоками всех электронных вещей — для искусственного интеллекта, научных вычислений, облачной графики и анализа данных. Теперь вариант чипа, на котором будут работать будущие суперкомпьютеры, поднимет 3D-графику в компьютерных играх на новый уровень.
Три новых игровых чипа — GeForce RTX 3070, 3080 и 3090 — будут продаваться по цене 500, 700 и 1500 долларов соответственно и будут включать RTX второго поколения или графику с трассировкой лучей в реальном времени. Nvidia представила трассировку лучей в реальном времени два года назад с RTX первого поколения, и игры начали ее внедрять. Технология RTX значительно повысила реалистичность теней, отражений и освещения в играх. Хотя разработчики игр сначала не были к этому готовы, Хуанг сказал, что сейчас в разработке находятся сотни игр RTX. Такие игры, как Minecraft, Control и Wolfenstein 3D: Youngblood, уже поддерживают RTX.
Nvidia заявила, что чипы на базе Ampere обеспечат производительность 3D-графики, которая в два раза выше по производительности, чем архитектура Turing предыдущего поколения, и в 1,9 раза более энергоэффективна.
Событие
Саммит GamesBeat 2023
Присоединяйтесь к сообществу GamesBeat в Лос-Анджелесе с 22 по 23 мая. Вы услышите самые яркие умы игровой индустрии, которые поделятся своими новостями о последних разработках.
Зарегистрируйтесь здесь
«Это величайший прыжок из поколения в поколение, который мы когда-либо совершали», — сказал на брифинге для прессы генеральный директор Дженсен Хуанг, известный своими преувеличениями. «Если последние 20 лет были потрясающими, то следующие 20 покажутся ничем иным, как научной фантастикой».
Хуанг сказал, что Fortnite, популярная игра в жанре «королевская битва» с 350 миллионами пользователей, включит функции трассировки лучей RTX в реальном времени для улучшения графического реализма, таких как отражения, тени, глобальное освещение и окружающее затенение.
Новые функции для геймеров
Кроме того, Хуанг продемонстрировал технологию Nvidia Reflex, позволяющую дисплеям работать на более высоких скоростях, что позволяет геймерам быстрее реагировать. Reflex уменьшает задержку или задержки взаимодействия до 50%. Он также продемонстрировал Omniverse Machinima, которая позволяет игрокам рассказывать истории с анимацией в реальном времени. И он представил бесплатную Nvidia Broadcast, которая позволяет без проблем транслировать игры.
В демонстрации Nvidia Reflex в онлайн-шутере Valorant от Riot Games Хуан показал сценарий, в котором противник, перемещающийся со скоростью 1500 пикселей в секунду, виден только в течение 180 миллисекунд. Но у типичного геймера время реакции составляет 150 миллисекунд — от фотона до действия.
«Вы можете поразить противника только в том случае, если ваш компьютер добавит менее 30 миллисекунд», — сказал Хуанг.
Но у многих геймеров есть машины и дисплеи с задержкой до 100 миллисекунд. Nvidia Reflex уменьшит задержку до 50 миллисекунд. Это может помочь таким игрокам, как я, быстрее реагировать в экшн-играх, таких как Call of Duty: Warzone.
Графические процессоры серии 30
Графические процессоры серии 30 могут обрабатывать 30 терафлопс обработки шейдеров, 58 терафлопс обработки ядра RT и 238 терафлопс обработки ядра Tensor. Это в два раза увеличивает производительность по сравнению с предыдущим поколением, а также позволяет обрабатывать такие функции, как DLSS (супервыборка с глубоким обучением), которая использует ИИ для более эффективного заполнения деталей и обработки обработки. Предыдущее поколение могло обрабатывать 11 терафлопс обработки шейдеров, 34 терафлопс обработки ядра RT и 89 терафлопс.терафлопс обработки ядра Tensor.
Вверху: генеральный директор Дженсен Хуанг демонстрирует видеокарты серии GeForce RTX 3000.
Изображение предоставлено: Nvidia
Компания обновила систему ввода-вывода для графики, обеспечив быструю загрузку и декомпрессию игровых активов до 100 раз в сотрудничестве с новым интерфейсом программирования приложений Microsoft DirectStorage для Windows. Это помогает центральному процессору (ЦП) переносить задачи хранения на графический процессор, повышая частоту кадров и сокращая время загрузки.
Micron работала с Nvidia над созданием GDDR6X, которая, по словам Nvidia, является самой быстрой в мире дискретной графической памятью для серии RTX 30 со скоростью до 1 ТБ в секунду и пропускной способностью памяти.
Чтобы внести улучшения, Nvidia работала с контрактным производителем чипов Samsung, чтобы разработать индивидуальный производственный процесс 8N Nvidia.
Помимо Fortnite, другие игры, использующие преимущества графических процессоров, включают Call of Duty: Black Ops Cold War Cyberpunk 2077, Dying Light 2 и Watch Dogs: Legion. Игровые движки, поддерживающие графические процессоры, включают Unreal Engine, Unity, Frostbite, id Tech, Northlight, Luminous Engine и 4A Engine.
Видеокарта GeForce RTX 3080 за 700 долларов будет оснащена 10 ГБ памяти GDDR6X, работающей на скорости 19 гигабит в секунду (Гбит/с), и стабильно обеспечивает 60 кадров в секунду для игр с разрешением 4K. GeForce RTX 3070 за 500 долларов на 60% быстрее оригинальной RTX 2070, имеет 8 ГБ памяти GDDR6 и может запускать игры с разрешением 4K и 1440p.
Вершина кучи — BFGPU (от Big Ferocious GPU), GeForce RTX 3090 за 1500 долларов. раз тише предыдущего Titan RTX. Конструкция поддерживает температуру графического процессора до 30 градусов по Цельсию. Он имеет 24 ГБ памяти GDDR6X и на 50% быстрее, чем Titan RTX. Он может запускать игры со скоростью 60 кадров в секунду в разрешении 8K.
Вверху: Fortnite получает трассировку лучей второго поколения в реальном времени.
Изображение предоставлено: Nvidia/Epic. Новые игровые ПК с картами поставляются Acer, Alienware, Asus, Dell, HP, Lenovo и MSI. А сборщики систем, использующие карты, включают CyberPower PC, Digital Storm, Falcon NW, Ibuypower, Maingear, Origin, NZXT и Puget.
GeForce RTX 3080 будет доступна с 17 сентября. GeForce RTX 3090 будет доступна с 24 сентября. GeForce RTX 3070 будет доступна в октябре.
Nvidia выпустила новую демо-версию под названием «Marbles at Night», в которой представлена фотореалистичная графика в реальном времени с полной трассировкой пути, отражениями, текстурами и источниками света. Это как смотреть интерактивный фильм с кучей спецэффектов. На компьютерах с процессорами Ampere демонстрационная версия может запускаться в режиме удаленного воспроизведения со скоростью 30 кадров в секунду и разрешением 1440p. Nvidia лично показала его некоторым влиятельным лицам со скоростью 60 кадров в секунду на 8K LG OLED TV. Телевизор 8K может отображать в четыре раза больше пикселей или точек на экране по сравнению с телевизором 4K.
«Это безумие, потому что мы не можем показать вам, как это выглядит в прямом эфире», — сказал Хуан. «Сегодняшний запуск Ampere — это гигантский шаг в будущее».
Хуанг сказал, что прошло 20 лет с тех пор, как Nvidia представила графические процессоры с программируемым шейдингом, которые модернизировали 3D-графику. За это время обработка графики стала в 100 000 раз быстрее, а играми стали пользоваться миллиарды людей.
«Мне не терпится перенестись на 20 лет вперед, чтобы увидеть, с чего началась RTX, — сказал Хуанг. «В этом будущем GeForce — это ваша голопалуба, ваш звездолет со скоростью света, ваша машина времени».
Кредо GamesBeat при освещении игровой индустрии — «там, где страсть встречается с бизнесом». Что это значит? Мы хотим рассказать вам, как новости важны для вас — не только как руководителя игровой студии, но и как фаната игр. Читаете ли вы наши статьи, слушаете ли вы наши подкасты или смотрите наши видео, GamesBeat поможет вам узнать об отрасли и получить удовольствие от участия в ней. Откройте для себя наши брифинги.
TSMC подтверждает переход на 3-нм техпроцесс к 2022 году, который может обеспечить невероятные 80 миллиардов транзисторных графических процессоров
Когда вы покупаете по ссылкам на нашем сайте, мы можем получать партнерскую комиссию. Вот как это работает.
(Изображение предоставлено TSMC) Согласно китайскому техническому сайту ItHome (на китайском языке) , завод по производству микросхемMonster TSMC подтвердил, что его 3-нм производственный узел находится на пути к полному массовому производству во второй половине 2022 года. TSMC считает, что ее 3-нм узел будет располагаться где-то к северу от 250 миллионов транзисторов на квадратный миллиметр кремния, что сделает его как минимум в два с половиной раза более плотным, чем последний 10-нм узел Intel . Теоретически 3-нм технология TSMC может позволить создать графический процессор в три раза более сложный, чем новые чипы AMD Radeon RX 6000 Series. (откроется в новой вкладке)
TSMC, конечно же, производит все высокопроизводительные процессоры AMD Ryzen и графические процессоры Radeon. До недавнего времени он также производил лучшие графические чипы Nvidia. Такие достижения, как 3-нанометровая технология TSMC, имеют значение, поскольку они позволяют создавать более сложные и быстрые компьютерные чипы. Как, вы знаете, процессоры и графические процессоры.
Intel считает, что ее новый 10-нм техпроцесс подходит для примерно 100 миллионов транзисторов на квадратный миллиметр, в то время как самый совершенный 7-нм техпроцесс TSMC рассчитан на 113 миллионов транзисторов на квадратный миллиметр.
В то время как TSMC обещает не менее 250 миллионов транзисторов на квадратный миллиметр для своего 3-нм узла, реальность может оказаться ближе к 300 миллионам. Все это означает, что в конце 2022 года TSMC сможет производить чипы в 2,5-3 раза более плотные, чем 7-нм технология, используемая для современных процессоров и графических чипов AMD.
Ваше следующее обновление
(Изображение предоставлено: Будущее) Лучший процессор для игр (открывается в новой вкладке): лучшие чипы от Intel и AMD
Лучшая видеокарта (открывается в новой вкладке): ваш идеальный пиксель-пушер ждет
Лучший твердотельный накопитель для игр (открывается в новой вкладке): входите в игру раньше остальных
Эту плотность можно использовать либо сделать чипы с существующей сложностью намного меньше и, следовательно, немного дешевле, или сделать возможным гораздо более сложные конструкции. Так обстоит дело с компьютерными чипами, пока такие компании, как TSMC, продолжают разрабатывать новые узлы.
Но подумайте об этом. Графический процессор AMD Navi 21, чип внутри Radeon 6800 и 69Платы серии 00 содержат чуть менее 27 миллиардов транзисторов с использованием 7-нм техпроцесса. Таким образом, 3-нанометровый графический процессор того же размера мог бы упаковать около 80 миллиардов транзисторов, если бы его действительно подтолкнули.
Конечно, AMD старается не использовать новейшие технологии производства TSMC. TSMC уже производит чипы для iPhone от Apple на своем новом 5-нм узле, что соответствует 173 миллионам транзисторов на квадратный миллиметр, но AMD все еще работает над проектами на 7-нм техпроцессе.
Так что не ждите 80-миллиардного графического процессора AMD в 2022 году, но такой зверь почти наверняка появится. Это просто вопрос времени.
AMD стремится к 5-нанометровому техпроцессу со своей новой архитектурой ЦП Zen 4 в 2022 году (Изображение предоставлено AMD) . Таким образом, мы не увидим любых 3-нм процессоров AMD уже в 2022 году. 2023 или позже. По оценкам, Intel 7nm обеспечивает от 200 до 250 миллионов транзисторов на квадратный миллиметр. Таким образом, плотность находится где-то между 5-нм и 7-нм узлами TSMC.Что касается Samsung, другого крупного игрока в производстве чипов, то недавно он объявил о планах сократить отставание от TSMC за счет собственного 3-нм техпроцесса во второй половине 2022 года.