На конференции Next ‘25 в Лас-Вегасе Google анонсировала тензорный процессор Ironwood седьмого поколения — первый в линейке TPU, разработанный исключительно для задач инференса. Устройство, доступное в двух конфигурациях с жидкостным охлаждением (256 и 9 216 чипов), предназначено для поддержки вычислительных нагрузок следующего этапа развития генеративного ИИ.
Каждый чип Ironwood обеспечивает пиковую производительность 4 614 терафлопс. При масштабировании до кластера из 9 216 чипов система достигает 42,5 экзафлопс. По заявлению Google, это более чем в 24 раза превышает мощность суперкомпьютера El Capitan, который демонстрирует 1,742 экзафлопс. Однако сравнение требует уточнения: El Capitan измеряет производительность в стандарте FP64 (двойная точность), тогда как Ironwood использует FP8 (8-битные вычисления) — общепринятый метод оценки для ИИ-систем. При этом, FP64 требует значительно больше ресурсов для выполнения операций.