Задачи, связанные с ИИ, требуют огромных вычислительных мощностей. В частности, специализированных ускорителей или хотя бы GPU. Специалисты Alibaba, похоже, нашли способ в разы снизить количество необходимых графических процессоров.
Alibaba Cloud рассказала, как её новая система пулов Aegaeon сокращает количество графических процессоров Nvidia, необходимых для обслуживания больших языковых моделей. Если точнее, сокращает на невероятные 82%.