Нейросеть создала собственный язык, который ученые не могут расшифровать
Инструмент DALL-E - это нейронная сеть, «обученная» исследовательской компанией OpenAI генерировать реалистичные изображения и искусство из текста на естественном языке. Ранее разработчики обнаружили, что DALL-E способен правдоподобно комбинировать несвязанные понятия и создавать антропоморфизированные версии животных и объектов.
Яннис Дарас (Giannis Daras), кандидат наук в области компьютерных знаний, на этой неделе опубликовал в Twitter, примеры того, что он назвал «собственным языком ИИ».
«Apoploe vesrreaitais» - означает птицы, - написал Дарас в Твиттере. «Contarra ccetnxniams luryca tanniounons» - означает ошибки или вредители.

DALL-E 2 работает в связке с CLIP - системой компьютерного зрения, которую OpenAI 
Авторы заметили, что система DALLE-2, которая создает изображения на основе введенного текста, при определенных обстоятельствах будет возвращать бессмысленные слова. Например, изображения со словом «самолет» часто возвращают какую-то тарабарщину. Сначала казалось, что это баг, но потом ученые пришли к выводу, что последовательность букв в возвращаемых словах не случайная.

Чтобы проверить это, ученые просто «скормили» нейросети сгенерированные ей ранее слова. Оказалось, что эти наборы букв и правда имеют значение для программы, причём они означают то же, что и ранее было введено в систему. Это может означать, что нейросеть зачем-то преобразует человеческие слова в свои, чтобы затем на их основе проще сгенерировать изображения.





