Amazon Cloud начала расследование в отношении стартапа Perplexity AI. Как стало известно WIRED (авторитетный источник информации о технологиях и науке), подозрение заключается в том, нарушает ли стартап правила Amazon Web Services, сканируя веб-сайты, которые пытались помешать ему это делать.
Представитель AWS подтвердил расследование компании в отношении Perplexity. Ранее WIRED обнаружил, что Perplexity, которая поддерживается семейным фондом Джеффа Безоса и Nvidia и недавно была оценена в $3 миллиарда, по-видимому, полагается на контент, полученный парсингом веб-сайтов, доступ к которым был запрещён через протокол исключения роботов, — распространённый веб-стандарт. Хотя протокол исключения роботов не является юридически обязательным, условия обслуживания, как правило, являются таковыми.
Протокол исключения роботов — это существующий уже несколько десятилетий веб-стандарт, который предполагает размещение в домене открытого текстового файла (например, wired.com/robots.txt), чтобы указать, какие страницы не должны быть доступны автоматическим ботам и сканерам. Хотя компании, использующие парсеры, могут игнорировать этот протокол, большинство из них традиционно соблюдают его. Представитель AWS заявил, что их клиенты AWS должны придерживаться стандарта robots.txt при сканировании веб-сайтов.
«Условия обслуживания AWS запрещают оскорбительные и незаконные действия, и наши клиенты несут ответственность за соблюдение этих условий. Мы регулярно получаем сообщения о предполагаемых злоупотреблениях из различных источников и привлекаем наших клиентов к разбору этих сообщений», — заявил представитель AWS.