Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots)
YandexBot - это поисковый робот (краулер) компании Яндекс, используемый для индексации веб-страниц и сбора контента для поисковой системы Яндекс. Он автоматически обходит сайты, анализирует их структуру и содержимое, чтобы предоставлять актуальные результаты поиска пользователям. User-Agent строка Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots) идентифицирует официального бота Яндекса.
YandexBot считается безопасным и заслуживающим доверия User-Agent, так как принадлежит официальному поисковому сервису Яндекса. Однако злоумышленники могут подделывать эту строку для обхода защиты или сканирования сайта. Рекомендуется проверять IP-адреса бота через обратный DNS lookup (домены вида *.yandex.net) и сверять с официальным списком IP Яндекса. Основной риск - перегрузка сервера при слишком частых запросах; для этого используйте robots.txt и настройте частоту краулинга.
Для идентификации YandexBot в коде сервера (например, на PHP или Nginx) проверяйте значение HTTP-заголовка User-Agent на наличие подстроки 'YandexBot' или 'YandexMobileBot'. Для верификации выполняйте обратный DNS-запрос к IP клиента: если домен оканчивается на .yandex.net, а затем прямой DNS-запрос подтверждает IP, то это официальный бот. Пример на PHP: if (preg_match('/YandexBot/', $_SERVER['HTTP_USER_AGENT'])) { ... }. В файле robots.txt можно разрешить или запретить доступ: User-agent: Yandexbot.
User-agent: Yandexbot и правила Disallow или Allow. На уровне сервера используйте проверку строки User-Agent в конфигурации (например, Nginx: if ($http_user_agent ~* YandexBot) { ... }).