Googlebot-Image/1.0
Googlebot-Image/1.0 - это специализированный поисковый робот компании Google, предназначенный исключительно для сканирования и индексации изображений в интернете. Он является частью семейства Googlebot и используется для пополнения поискового индекса Google Images. Робот анализирует содержимое страниц, извлекает ссылки на графические файлы (JPEG, PNG, GIF, WebP и др.) и их метаданные (alt-текст, заголовки, описания), после чего добавляет их в базу данных для выдачи в результатах поиска по картинкам. Создан и поддерживается компанией Google LLC.
Googlebot-Image/1.0 является полностью легитимным и доверенным User-Agent. Его активность не несёт прямой угрозы безопасности, однако существуют косвенные риски: злоумышленники могут подделывать этот User-Agent для сканирования сайта в обход ограничений (например, если блокировка настроена только по строке User-Agent, а не по IP-диапазонам Google). Рекомендуется проверять подлинность бота через обратный DNS-запрос (PTR-запись должна оканчиваться на googlebot.com) и сверять IP-адрес с официальными списками Google. Допуск к сайту безопасен, но следует настроить сервер так, чтобы отдавать боту оптимизированные изображения (например, через WebP) и не блокировать его в robots.txt или через .htaccess без необходимости.
Самый простой способ идентификации - проверка строки User-Agent в HTTP-заголовке запроса: Mozilla/5.0 (compatible; Googlebot-Image/1.0; +http://www.google.com/bot.html). В серверных логах этот User-Agent будет отображаться как Googlebot-Image/1.0. Для программной обработки на сервере используйте регулярное выражение, например: /Googlebot-Image/i. На уровне веб-сервера (Nginx, Apache) можно добавить правила для перенаправления бота на сжатые версии изображений. В robots.txt разрешите доступ к папкам с изображениями, если они должны индексироваться, иначе закройте их директивой Disallow. Для повышения производительности кэшируйте ответы для этого User-Agent.
User-agent: Googlebot-Image Disallow: /images/) или настройте веб-сервер. Для разрешения убедитесь, что в robots.txt нет запретов для этого робота, и что сервер не отклоняет запросы по User-Agent.