Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Nicecrawler/1.1; +http://www.nicecrawler.com/) Chrome/90.0.4430.97 Safari/537.36
Nicecrawler/1.1 - это веб-краулер, разработанный компанией Nicecrawler. Он предназначен для индексации веб-сайтов с соблюдением правил robots.txt и минимальной нагрузкой на сервер. В User-Agent строке он маскируется под Google Chrome версии 90, используя движок Blink через AppleWebKit. Основная цель краулера - сбор данных для поисковых систем или аналитических сервисов.
Nicecrawler/1.1 имеет средний уровень доверия. Хотя он заявляет о вежливом поведении, маскировка под популярный браузер может использоваться для обхода базовых фильтров. Рекомендуется проверять обращение к robots.txt и соблюдение лимитов запросов. Основные риски - потенциальный парсинг контента без разрешения и возможная имитация злоумышленниками.
Идентифицировать Nicecrawler/1.1 можно по наличию подстроки Nicecrawler/1.1 в User-Agent строке. На сервере (например, Nginx или Apache) можно добавить правило для ограничения или перенаправления запросов. Пример для Nginx: if ($http_user_agent ~* Nicecrawler) { return 403; }. Рекомендуется также проверять IP-адреса и сравнивать с официальными диапазонами, если они опубликованы.
Disallow: / для полной блокировки) или настройте веб-сервер на блокировку по подстроке Nicecrawler.