Как блокировать ботов по User-agent в Nginx

Деятельность ботов-пауков и краулинг-ботов известных поисковых систем обычно не влияет на загрузку сайта и на скорость его работы. Но большая часть  ботов не приносит пользы, более того, они вредят производительности сайта.

Плохие боты и краулеры

Например, боты типа DotBot или Semrush, посылали так много запросов на сайт, что это было похоже на эффект небольшой DDoS-атаки. Это приводило к сильной перегрузке сайта и сервера, и сайт становился недоступным для других посетителей.

Рекомендуется блокировать слишком активных ботов, если на вашем сайте более 100 страниц.

Блокирование вредоносных ботов с использованием файла nginx.conf для Nginx.

Как заблокировать бота Baidu

Как заблокировать AhrefsBot

Добавьте этот код в раздел HTTP{} в nginx.conf:

Как заблокировать MJ12bot

Добавьте этот код в раздел HTTP{} в nginx.conf:

Как заблокировать бота Detectify

Добавьте этот код HTTP{} секцию nginx.conf:

Как заблокировать бота DuckDuckGo

Добавьте этот код в раздел HTTP{} в nginx.conf:

Как заблокировать бота Semrush

Добавьте этот код HTTP{} секцию nginx.conf:

Как заблокировать бота Seznam

Добавьте этот код HTTP{} секцию nginx.conf:

Как заблокировать бота Zgrab

Добавьте этот код HTTP{} секцию nginx.conf:

Как заблокировать бота Petalbot

Добавьте этот код HTTP{} секцию nginx.conf:

Как заблокировать бота Jorgee

Добавьте этот код в раздел HTTP{} в nginx.conf:

Как заблокировать бота Яндекса

Добавьте этот код HTTP{} секцию nginx.conf:

Как заблокировать Dotbot

Добавьте этот код HTTP{} секцию nginx.conf:

Как заблокировать бота Sogou

Добавьте этот код HTTP{} в раздел nginx.conf:

Как заблокировать несколько ботов одновременно

Добавьте этот код HTTP{} секцию nginx.conf:

Список известных краулеров

Вы можете блокировать любой пользовательский агент (User-agent), который вам нужен.

  • 360Spider
  • Ahrefs
  • AhrefsBot
  • ApacheBench
  • Aport
  • Applebot
  • archive
  • baidu
  • BaiduBot
  • Baiduspider
  • Birubot
  • BLEXBot
  • bsalsa
  • Butterfly
  • Buzzbot
  • BuzzSumo
  • CamontSpider
  • CCBot
  • Cliqzbot
  • CommentReader
  • crazy
  • curl
  • dataminr
  • Detectify
  • DeuSu
  • Digincore
  • discobot
  • Dispatch
  • DomainSigma
  • DomainTools
  • dotbot
  • duckduckgo
  • Embedly
  • exabot
  • Ezooms
  • facebookexternalhit
  • FairShare
  • Faraday
  • FeedFetcher
  • filterdb
  • FlaxCrawler
  • FlightDeckReportsBot
  • FlipboardProxy
  • FyberSpider
  • getintent
  • getprismatic
  • Gigabot
  • Go-http-client
  • gold crawler
  • GrapeshotCrawler
  • help.jp
  • HTMLParser
  • HTTrack
  • hybrid
  • ia_archiver
  • InfoSeek
  • InterfaxScanBot
  • InternetSeer
  • Jakarta
  • Java
  • Jooblebot
  • Jorgee
  • JS-Kit
  • km.ru
  • kmSearchBot
  • Kraken
  • larbin
  • Laserlikebot
  • Leikibot
  • libwww
  • Lightspeedsystems
  • Linguee
  • LinkBot
  • linkdexbot
  • LinkExchanger
  • linkfluence
  • LinkpadBot
  • LivelapBot
  • LoadImpactPageAnalyzer
  • ltx71
  • lwp-trivial
  • majestic
  • masscan
  • meanpathbot
  • Mediatoolkitbot
  • MegaIndex
  • MetaURI
  • mfibot
  • MJ12bot
  • MLBot
  • musobot
  • NerdByNature
  • NetSeer
  • NewShareCounts
  • NING
  • NjuiceBot
  • Nutch
  • Nuzzel
  • omgili
  • omgilibot
  • OpenHoseBot
  • openstat
  • OptimizationCrawler
  • Panopta
  • PaperLiBot
  • petalbot
  • pflab
  • PHP/
  • pirst
  • postano
  • PostRank
  • proximic
  • ptd-crawler
  • Purebot
  • PycURL
  • Python
  • QuerySeekerSpider
  • Riddler
  • rogerbot
  • Ruby
  • SafeSearch
  • Scrapy
  • SearchBot
  • semantic
  • semrush
  • SemrushBot
  • Seopult
  • seznam
  • SeznamBot
  • SISTRIX
  • SiteBot
  • Slurp
  • SMTBot
  • SMUrlExpander
  • SNAPSHOT
  • socialmediascanner
  • sogou
  • solomono
  • SolomonoBot
  • Soup
  • spbot
  • spredbot
  • SputnikBot
  • statdom
  • StatOnlineRuBot
  • suggybot
  • Superfeedr
  • SurdotlyBot
  • SurveyBot
  • SWeb
  • trendictionbot
  • TSearcher
  • ttCrawler
  • TurnitinBot
  • TweetmemeBot
  • ubermetrics
  • UnwindFetchor
  • urllib
  • uTorrent
  • veoozbot
  • Voyager
  • WBSearchBot
  • Wget
  • WordPress
  • woriobot
  • yandex
  • Yeti
  • YottosBot
  • Zeuszgrab
  • zitebot
  • ZmEu
Понравилась статья? Поделиться с друзьями:
Добавить комментарий