White commence: les «bons» robots sont-ils vraiment aussi bons?

White commence: les «bons» robots sont-ils vraiment aussi bons?

Il semblerait que la question des bons et des mauvais bots soit assez simple pour les entreprises: bloquer certains, laisser passer les autres. Cependant, ce processus a ses propres nuances. Cela est dû au fait que les mauvais robots se déguisent en bons, et au fait que les bots mal configurés de la liste blanche peuvent gâcher le trafic et mettre un site hors service, et au fait que les entreprises n'ont même pas toujours besoin de bloquer un bot, mais il vous suffit de comprendre où il a marché. Voyons en quoi les mauvais robots diffèrent des bons.

Quelques statistiques

GlobalDots 2019 Bad Bot Report, 39% - , . 20,4% , 17.5% - . , 2019 « » , « » . , , “”, , .

, , . , , - 22.9%, - - 17.9%.

: , , DDoS-, , , , - , - , - , , , - , .

. . , (, - -), , -.

(crawlers)

- , , , , , .. 30% -. : Googlebot, YandexBot, ematchers – , , YandexImages.

-

, , , , . : Amazon Echo, Google Home, Siri, . .

-, : , , . , . - Content ID YouTube, .

, Google Shopping. - , .

, (, , - ).

, whitelist Variti , , , preview - , - . , , ., AdSense-, , .

, , , , . .

, . . , - - . , , . .

. , , - , . .

, , , , - .. , , IP-, .

, . , Android , , . , , . , - , , , . , .

, , IP , . IP , CIDR-, .

“” IP , . , , , / IP . . , , token . . IP . , - , user agent -. .

. , , website.com/api. API, - , API IP . , API .

whitelists, IP , , – Variti, , Telegram- Variti .

, , . , , . - SMS-. , SMS- - . , . , . , SMS, .

, “”, . , 10 , 1000. robots.txt, , . , , . , - , .

- . - , IP-, , .. DDoS-. , .

, , . . . – , , . , .

GlobalDots 2019 Bad Bot Report 523 . « » (55,4%) Google Chrome. Firefox, - Android. Safari, Internet Explorer, Safari Mobile, Opera, Googlebot Bingbot .

, , , 20 , - , , Internet Explorer 5, 1999-. 0.8% Internet Explorer 7. , . , - , .

, 74% « » - advanced persistent bots (APB), , . , , IP-, -, Java- peer-to-peer , .

, , . , , .

Variti user agent, , IP , , , . , , ( Chrome, headless) , .

, , , , . .

, “ ”

“” , . , , . , , — . , , - - , .

, , , email. - , . , , .

Firefox, Chrome, Internet Explorer Safari , - , . .

robots.txt — , . , , . : , . , - - , robots.txt. - .

, , . , - - , (, - ), stealth-, , . - ?




All Articles