Back to Question Center
0

Semalt Expert en Scraping de datos web: boas e malas

1 answers:

O rascado web ten sido durante moito tempo e considérase útil para webmasters, xornalistas, autónomos, programadores, non programadores, investigadores de marketing, expertos e expertos en redes sociais. Existen dous tipos de bots: bos bots e malos bots. Os bos bots permiten aos motores de busca indexar o contido web e reciben alta preferencia polos expertos do mercado e os comerciantes dixitais. Os malos bots, por outra banda, son inútiles e teñen como obxectivo danar o ranking de buscadores dun sitio. A legalidade do rascado web depende do tipo de bots que usou.

Por exemplo, se está a usar os bots malas que buscan o contido desde distintas páxinas web coa intención de usalo ilegalmente, o rascado web pode ser prexudicial. Pero se fai uso dos bos bots e evita as actividades nocivas que inclúen ataques de denegación de servizo, fraudes en liña, estratexias de minería de datos competitivas, roubos de datos, secuestro de contas, escaneo de vulnerabilidade non autorizado, fraude publicitario dixital e roubo das propiedades intelectuais, entón o procedemento de rascado web é bo e útil para crecer o seu negocio en Internet.

Desafortunadamente, a maioría dos freelancers e startups adoran malos bots porque son un xeito barato, potente e amplo de recoller datos sen necesidade de asociación. As grandes empresas, porén, usan os raspadores web legais para as súas ganancias e non queren arruinar a súa reputación en Internet con rascadores web ilegais. As opinións xerais sobre a legalidade do rascado web non parecen importar porque nos últimos meses quedou claro que os sistemas xudiciais federales están a crackear cada vez máis estratexias ilegais de rascado na web.

O rascado web comezou como un proceso ilegal en 2000, cando o uso de robots e arañas para raspar sitios web era considerado absurdo..Non se adaptaron moitas prácticas para evitar que o proceso se estendese en internet ata 2010. En primeiro lugar, eBay presentou as ordes preliminares contra Bidder's Edge, alegando que o uso de bots na páxina web violou as leis de Trespass to Chattels. O tribunal pronto concedeu os mandatos porque os usuarios tiveron que aceptar os termos e condicións do sitio e unha gran cantidade de robots foron desactivados, xa que poderían ser destrutivos para as máquinas de computadoras de eBay. A demanda pronto se resolvió fóra do tribunal, e eBay deixou a todos de usar bots para raspar web sen importar que sexan bos ou malos.

En 2001, unha axencia de viaxes demandou aos competidores que rasparon o contido do sitio web coa axuda de arañas nocivas e malos bots. Os xuíces volveron a tomar medidas contra o delito e favoreceron ás vítimas, dicindo que tanto o rascado web como o uso de robots poden prexudicar a varios negocios en liña.

Hoxe en día, para a agregación académica, privada e de información, moitas persoas confían en procedementos xustos de rascado na rede e desenvolvéronse moitas ferramentas de rascado web a este respecto. Agora, as autoridades din que non todas esas ferramentas son fiables, pero as que veñen en versións remuneradas ou Premium son mellores que os rascadores web gratis .

En 2016, o Congreso aprobou a primeira lexislación para atacar aos malos e favorecer os bos bots. Creouse a Lei de mellor venda de billetes en liña (BOTS) que prohibiu o uso de software ilegal que podería atacar aos sitios web, prexudicando os seus rankings de buscadores e destruíndo os seus negocios. Hai cuestións de equidade. Por exemplo, LinkedIn gastou moito diñeiro nas ferramentas que bloquean ou eliminan malos bots e fomentan bos bots. Como os tribunais intentaron decidir a legalidade do rascado web, as empresas están tendo roubado os seus datos.

1 week ago
Semalt Expert en Scraping de datos web: boas e malas
Reply