Qué es el web scraping y cómo afecta a la privacidad en Internet

Qué es el web scraping y cómo afecta a la privacidad en Internet

El web scraping se ha convertido en una herramienta muy recurrente para un número cada vez mayor de negocios online que quieren sacar provecho de los datos que circulan en la red para conseguir una mayor visibilidad. Con esta técnica, se puede conocer en profundidad el perfil de la competencia y de los clientes objetivo de cualquier organización.

El web scraping se trata, por tanto, de un útil que consigue rastrear Internet, yendo a la caza y captura de información interesante para un fin determinado, copiándola y trasvasándola a una nueva base de datos.

Tiene diferentes utilidades, pudiendo ser empleada por un amplio número de interesados, tanto particulares como empresas o entidades gubernamentales para recabar información y crear bases de datos propias. Es muy recurrente el uso de este instrumento digital para detectar actividades ilegales y / o fraudulentas (hacking ético), para que una web pueda crear contenido propio a partir de la información obtenida de otra web (marketing de contenidos), la interacción automatizada con los usuarios de las redes sociales y la automatización para que los artículos se posicionen en los motores de búsqueda.

Como hemos dicho brevemente, es un método usado en el marketing online para extraer datos ocultos en los documentos, desde páginas web hasta documentos en PDF. Se trata de una filtración de esta información oculta hacia otra web que pueda usar estos datos para su propio beneficio.

El scraping, para bien o para mal, está al alcance de cualquier persona, es decir, no tiene por qué ser un experto ni un informático avanzado ni hace falta tener conocimiento alguno de programación para usar este procedimiento.

Esta técnica se lleva a cabo con tres fases muy sencillas; la descarga de datos, el análisis detallado de la información extraída y el almacenamiento de los datos para disponer de ellos cuando sea necesario.

Con esta puerta de acceso abierta a cualquiera con un mínimo de conocimientos cabe preguntarse cómo afecta el web scraping a la privacidad de las personas que ofrecen sus datos a internet y qué dice el Reglamento Europeo de Protección de Datos (rgpd) en este sentido.

¿Cuándo es legal y cuándo no el scraping?

Como técnica informática es completamente legal, de hecho, son millones de empresas las que usan esta herramienta. Al parecer, según algunos estudios, parece que el 45 % de todo el tráfico que se mueve en internet está realizado por robots y no por personas.

Aunque el web scraping se ha relacionado en muchas ocasiones con la ciberdelincuencia, esto no tiene por qué ser así. Según el uso que se le dé a esta herramienta se volverá ilegal o no, al igual que la técnica que se utilice, que también puede ser motivo para considerarlo una actividad delictiva.

La violación de los derechos de autor que tiene lugar con la copia de material para utilizarlo como propio en algunos usos del scraping es, posiblemente, el delito más recurrente por el empleo indebido de este sistema.

No se puede usar este tipo de información para uso propio.

Por parte de mal uso en cuanto al modo de obtener información sería la intención de recoger información sobre, por ejemplo, un listado de precios de una tienda online con los mismos productos que queremos vender. En principio, esta acción no incumple ninguna ley porque estos datos son públicos. Pero, se puede cometer el error de enviar el robot que recogerá esta información mandando demasiadas visitas, es decir, con un exceso de peticiones a las que el servidor web se ve imposibilitado para dar respuesta. Esto podría provocar que el servidor deje de funcionar un tiempo determinado, lo que producirá una pérdida de ingresos en el sitio.

Este ejemplo está considerado como un ataque de denegación de servicio (DDoS) que, en muchos casos, puede ser involuntario, por falta de experiencia o conocimientos, pero que, en cualquier caso, estaría considerado como delito.

Si se quiere ser legal en el uso de una web scraping hay que permanecer atento y utilizar esta herramienta siempre de forma ética, mostrando especial interés en no utilizarla para llevarse la propiedad intelectual o marcas registradas de terceros, no violar derechos de autor, ni tampoco realizar competencia desleal, y, por supuesto, cumplir fielmente la Ley Orgánica de Protección de Datos (LOPD) y la nueva ley del nuevo reglamento europeo RGPD y no sobrecargar a los servidores de los sitios scrapeados, como ha quedado reflejado en el ejemplo anterior.

Deja un comentario

Agencias y Emprendedores


Otros negocios y oportunidades

REDACCIÓN DE CONTENIDOS MARCA BLANCA
SEO MARCA BLANCA
FRANQUICIA POSICIONAMIENTO SEO
DISTRIBUIDORES SEO
COMPRA DE EMPRESAS SEO
COMPRA CARTERA CLIENTES SEO
COMPRA DOMINIOS SEO

¿Donde estamos?

Plaza San Cristobal, 14
Telf: (+34) 965 67 75 01
CENTRO ULAB
Website: https://rgpd.camaltec.es
Email: info@camaltec.es

RGPD CAMALTEC

Es un producto de Grupo Camaltec, para adaptar su empresa o negocio al nuevo reglamento europeo de protección de datos.

Experto en Protección de datos