Close Menu
Cronica
  • Home
  • Titulares
  • Internacional
  • Negocios
  • Ciencia
  • Tecnología
  • Deportes
  • Entretenimiento
  • Formulario de contacto
Facebook X (Twitter) Instagram
Trending
  • Las multitudes abruman la ruta del desfile guatemalteco de Trenton, pero el desvío ayudó a aliviar los problemas
  • Mural maya encontrado en Guatemala revela antigua ‘fotobomba’
  • RTL Today – Intercambio de estrategias: Colombia y Guatemala aprenden unos de otros en la preservación del bosque tropical
  • Miley Cyrus es demandada por supuestamente copiar la exitosa canción de Bruno Mars
  • Intervención nutricional para prevenir el retraso del crecimiento en Guatemala
  • Dolby Atmos en TV: Revoluciona tu experiencia de entretenimiento
  • Fotos de la boda de la corresponsal de “Entertainment Tonight” Cassie DiLaura en México
  • 27 mejores cosas para hacer en la Ciudad de México
CronicaCronica
Subscribe
  • Home
  • Titulares
  • Internacional
  • Negocios
  • Ciencia
  • Tecnología
  • Deportes
  • Entretenimiento
  • Formulario de contacto
Cronica
Home»Tecnología»Amazon está investigando desconcertado por acusaciones de abuso de scraping
Tecnología

Amazon está investigando desconcertado por acusaciones de abuso de scraping

Emelina BahenaBy Emelina Bahenajunio 28, 2024No hay comentarios3 Mins Read
Facebook Twitter Pinterest LinkedIn Tumblr Email
Amazon está investigando desconcertado por acusaciones de abuso de scraping
Share
Facebook Twitter LinkedIn Pinterest Email

La división de nube de Amazon ha iniciado una investigación sobre Perplexity AI. La pregunta es si la startup de investigación de IA está violando las reglas de los servicios web de Amazon al copiar sitios que intentaron impedir que lo hiciera, según se enteró WIRED.

Un portavoz de AWS, que habló con WIRED bajo condición de no ser identificado, confirmó la investigación de la compañía sobre Perplexity. WIRED ya había descubierto que la startup, que apoyo del fondo de la familia Jeff Bezos y Nvidia, y recientemente fue valorado de 3 mil millones de dólares – parece depender de contenido de sitios copiados que prohibían el acceso a través del Protocolo de Exclusión de Robots, un estándar web común. Si bien el Protocolo de exclusión voluntaria de robots no es legalmente vinculante, los términos de servicio generalmente sí lo son.

El protocolo de exclusión de robots es un estándar web de décadas de antigüedad que implica colocar un archivo de texto simple (como wired.com/robots.txt) en un dominio para indicar a qué páginas no deben acceder los robots y rastreadores automatizados. Aunque las empresas que utilizan scrapers pueden optar por ignorar este protocolo, la mayoría lo ha respetado tradicionalmente. El portavoz de Amazon le dijo a WIRED que los clientes de AWS deben cumplir con el estándar robots.txt al rastrear sitios web.

“Los términos de servicio de AWS prohíben a los clientes utilizar nuestros servicios para cualquier actividad ilegal, y nuestros clientes son responsables de cumplir con nuestros términos y todas las leyes aplicables”, dijo el portavoz en un comunicado.

Continúa el escrutinio de las prácticas de Perplexity un informe del 11 de junio de Forbes quien acusó a la startup de robar al menos uno de sus artículos. Las investigaciones de WIRED confirmaron la práctica y encontraron más evidencia de abuso y plagio por parte de sistemas vinculados al chatbot de búsqueda impulsado por inteligencia artificial de Perplexity. Los ingenieros de Condé Nast, la empresa matriz de WIRED, bloquean el rastreador de Perplexity en todos sus sitios mediante un archivo robots.txt. Pero WIRED descubrió que la empresa tenía acceso a un servidor utilizando una dirección IP no publicada (44.221.181.252) que visitó las propiedades de Condé Nast al menos cientos de veces durante los últimos tres meses, aparentemente para rastrear sitios web de Condé Nast.

La máquina asociada con Perplexity parece estar involucrada en un seguimiento generalizado de sitios de noticias que prohíben a los robots acceder a su contenido. Los portavoces de The Guardian, Forbes y The New York Times también dicen que detectaron la dirección IP visitando repetidamente sus servidores.

WIRED rastreó la dirección IP hasta una máquina virtual conocida como instancia de Elastic Compute Cloud (EC2) alojada en AWS, que comenzó su investigación después de que le preguntamos si el uso de la infraestructura de AWS para rastrear sitios web que lo prohibían violaba los términos de servicio de la empresa.

La semana pasada, el director ejecutivo de Perplexity, Aravind Srinivas, respondió a la investigación de WIRED diciendo primero que las preguntas que le hicimos a la empresa “reflejan un malentendido profundo y fundamental sobre cómo funcionan Perplexity e Internet”. Srinivas entonces le dijo a Fast Company que la dirección IP secreta que WIRED observó raspando los sitios de Condé Nast y un sitio de prueba que creamos era operada por una empresa externa que realiza servicios de indexación y rastreo web. Se negó a nombrar la empresa, citando un acuerdo de confidencialidad. Cuando se le preguntó si le diría al tercero que dejara de rastrear a WIRED, Srinivas respondió: “Es complicado”.

Emelina Bahena

“Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador”.

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Emelina Bahena

"Introvertido. Solucionador de problemas. Aficionado total a la cultura pop. Estudiante independiente. Creador".

Related Posts

La “teoría de Internet muerta” cobra vida con una nueva aplicación de redes sociales impulsada por IA

septiembre 19, 2024

Revisión de Apple iPhone 16 Pro y iPhone 16 Pro Max: iPhones más inteligentes

septiembre 18, 2024

Google trabaja en el cifrado RCS entre Android y iPhone

septiembre 18, 2024
Add A Comment
Leave A Reply Cancel Reply

Navigate
  • Home
  • Titulares
  • Internacional
  • Negocios
  • Ciencia
  • Tecnología
  • Deportes
  • Entretenimiento
  • Formulario de contacto
Pages
  • Sobre nosotros
  • DMCA
  • Formulario de contacto
  • política de privacidad
  • política editorial
Booking.com
Cronica
Facebook X (Twitter) Instagram Pinterest Vimeo YouTube
  • Sobre nosotros
  • DMCA
  • Formulario de contacto
  • política de privacidad
  • política editorial
© 2026 Cronica.gt. Medio independiente de análisis y noticias. Todos los derechos reservados.

Type above and press Enter to search. Press Esc to cancel.