Ediciones Universidad de Salamanca / cc BY-NC-SA Ciencia Policial, 184, 87-113 98 CIENCIAPOLICIAL la siguiente: dada una URL de la red TOR, el microservicio debe ser capaz de navegar por los enlaces presentes en la página web para, en última instancia, descargar filtraciones de datos. El microservicio diseñado para recopilar datos de la Dark Web requiere una serie de pasos específicos para su implementación en la red TOR, los cuales se detallan a continuación: • Incorporar en el código Python del microservicio la capacidad de abrir sockets en el puerto 9150. Los sockets son puntos de comunicación que permiten que los procesos se comuniquen entre sí, ya sea en la misma máquina o a través de una red. Al abrir un socket en el puerto 9150, el microservicio podrá escuchar conexiones entrantes y comunicarse con otros procesos o servicios mediante el puerto especificado. • Inspeccionar el sitio web en busca de enlaces. Este paso se lleva a cabo considerando las hojas de estilo en cascada (Cascading Style Sheets o CSS) utilizadas para el formato. El CSS juega un papel crucial en la definición de la presentación visual del contenido web, incluyendo elementos como diseño, colores, fuentes y espaciado. Esto permite identificar y seleccionar componentes específicos de una página web directamente desde el código, utilizando propiedades y selectores CSS. Para este propósito, se ha utilizado la biblioteca BeautifulSoup. • Iterar sobre los resultados de búsqueda, es decir, recorrer cada enlace que coincida con los parámetros CSS especificados en el código Python. • Inicializar el microservicio de Web Scraping. La fuente de datos seleccionada (Imagen 4) no requiere paginación ni interacción con un sistema de inicio de sesión, ya que los datos compartidos en el servicio oculto seleccionado están organizados en una página HTML estática, lo que reduce la complejidad en la detección y la descarga de nuevas filtraciones de datos.
RkJQdWJsaXNoZXIy MzA5NDI2