Ediciones Universidad de Salamanca / cc BY-NC-SA Ciencia Policial, 184, 87-113 96 CIENCIAPOLICIAL 2.1 Arquitectura conceptual El objetivo de esta sección es describir la arquitectura de alto nivel presentada en la Imagen 3, que sirve como la columna vertebral del proyecto, proporcionando un marco para la implementación de la solución propuesta. El proceso general se distribuye en cuatro módulos lógicos: • Recopilación de datos mediante Web Scraping: orientado a realizar Web Scraping en servicios ocultos de la Dark Web, utilizando el lenguaje de programación Python junto con TOR SOCKS, un protocolo web que permite realizar solicitudes a la red TOR. El objetivo de este módulo es explorar automáticamente fuentes conocidas para descargar filtraciones de datos expuestas abiertamente en internet. • Almacenamiento de datos en bruto: responsable de almacenar los datos sin procesar en contenedores de datos tipo bucket. Imagen 3: Diagrama que ilustra la arquitectura de la solución desarrollada
RkJQdWJsaXNoZXIy MzA5NDI2