Ediciones Universidad de Salamanca / cc BY-NC-SA Ciencia Policial, 184, 87-113 99 Metodología de prevención del cibercrimen mediante Web Scraping y procesamiento del lenguaje natural para la detección de filtraciones de datos en la Dark Web Rico Pachón, N.; Gallo-Serpillo, F.; Barroso, R. Imagen 4: Ejemplo de conexión mediante Python cks.set_default_proxy(socks.SOCKS5, "localhost", 9150) socket.socket = socks.socksocket Dado que la adquisición ilícita de datos a través de intrusiones ilegítimas constituye un delito de descubrimiento y revelación de secretos, en las modalidades de intrusión o acceso indebido a sistemas informáticos (Código Penal, 1995, art. 197) y que, aunque los investigadores no sean autores directos de tales delitos, podrían estar incurriendo en un delito de recepción de información robada (Código Penal, 1995, art. 298), para la presente demostración, se ha simulado la descarga del material en el servicio oculto seleccionado de la Dark Web. Específicamente, el conjunto de datos en bruto presentado en la sección “Resultados Experimentales” ha sido construido expresamente para cubrir este experimento, evitando así que la acción de descarga constituya un delito. 2.3 Almacenamiento de datos en bruto Una vez definido cómo se obtienen los datos, el siguiente paso es determinar cómo se almacenan en su formato original. En este proceso, se busca recopilar filtraciones relacionadas con una fecha específica, reuniendo todos los datos relevantes. En este sentido, es necesario introducir el concepto de Amazon Bucket, que se refiere a un recurso de almacenamiento en Amazon Web Services (AWS). En este estudio, se utiliza específicamente un Amazon S3 Bucket. El término S3 proviene de Simple Storage Service, ya que es un servicio de almacenamiento basado en la nube proporcionado por AWS, diseñado para almacenar y recuperar grandes volúmenes de datos de manera segura y eficiente a través de internet. Así, un Amazon S3 Bucket es esencialmente un contenedor para almacenar archivos y documentos dentro de la infraestructura de almacenamiento de Amazon S3.
RkJQdWJsaXNoZXIy MzA5NDI2