Consideraciones de la DB.
A) cada AÑO y TIPO van en una tabla distinta.
B) anyosRead lleva un control de los años ya escrapeados y si están ya completados.
C) sumarios realiza una lista de todos los sumarios extraídos poniendo una marca si la operación de completo .
D) la tabla errores recoje los errores de aquellos boletines que no han cargado correctamente.
E) en el caso de BOE tiene un campo de anotación para anotar errores encontrados en el formato.
F) en el caso BOE obtendremos también un JSON con los metadatos y el analisis del BOE.
Trabajo a realizar
informar de posibles anomalías y detección de boletines no legibles
objetivo.
scrapear todos los boletines todos los años obteniendo la base de datos con los TEXTOS de CONTRATOS y REGISTRO MERCANTIL
Consideraciones de la DB.
A) cada AÑO y TIPO van en una tabla distinta.
B) anyosRead lleva un control de los años ya escrapeados y si están ya completados.
C) sumarios realiza una lista de todos los sumarios extraídos poniendo una marca si la operación de completo .
D) la tabla errores recoje los errores de aquellos boletines que no han cargado correctamente.
E) en el caso de BOE tiene un campo de anotación para anotar errores encontrados en el formato.
F) en el caso BOE obtendremos también un JSON con los metadatos y el analisis del BOE.
Trabajo a realizar
informar de posibles anomalías y detección de boletines no legibles
objetivo.
scrapear todos los boletines todos los años obteniendo la base de datos con los TEXTOS de CONTRATOS y REGISTRO MERCANTIL