5 Commits (master)

Autor SHA1 Mensaje Fecha
  JustAnotherArchivist 256a94443e Fix deduplication within each section processing hace 4 años
  JustAnotherArchivist 98d77ecc96 Deduplicate output hace 4 años
  JustAnotherArchivist 6ce64baf87 Remove redundant url-normalise after the extraction hace 4 años
  JustAnotherArchivist 869ade27eb Separate names in stderr annotations for the various url-normalise processes hace 4 años
  JustAnotherArchivist 79f0bd4332 Normalise URLs everywhere to reduce duplicates hace 4 años
  JustAnotherArchivist 0f13a1fadd Add verbosity options, and annotate stderr on wiki-recursive-extract hace 4 años
  JustAnotherArchivist 5285c406d9 Add script for recursive website and social media discovery hace 4 años