295 Commits (c50a8fd796a26b8c69076bce2e1758b0a0c70b0f)
 

Autor SHA1 Mensaje Fecha
  JustAnotherArchivist c50a8fd796 Fix 'Dictionary mismatch' error when very small dicts are used because the temporary file isn't written to disk before zstdcat gets executed hace 2 años
  JustAnotherArchivist 5bc3d4b020 Fix crash on an empty response hace 2 años
  JustAnotherArchivist 7f25c092d1 Catch other connection errors hace 2 años
  JustAnotherArchivist f8352809f3 Handle ConnectionResetError hace 2 años
  JustAnotherArchivist 0b34268210 Catch socket.timeout, which is a separate exception class from TimeoutError before Python 3.10 hace 2 años
  JustAnotherArchivist 0f7a2b32a3 Log number of results on a page hace 2 años
  JustAnotherArchivist 628aeb052f Handle rate limiting hace 2 años
  JustAnotherArchivist d3ea3ce8a0 Switch from urllib to http.client to reuse connections hace 2 años
  JustAnotherArchivist 8f7619ff3a Add retries hace 2 años
  JustAnotherArchivist f98fdd5f01 Fix printing HTTP response line to stdout instead of stderr hace 2 años
  JustAnotherArchivist c9400ac46f Fix recognition of command without optional parts hace 2 años
  JustAnotherArchivist 5ca15a7c94 Add concurrency support hace 2 años
  JustAnotherArchivist 191948cf9d Print number of modified records on requeueing hace 2 años
  JustAnotherArchivist 5121524f83 Log retrieval of showNumPages hace 2 años
  JustAnotherArchivist aba7a1b0b8 Replace resumeKey pagination with page number pagination hace 2 años
  JustAnotherArchivist d57324a26c Add --where for arbitrary conditions hace 2 años
  JustAnotherArchivist fed64387bd Invert count/write logic hace 2 años
  JustAnotherArchivist f914b6afbe Also reset the status_code on requeueing hace 2 años
  JustAnotherArchivist 303bb69c37 Add ia-cdx-search hace 2 años
  JustAnotherArchivist 0b45f7b2ba Swap syntaxes hace 2 años
  JustAnotherArchivist b2c9ea2fa4 Refactor hace 2 años
  JustAnotherArchivist eaf53e1a44 Add alphabetseq hace 2 años
  JustAnotherArchivist c9c8b7e1f7 Add ia-wait-item-tasks hace 2 años
  JustAnotherArchivist b440b35c2f Handle ancient /?v= URLs hace 2 años
  JustAnotherArchivist 0044281b9d Add YouTube channel listing script hace 2 años
  JustAnotherArchivist 1686e04cbe Add a timeout to prevent potentially indefinite blocking hace 2 años
  JustAnotherArchivist 2fc9652ee9 Add support for other instances and full-instance listing hace 2 años
  JustAnotherArchivist b72da478b2 Fix org repo listing on new design/site structure hace 2 años
  JustAnotherArchivist ce7a069af5 Add --jsonl option hace 2 años
  JustAnotherArchivist 9412f0c81c Add azure-storage-list hace 2 años
  JustAnotherArchivist 696e221fc1 Add support for password-protected folders hace 2 años
  JustAnotherArchivist 158c1f1fe0 Fix usage error hace 2 años
  JustAnotherArchivist 53bfe468bf Basic error checks hace 2 años
  JustAnotherArchivist 8c612082b6 Restore MD5 check as the API returns it again hace 2 años
  JustAnotherArchivist 8554c01a84 Fix gofile.io download to the new getFolder endpoint and download server structure hace 2 años
  JustAnotherArchivist a246bad957 Add support for Shorts hace 2 años
  JustAnotherArchivist 6d019e63fc Fix removenonyt performance by using simpler fixed-string patterns instead of a PCRE hace 2 años
  JustAnotherArchivist b27a428787 Fix usage notes from URLs to lines on stdin hace 2 años
  JustAnotherArchivist c4b62c2fea Fix piping when reads return less data than expected hace 2 años
  JustAnotherArchivist dba6d1fb0e Fix stderr printing hace 2 años
  JustAnotherArchivist 6e5a019d9e Always decode stdin with surrogateescape to avoid breaking on binary input hace 2 años
  JustAnotherArchivist e48fb9d1b6 Tighten patterns for user and custom channel URLs so they can handle HTML input more easily hace 2 años
  JustAnotherArchivist 9cbc3f7968 Extract playlist and channel IDs from watch URLs hace 2 años
  JustAnotherArchivist 80bf010433 Percent-decode each line only once hace 2 años
  JustAnotherArchivist f1fcfabafa Add support for reading warc.zst from stdin hace 2 años
  JustAnotherArchivist d5f646f995 Add zstdwarccat hace 2 años
  JustAnotherArchivist 4415c8d5dd Add support for img.youtube.com (old thumbnails) hace 2 años
  JustAnotherArchivist 50a0fcc7b0 Fix performance regression due to 479c2684 hace 2 años
  JustAnotherArchivist 479c268441 Fix whitespace handling hace 2 años
  JustAnotherArchivist 56f21d1fc0 Add aggressive video ID v parameter extraction hace 2 años