JustAnotherArchivist
1977b237e5
Fix random BrokenPipeError on exiting Python processes
Just catching the BrokenPipeError is not sufficient. There might still be data in the stdout buffer, which then causes the following error when Python shuts down and flushes it:
Exception ignored in: <_io.TextIOWrapper name='<stdout>' mode='w' encoding='utf-8'>
BrokenPipeError: [Errno 32] Broken pipe
To handle this, redirect stdout to /dev/null in the exception handler before exiting: https://docs.python.org/3.11/library/signal.html#note-on-sigpipe
hace 1 año
JustAnotherArchivist
e3380e6e2a
Fix 'binary' lines
hace 1 año
JustAnotherArchivist
2d4546f274
Fix errors on sscanf
%n takes a signed int so is incompatible with size_t; further, sscanf could in theory return a negative value (EOF).
hace 1 año
JustAnotherArchivist
8d2b04c56f
Add torrent-tiny
hace 1 año
JustAnotherArchivist
5eae0c45c2
Add header mode (e.g. for tasks API)
hace 1 año
JustAnotherArchivist
0f8a22f035
Add curl-ia
hace 1 año
JustAnotherArchivist
c9bf3a93af
Filter out lines without an attribute value
hace 1 año
JustAnotherArchivist
98ebc667f2
Silence BrokenPipeError
hace 1 año
JustAnotherArchivist
511405bbca
Fix case sensitivity on img srcset processing
hace 1 año
JustAnotherArchivist
6acea5d6eb
Add html-extract-stupid
hace 1 año
JustAnotherArchivist
3440da3f9a
Fix output sometimes appearing after prompt
hace 1 año
JustAnotherArchivist
75999e969c
Make --name a normal mode
hace 1 año
JustAnotherArchivist
9c1f803e13
Get rid of shell quoting and print name/fullname on separate lines instead
hace 1 año
JustAnotherArchivist
5ba7d26621
Fix error when no arguments are provided
hace 1 año
JustAnotherArchivist
ea27e35b90
Add optional username and fullname extraction
hace 1 año
JustAnotherArchivist
65a47d5091
Fix header matches potentially occurring in the record body
hace 1 año
JustAnotherArchivist
10c7ab0889
Fix off-by-one error for non-chunked responses
hace 1 año
JustAnotherArchivist
761606a5be
Add options to pass the URL context out through warc-dump-responses and http-response-bodies
hace 1 año
JustAnotherArchivist
9228c23ae6
Fix off-by-one error on WARC-Type parsing
hace 1 año
JustAnotherArchivist
a79291e081
Fix debug output for small/empty buffer
hace 1 año
JustAnotherArchivist
1737842841
Add http-response-bodies
hace 1 año
JustAnotherArchivist
9d60d7d3d7
Add comment about spec compliance
hace 1 año
JustAnotherArchivist
2e579964f9
More debug output
hace 1 año
JustAnotherArchivist
a432631d9b
Replace memmove with pointer arithmetic
hace 1 año
JustAnotherArchivist
27950fdc52
Check state at the input end
hace 1 año
JustAnotherArchivist
ead56c14a6
Remove dead code
hace 1 año
JustAnotherArchivist
882343eee4
Fix missing trailing LF on errors
hace 1 año
JustAnotherArchivist
dfc809abb4
Fix make exiting 1 if test script is missing
hace 1 año
JustAnotherArchivist
acd2fab899
Add warc-dump-responses
hace 1 año
JustAnotherArchivist
512ced5ebd
Make test script optional
hace 1 año
JustAnotherArchivist
67b12f645f
Fix exit statuses of ia-upload-stream and ia-wait-item-tasks
hace 1 año
JustAnotherArchivist
6a76814ec5
Add crude in-progress upload listing
hace 1 año
JustAnotherArchivist
34a3c9d0f3
Use _type instead of key check hack
hace 1 año
JustAnotherArchivist
ec20f38c82
Handle nested playlists
hace 1 año
JustAnotherArchivist
8386d33323
Add wpull2-log-colourise
hace 1 año
JustAnotherArchivist
a4e05d8932
Fix TypeError
hace 1 año
JustAnotherArchivist
0435954e65
Print net queue size
hace 1 año
JustAnotherArchivist
9f31ba8828
Add archivebot-fix-queue-counters
hace 1 año
JustAnotherArchivist
8d267c7f46
Add bencode2json
hace 1 año
JustAnotherArchivist
98adc6cfac
Exclude backslashes in channel patterns
hace 1 año
JustAnotherArchivist
a07c2b2374
Fix handling of invalid UTF-8 input
hace 1 año
JustAnotherArchivist
725db7d05d
Fix confusing output for skipped lines
hace 1 año
JustAnotherArchivist
3fca23c0a0
Fix pagination on users
hace 1 año
JustAnotherArchivist
c2f6f5054c
Handle actual 429
hace 1 año
JustAnotherArchivist
ccf4d678fb
Allow negative offsets to peek near the end of the file
hace 2 años
JustAnotherArchivist
4798154e98
Fix URLs without a path
hace 2 años
JustAnotherArchivist
1830d67283
Add ia-cdx-search-subdomains
hace 2 años
JustAnotherArchivist
565be7bf1b
Fix
hace 2 años
JustAnotherArchivist
e2085e6c81
Add cloudflare-email-decode
hace 2 años
JustAnotherArchivist
73f35f5591
Fix infinite loop when file ends with something that is not a WARC record
hace 2 años