monero.fail/scrape.py

#!/usr/bin/env python3

import os
import requests
import bs4

os.system("mkdir -p infodump/thumbs")
url = "https://moneroinfodump.neocities.org/"
contents = requests.get(url, timeout=15).content
soup = bs4.BeautifulSoup(contents, "html.parser")
images = soup.find_all("img")
links = soup.find_all("a")

for image in images:
    img = image.get("src")
    if img.startswith("http"):
        os.system(f"wget -q --no-clobber -O infodump/{os.path.basename(img)} {img}")
        image["src"] = os.path.basename(img)
    elif img.startswith("data:image/png"):
        pass
    else:
        os.system(f"wget -q --no-clobber -O infodump/{img} {img}")
        image["src"] = img

for link in links:
    href = link.get("href")
    if href and href.startswith("https://i.imgur.com"):
        link["href"] = os.path.basename(href)

with open("infodump/index.html", "w") as f:
    f.write(str(soup))
add mirror to monero infodump site 2 years ago			`#!/usr/bin/env python3`

			`import os`
			`import requests`
			`import bs4`

split resources out 2 years ago			`os.system("mkdir -p infodump/thumbs")`
			`url = "https://moneroinfodump.neocities.org/"`
add mirror to monero infodump site 2 years ago			`contents = requests.get(url, timeout=15).content`
split resources out 2 years ago			`soup = bs4.BeautifulSoup(contents, "html.parser")`
			`images = soup.find_all("img")`
			`links = soup.find_all("a")`
add mirror to monero infodump site 2 years ago
			`for image in images:`
split resources out 2 years ago			`img = image.get("src")`
			`if img.startswith("http"):`
			`os.system(f"wget -q --no-clobber -O infodump/{os.path.basename(img)} {img}")`
			`image["src"] = os.path.basename(img)`
			`elif img.startswith("data:image/png"):`
add mirror to monero infodump site 2 years ago			`pass`
			`else:`
split resources out 2 years ago			`os.system(f"wget -q --no-clobber -O infodump/{img} {img}")`
			`image["src"] = img`
add mirror to monero infodump site 2 years ago
			`for link in links:`
split resources out 2 years ago			`href = link.get("href")`
			`if href and href.startswith("https://i.imgur.com"):`
			`link["href"] = os.path.basename(href)`
add mirror to monero infodump site 2 years ago
split resources out 2 years ago			`with open("infodump/index.html", "w") as f:`
			`f.write(str(soup))`