Yield

def scrape_all_data(pages):
    data = []
    for page in range(1, pages + 1):
        page_data = [f"Item {i} from page {page}" for i in range(100)]
        data.extend(page_data)
    return data

# Simulating data scraping using a generator
def scrape_data_generator(pages):
    for page in range(1, pages + 1):
        page_data = [f"Item {i} from page {page}" for i in range(100)]
        yield page_data  # Yielding data one page at a time

data_list = scrape_all_data(10)
data_generator = scrape_data_generator(10)

print(f"Memory usage with list: {sys.getsizeof(data_list)} bytes")
print(f"Memory usage with generator: {sys.getsizeof(data_generator)} bytes")

Memory Efficient Scraping

Introduction

Yield

Class Activity

Learn More

Discover Advanced Topic

Homework Assignment

Thank you