Многопоточность¶

FUCKTAR разработан с учетом требований многопоточных приложений. В этом разделе мы рассмотрим, как использовать библиотеку в многопоточной среде.

Потокобезопасность¶

FUCKTAR обеспечивает потокобезопасность при генерации уникальных данных благодаря использованию файловых блокировок. Это позволяет безопасно использовать библиотеку в многопоточных приложениях.

Пример использования с ThreadPoolExecutor¶

import concurrent.futures
from fucktar.generator import BasePattern

def generate_users_batch(count):
    return UserPatterns().configure(unique=True).generate(count=count)

# Генерация в нескольких потоках
with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
    futures = [
        executor.submit(generate_users_batch, 100) 
        for _ in range(4)
    ]

    results = [future.result() for future in futures]

Пример использования с threading¶

import threading
import queue
from fucktar.generator import BasePattern

def generate_users_thread(count, result_queue):
    try:
        users = UserPatterns().configure(unique=True).generate(count=count)
        result_queue.put(users)
    except Exception as e:
        result_queue.put(e)

# Создание очереди для результатов
result_queue = queue.Queue()

# Создание и запуск потоков
threads = []
for i in range(4):
    thread = threading.Thread(target=generate_users_thread, args=(100, result_queue))
    thread.start()
    threads.append(thread)

# Ожидание завершения всех потоков
for thread in threads:
    thread.join()

# Сбор результатов
results = []
while not result_queue.empty():
    results.append(result_queue.get())

Ограничения многопоточности¶

При использовании FUCKTAR в многопоточной среде следует учитывать следующие ограничения:

Файловые блокировки могут снижать производительность при большом количестве потоков
Все потоки должны иметь доступ к общей файловой системе для корректной работы с историей уникальности
При использовании разных scopes в разных потоках блокировки не будут мешать друг другу

Пример с разными scopes¶

import concurrent.futures

def generate_users():
    return UserPatterns().configure(unique=True).generate(count=100)

def generate_products():
    return ProductPatterns().configure(unique=True).generate(count=100)

# Генерация разных типов данных в разных потоках
with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
    user_future = executor.submit(generate_users)
    product_future = executor.submit(generate_products)

    users = user_future.result()
    products = product_future.result()

Производительность в многопоточной среде¶

При использовании FUCKTAR в многопоточной среде следует учитывать, что:

Файловые блокировки могут создавать узкое место при частых операциях записи
Для повышения производительности рекомендуется генерировать данные пакетами
Использование SSD вместо HDD может значительно повысить производительность при работе с историей

Альтернативные подходы¶

Если производительность является критичной, рассмотрите следующие альтернативы:

Генерация данных без уникальности в потоках, с последующей фильтрацией дубликатов
Использование разных директорий для хранения истории в разных потоках
Предварительная генерация больших объемов данных с последующим использованием в потоках

# Пример предварительной генерации
def pregenerate_data():
    # Генерация большого объема данных без уникальности
    users = UserPatterns().generate(count=10000)

    # Сохранение в потокобезопасную структуру данных
    return queue.Queue(users)

# Использование предварительно сгенерированных данных в потоках
pregenerated_users = pregenerate_data()

Эти подходы могут быть более эффективными в сценариях с высокими требованиями к производительности.