Сервер распознавания

Внимание

Соблюдайте требования для стабильной работы сервера, баз данных и компонентов системы. Невыполнение требований может вызвать нестабильную работу системы.

Системные требования для сервера распознавания:

Рекомендуемые системные требования

Описание

Операционная система

  • Ubuntu 18.04;

  • Ubuntu 20.04;

  • Ubuntu 22.04;

  • Astra Linux 1.7.

Дополнительное программное обеспечение

  • Python 3.7;

  • Python 3.7-venv;

  • whisper 0.5.93;

  • libpoppler-cpp0v5 poppler-utils libsm6 tesseract-ocr ffmpeg.

    Проверить версию Python
    Проверить текущую версию Python: python3 --version

    Установить Python3.7: sudo apt install python3.7

Процессор

Intel или AMD с поддержкой AVX2 инструкций. Количество потоков/ядер зависит от числа пользователей.
Одно ядро способно обработать до 28 800 изображений за сутки.
В среднем пользователь генерирует около 2000 изображений в день.

Размер диска

До 100 ГБ.

Диск

NVME со скоростью чтения-записи не менее 1500 МБ/сек.

IOPS

Не менее 5000 операций ввода-вывода в секунду.

Оперативная память

Используется для распознавания в зависимости от размера и сложности файла.
Рекомендуется рассчитывать до 80 МБ на графическое изображение или снимок экрана,
до 300 МБ.

Ниже приведены требования к процессору и оперативной памяти для обработки всех данных за сутки, включая тяжелые файлы:

Агентов

Среднее количество изображений

CPU

RAM

10

20 000

2

4 GB

50

100 000

6

6 GB

100

200 000

9

6 GB

200

400 000

16

8 GB

500

1 000 000

37

16 GB

1000

2 000 000

72

24 GB

Расчет количества потоков/ядер и объема оперативной памяти

Ниже представлены расчеты для определения системных требований.

Примечание

Включенная опция Снимки экрана по смене фокуса окна при выключенной Делать скриншоты только при смене процесса генерирует огромное количество скриншотов.

Как правило, у пользователя генерируется от 1500 до 2000 скриншотов в день в зависимости от его активности и количества мониторов. Одно ядро в день может обработать до 28800 скриншотов.

Расчет производится для 300 ПК при включенном модуле Снимки экрана.

Таким образом, количество скриншотов в день:

2000 * 300 = 600 000 скриншотов

Итоговое количество скриншотов делим на количество изображений, которое обрабатывает одно ядро:

600 000 / 28 800 ≈ 21 потоков/ядер

Расчет объема оперативной памяти

В среднем для обработки изображения требуется около 500 МБ на ядро. Для расчета объема оперативной памяти умножим количество ядер/потоков на объем памяти для одного ядра и одного потока:

21*500 = 10500 МБ ≈ 10,5 ГБ

Параллельно работают конвертеры изображений и сама операционная система сервера. В зависимости от получаемых данных они требуют от 1 до 4 ГБ RAM.

Таким образом, для оптимального функционирования системы под большой нагрузкой используйте на сервере 12–15 ГБ от оперативной памяти.

Последнее обновление: 08.10.25