Сервер распознавания

Системные требования для сервера графического распознавания:

Рекомендуемые системные требования

Описание

Операционная система

  • Ubuntu 18.04;

  • Ubuntu 20.04;

  • Astra Linux 1.7.

Дополнительное программное обеспечение

  • Python 3.7;

  • Python 3.7-venv;

  • libpoppler-cpp0v5 poppler-utils libsm6 tesseract-ocr.

    Проверить версию Python
    Проверить текущую версию Python: python3 --version

    Установить Python3.7: sudo apt install python3.7

Процессор

Intel или AMD с поддержкой AVX инструкций. Количество потоков/ядер зависит от числа пользователей.
Одно ядро способно обработать до 28 800 изображений за сутки.
В среднем пользователь генерирует около 2000 изображений в день.

Размер диска

до 100 ГБ.

Диск

NVME со скоростью чтения-записи не менее 1500 МБ/сек.

IOPS

не менее 5000 операций ввода-вывода в секунду.

Оперативная память

Используется для распознавания в зависимости от размера и сложности файла.
Рекомендуется рассчитывать до 80 МБ на графическое изображение или снимок экрана,
до 300 МБ на сложный PDF.

Ниже приведены требования к процессору и оперативной памяти для обработки всех данных за сутки, включая тяжелые файлы:

Агентов

Среднее количество изображений

CPU

RAM

10

20 000

2

4 GB

50

100 000

6

6 GB

100

200 000

9

6 GB

200

400 000

16

8 GB

500

1 000 000

37

16 GB

1000

2 000 000

72

24 GB

Расчет количества потоков/ядер и объёма оперативной памяти

Ниже представлены расчеты для определения системных требований.

Примечание

Включенная опция Снимки экрана по смене фокуса окна при выключенной Делать скриншоты только при смене процесса генерирует огромное количество скриншотов.

Как правило, у пользователя генерируется от 1500 до 2000 скриншотов в день, в зависимости от его активности и количества мониторов. Одно ядро в день может обработать до 28800 скриншотов.

Расчёт производится для 300 ПК при включенном модуле Снимки экрана.

Таким образом, количество скриншотов в день:

2000 * 300 = 600 000 скриншотов

Итоговое количество скриншотов делим на количество изображений, обрабатываемых одним ядром:

600 000 / 28 800 ≈ 21 потоков/ядер

Расчёт объёма оперативной памяти

В среднем для обработки изображения требуется около 80 МБ на ядро. Для расчёта объёма оперативной памяти, умножим количество ядер/потоков на объём памяти для одного ядра и одного потока:

21*80 = 1680 МБ

Параллельно работают конвертеры изображений и сама операционная система сервера. В зависимости от получаемых данных они требуют от 1 до 4 ГБ RAM.

Таким образом, для оптимального функционирования системы под большой нагрузкой, используйте на сервере от 8 ГБ оперативной памяти.