• DOI 10.14357/20718632190204
  • Стр. 32-43

Веб-сервис на основе SDK для распознавания документов

Д.П. Маталов, Е.Л. Плискин

Аннотация

Статья обобщает опыт разработки веб-службы на основе SDK для распознавания документов (OCR). Рассматриваются вопросы устойчивости и производительности веб-службы: способность не терять данные при высокой нагрузке и после перезапуска; способность своевременно обнаруживать ошибки, ограничивать их распространение и длительность; а также свойство детерминированности веб-службы в условиях параллельной обработки множества запросов. Высокая производительность подразумевает умеренные накладные расходы, связанные с приёмом запросов и отправкой ответов клиентам, помимо собственно распознавания. Описанное решение может применяться для создания веб-службы из любого SDK, который позволяет обрабатывать входные документы и получать из них выходные файлы, в том числе не обязательно в связи с технологиями оптического распознавания.

Ключевые слова

SDK, REST, SOAP, Java, Web service, оптическое распознавание, OCR, многопоточность