• Стр. 15-26

Система трансформации таблиц

А.О. Шигаров, И.В. Бычков, Г.М. Ружников, А.Е. Хмельнов, Р.К. Федоров

Аннотация

Работа посвящена вопросам анализа логической компоновки таблицы в задаче структурирования табличной информации, содержащейся в неструктурированных документах и изначально предназначенной для восприятия человеком, а не для машинной обработки. Предлагается система трансформации таблицы от слабоструктурированного представления к отношению реляционной модели данных. Эта система обеспечивает полуавтоматическое восстановление используемых в таблице измерений (доменов). Трансформация ориентирована на таблицы, сформированные из баз данных.

Ключевые слова

анализ и распознавание документов, извлечение информации из таблиц, анализ и обработка таблиц, преобразование таблиц