Информация о статье
2009 г., Том 14, № 2, с.58-73
Бычков И.В., Ружников Г.М., Хмельнов А.Е., Шигаров А.О.
Эвристический метод обнаружения таблиц в разноформатных документах
Предлагается эвристический метод обнаружения таблиц, ориентированный на особенности публикуемых статистических таблиц. В качестве входных данных в предлагаемом методе используются метафайлы, что позволяет применять его к разноформатным документам. В предлагаемом методе процесс обнаружение таблиц строится как сегментация страницы документа снизу вверх: от более простых элементов страницы к более сложным. Экспериментальная оценка этого метода показывает эффективность Его использования для широкого круга статистических таблиц.
[полный текст] Ключевые слова: анализ и распознавание и документов, извлечение информации, извлечение и обработка таблиц
Библиографическая ссылка: Бычков И.В., Ружников Г.М., Хмельнов А.Е., Шигаров А.О. Эвристический метод обнаружения таблиц в разноформатных документах // Вычислительные технологии. 2009. Т. 14. № 2. С. 58-73
|
|
|