Информация о статье
2015 г., Том 20, № 6, с.87-112
Шигаров А.О., Бычков И.В., Парамонов В.В., Белых В.Н.
Анализ и интерпретация произвольных таблиц на основе исполнения CRL-правил
Работа посвящена вопросам извлечения данных из произвольных полуструктурированных таблиц и их трансформации к структурированной форме, из которой они могут быть загружены в базу данных с помощью стандартных ETL-средств. Предложен формальный язык правил анализа и интерпретации таблиц, называемый CRL. Исполнение таких правил позволяет восстанавливать семантику таблицы, отсутствующую изначально, но необходимую для извлечения и трансформации табличной информации. Экспериментальные данные показывают применимость предлагаемого языка к задачам интеграции неструктурированных табличных данных.
[полный текст] Ключевые слова: интеграция неструктурированных табличных данных, анализ и интерпретация таблиц, извлечение информации из таблиц, трансформация таблиц
Библиографическая ссылка: Шигаров А.О., Бычков И.В., Парамонов В.В., Белых В.Н. Анализ и интерпретация произвольных таблиц на основе исполнения CRL-правил // Вычислительные технологии. 2015. Т. 20. № 6. С. 87-112
|
|
|