Программные системы извлечения данных (СИД, англ. Data Extraction Systems, DE) позволяют искать анализировать неструктурированные данные и структурированные источники (веб-страницы, графику, аудиопоток, текст, статистические наборы) и извлекать из них сведения, имеющие практическое применение для решения задач бизнеса.
Программные системы извлечения данных (СИД, англ. Data Extraction Systems, DE) позволяют искать анализировать неструктурированные данные и структурированные источники (веб-страницы, графику, аудиопоток, текст, статистические наборы) и извлекать из них сведения, имеющие практическое применение для решения задач бизнеса.
Diffbot
Diffbot – это онлайн-сервис, включающий в себя набор инструментов (Extraction APIs, Knowledge Graph, Crawlbot) для превращения неструктурированных веб-данных в структурированную и полезную для бизнеса информацию.
ParseHub
ParseHub – это программный инструмент с несложным графическим интерфейсом, позволяющий захватывать и извлекать данные из интернет-сайтов.
import.io
import.io – это онлайн-сервис, предодставляющий удобный инструментарий для извлечения со страниц веб-сайтов, хранения, объединения, интеграции в собственные БД и визуализации метаданных.
Octopus Datas
Octoparse – это облачное программное обеспечение,предназначенное для парсинга сайтов, сбора, хранения и анализа веб-данных.
Программные системы извлечения данных (СИД, англ. Data Extraction Systems, DE) позволяют искать анализировать неструктурированные данные и структурированные источники (веб-страницы, графику, аудиопоток, текст, статистические наборы) и извлекать из них сведения, имеющие практическое применение для решения задач бизнеса.