Краткий обзор Diffbot
Diffbot – это онлайн-сервис, включающий в себя набор инструментов (Extraction APIs, Knowledge Graph, Crawlbot) для превращения неструктурированных веб-данных в структурированную и полезную для бизнеса информацию. Программный решение Diffbot (рус. Диффбот) от компании Diffbot предназначен для превращения неструктурированных данных со всего Интернета в структурированные контекстные базы данных. Облачная система Diffbot включает в себя несколько инструментов (продуктов), построенных на основе технологий машинного зрения и обработки естественного языка, которые способны анализировать веб-страницы в высоконагруженном режиме и режиме реального времени. Программный продукт подходит для любого вида бизнеса от фрилансеров до крупных предприятий.
Программное обеспечение Diffbot включает в себя следующие основные функциональные блоки (подсистемы):
-
Граф знаний (Knowledge Graph). Продукт Knowledge Graph - это крупная контекстная база данных, состоящая из более чем 10 миллиардов объектов, включая организации, людей, продукты, статьи и многое другое. Инновационные технологии очистки и анализа фактов Knowledge Graph связывают объекты в контекстные базы данных, включающие более 1 триллиона фактов со всего интернета в около-реальном времени.
-
Усиление (Enhance). Продукт Enhance предоставляет собой информацию об организациях и людях, о которых у вас уже есть некоторая информация. Построенный на основе технологии графов знаний, Enhance позволяет пользователям создавать надежные профили данных об объектах, по которым они уже хранят некоторые данные.
-
Программный интерфейс для извлечения данных (Data Extraction API's). Интерфейсы извлечения данных Диффбот позволяют использовать технологии веб-анализа, чтобы указать определенный список веб-свойств. Система позоляет производить живое обновление информации о продуктах на сайтах электронной коммерции, поиск упоминаний брендов в новостях, участие в обсуждении и просмотре данных со многих сайтов и подобные варианты применения.