Краткий обзор Diffbot
Diffbot – это онлайн-сервис, включающий в себя набор инструментов (Extraction APIs, Knowledge Graph, Crawlbot) для превращения неструктурированных веб-данных в структурированную и полезную для бизнеса информацию. Программный решение Diffbot (рус. Диффбот) от компании Diffbot предназначен для превращения неструктурированных данных со всего Интернета в структурированные контекстные базы данных. Облачная система Diffbot включает в себя несколько инструментов (продуктов), построенных на основе технологий машинного зрения и обработки естественного языка, которые способны анализировать веб-страницы в высоконагруженном режиме и режиме реального времени. Программный продукт подходит для любого вида бизнеса от фрилансеров до крупных предприятий.
Программное обеспечение Diffbot включает в себя следующие основные функциональные блоки (подсистемы):
Граф знаний (Knowledge Graph). Продукт Knowledge Graph - это крупная контекстная база данных, состоящая из более чем 10 миллиардов объектов, включая организации, людей, продукты, статьи и многое другое. Инновационные технологии очистки и анализа фактов Knowledge Graph связывают объекты в контекстные базы данных, включающие более 1 триллиона фактов со всего интернета в около-реальном времени.
Усиление (Enhance). Продукт Enhance предоставляет собой информацию об организациях и людях, о которых у вас уже есть некоторая информация. Построенный на основе технологии графов знаний, Enhance позволяет пользователям создавать надежные профили данных об объектах, по которым они уже хранят некоторые данные.
Программный интерфейс для извлечения данных (Data Extraction API's). Интерфейсы извлечения данных Диффбот позволяют использовать технологии веб-анализа, чтобы указать определенный список веб-свойств. Система позоляет производить живое обновление информации о продуктах на сайтах электронной коммерции, поиск упоминаний брендов в новостях, участие в обсуждении и просмотре данных со многих сайтов и подобные варианты применения.