1. Что такое Платформы интеллектуальной обработки данных
Платформы интеллектуальной обработки данных (ПИОД, англ. Intelligent Data Processing Platforms, IDP) – это комплексные решения, предназначенные для анализа и обработки больших объёмов данных с использованием методов машинного обучения, искусственного интеллекта и других технологий. Они позволяют автоматизировать процессы извлечения, трансформации и загрузки данных, а также обеспечивают возможности для глубокого анализа, прогнозирования и визуализации информации.
2. Обзор основных функций и возможностей Платформы интеллектуальной обработки данных
- Администрирование
- Возможность администрирования позволяет осуществлять настройку и управление функциональностью системы, а также управление учётными записями и правами доступа к системе.
- Импорт/экспорт данных
- Возможность импорта и/или экспорта данных в продукте позволяет загрузить данные из наиболее популярных файловых форматов или выгрузить рабочие данные в файл для дальнейшего использования в другом ПО.
- Многопользовательский доступ
- Возможность многопользовательской доступа в программную систему обеспечивает одновременную работу нескольких пользователей на одной базе данных под собственными учётными записями. Пользователи в этом случае могут иметь отличающиеся права доступа к данным и функциям программного обеспечения.
- Наличие API
- Часто при использовании современного делового программного обеспечения возникает потребность автоматической передачи данных из одного ПО в другое. Например, может быть полезно автоматически передавать данные из Системы управления взаимоотношениями с клиентами (CRM) в Систему бухгалтерского учёта (БУ).
Для обеспечения такого и подобных сопряжений программные системы оснащаются специальными Прикладными программными интерфейсами (англ. API, Application Programming Interface). С помощью таких API любые компетентные программисты смогут связать два программных продукта между собой для автоматического обмена информацией.
- Отчётность и аналитика
- Наличие у продукта функций подготовки отчётности и/или аналитики позволяют получать систематизированные и визуализированные данные из системы для последующего анализа и принятия решений на основе данных.
3. Виды Платформы интеллектуальной обработки данных
- Системы компьютерного зрения
- Программные системы компьютерного зрения (СКЗ, англ. Computer vision, CV) предназначены для обработки графической информации и извлечения из неё полезных данных. С помощью такого программного обеспечения может обрабатываться самая разнообразная информация от видеопотока в супермаркете до данных фармацевтических экспериментов в научной лаборатории.
- Системы распознавания речи
- Программы и системы распознавания речи (СРР, англ. Speech Recognition Systems, SRS) используется для преобразования разговорного языка в текстовую информацию с помощью алгоритмов распознавания речи.
- Системы анализа и синтеза речи
- Системы анализа и синтеза речи (САСР, англ. Speech Analysis and Synthesis Systems, SAS) – это комплекс технологий и программных решений, предназначенных для обработки речевой информации. Они позволяют анализировать, распознавать, синтезировать и преобразовывать человеческую речь с помощью алгоритмов машинного обучения, обработки естественного языка и других методов.
- Системы видеоаналитики
- Программные системы видеоаналитики (ВА, англ. Video Content Analysis, VCA) предназначены для интеллектуальной обработки видеопотока и извлечения из него полезных данных. С помощью данного программного обеспечения может обрабатываться самая разнообразная информация от видеопотока от уличных камер умного города до данных от видеокамеры умного станка для контроля качества продукции.
- Системы обработки естественного языка
- Системы обработки естественного языка (СОЕЯ, англ. Natural language processing, NLP) помогают пользователям получать информацию как из структурированных, так и из неструктурированных текстовых данных, включая анализ настроения, ключевых фраз, языка, тем и шаблонов. Эти решения используют машинное обучение, чтобы представить данные в наиболее верной интерпретации.
- Системы оптического распознавания символов
- Программные системы и сервисы оптического распознавания символов (ОРС, англ. Optical character recognition, OCR) предназначены для сканирования текста, обработки содержимого и извлечения полезных данных из документов различных видов. С помощью такого программного обеспечения, как правило, обрабатываются счета-фактуры, акты, накладные, квитанции, клиентские формы, опросные листы и документы сотрудников.
- Системы контент-анализа
- Программные сервисы и системы контент-анализа (СКА, англ. Content Analysis Systems, CA) позволяют выполнять качественный и количественный анализ медиа-содержимого - исследовать частоту упоминаний, тональность, распределение рассматриваемых тем. Анализ может производиться в отношении различных медиа-каналов распределения контента: телевидения, радио, газет, журналов, онлайн-СМИ, социальных сетей, книг, периодических изданий, кинофильмов, игр или закрытых информационных баз.
4. В каких странах разрабатываются Платформы интеллектуальной обработки данных
Компании-разработчики, создающие intelligent-data-processing-platforms, работают в различных странах. Ниже перечислены программные продукты данного класса по странам происхождения
- Россия
- Entera
- США
- Tesseract OCR
- Нидерланды
- Elasticsearch