Проект “Мивар 3D” разрабатывает интеллектуальные системы анализа изображений. Сегодня искусственный интеллект способен распознавать не только слова, но и графические изображения. Описание разнородного набора графических данных в терминах человеческих понятий в свою очередь позволяет:
- семантически описывать изображения;
- автоматически тегировать изображения;
- осуществлять поиск и ранжирование изображений.
Как работает
Основная задача ядра системы – преобразовать изображения в описания, с которыми далее может работать искусственный интеллект. Именно эти описания позволяют системе искать, распознавать, анализировать содержание изображений, тегировать их и выполнять другие задачи, поставленные пользователем.
Процесс анализа изображения состоит из нескольких этапов. На первом происходит первичная обработка и подготовка изображения к работе, внесение его в базу данных. Далее изображение попадает на конвейер с обработчиками, где и происходит основной анализ изображения. Для этого используются динамически подключаемые модули сегментации, детекции, классификации, наделения свойствами и пространственными отношениями. Некоторые из модулей действуют независимо друг от друга, другие - запускаются в строгой последовательности и работают в комплексе.
Модули-обработчики содержат определенную предобработку (преобразование размеров и цветов, гармонизация гистограммы, уменьшение цветности и т.д.). После этого начинается работа алгоритмов Computer Vision или Machine Learning. Результатом работы является унифицированный для всех проектов граф “Вещь-Свойство-Отношение” (VSO
).
Результаты обработки заносятся в базу данных для дальнейшей работы.
Какие задачи решает
Ядро системы позволяет описывать содержимое картинок по следующим критериям:
- распознавание и различение лиц;
- определение сцен и жанров (портрет, природа, лес, город, тексты);
- оценка качества (четкость и цветность);
- определение текста и распознавание его;
- обработка данных из exif: координаты, дату, параметры съемки;
- нахождение дубликатов.
Какие продукты созданы на базе системы
44to-archive
Продукт позволяет проводить удобное хранение, сортировку и представление персональных фотогалерей. С помощью алгоритмов Computer Vision и Machine Learning все изображения в базе индексируются и подготавливаются к быстрой сортировке и выборке по выбранным параметрам.
Основные функции 44to-archive:
- семантическое описание изображений;
- сортировка, фильтрация, отбор изображений;
- открытый API, доступный для других проектов.
ФотоФабула
После обработки и индексации изображения из персональной галереи пользователя в автоматическом режиме заполняют вакантные места в шаблоне “истории” и затем предоставляются пользователю.
Основные функции “ФотоФабулы”:
- автоматическое формирование фотоистории;
- “умные” шаблоны повествования;
- автоподбор фотографий по смыслу.