Video Indexer позволяет определять бренды в кадре

Медиа-сервисы Azure рады представить возможность экспортировать ключевые кадры с высоким разрешением из индексатора видео Azure Media Service. Ранее кадры экспортировались в уменьшенном разрешении по сравнению с исходным видео. Извлечение ключевых кадров высокого разрешения даст изображения оригинального качества и позволит использовать модели искусственного интеллекта на основе изображений, предоставляемых службами Microsoft Computer Vision и Custom Vision. 

Вы можете использовать ключевые кадры, извлеченные из Video Indexer, например, для идентификации логотипов или для монетизации и обеспечения безопасности бренда, для добавления описания сцен и для точной идентификации специфических объектов, относящихся к вашей организации, таких как идентификация марки автомобиля или места.

Варианты использования в нововведении

  • Использование ключевых кадров для автоматического получения описания изображения.

Вы можете автоматизировать процесс «субтитров» различных визуальных снимков вашего видео с помощью модели описания изображений в Computer Vision, чтобы сделать контент более доступным для людей с нарушениями зрения. Эта модель предоставляет несколько вариантов описания, а также значения достоверности для изображения. Вы можете взять описания каждого ключевого кадра высокого разрешения и соединить их вместе, чтобы создать звуковую дорожку описания для вашего видео.

  • Использование ключевых кадров для обнаружения логотипа

Хотя Video Indexer обнаруживает торговые марки в речевом и визуальном текстах, он пока не поддерживает обнаружение торговых марок по логотипам. Вместо этого вы можете запускать ключевые кадры с помощью модели определения бренда на основе логотипов Computer Vision, чтобы обнаруживать экземпляры логотипов в вашем контенте.

Это также может помочь вам в обеспечении безопасности бренда, так как вы сможете опознать и контролировать компании, которые просматривают ваш контент. Например, вы можете не хотеть демонстрировать свой логотип бренду-конкуренту.  Кроме того, теперь вы можете монетизировать бренды, отображаемые в вашем контенте, через спонсорские соглашения или контекстную рекламу.

Также, вы можете сопоставить результаты с временной меткой своего ключевого кадра, чтобы определить, когда именно логотип отображается в вашем видео и как долго. Например, если у вас есть спонсорское соглашение с создателем контента для показа вашего логотипа в течение определенного периода времени в их видео. Это поможет определить, были ли соблюдены условия соглашения.

Модель распознавания логотипа Computer Vision может обнаруживать и распознавать тысячи различных брендов из коробки. Однако, если вы работаете с логотипами, которые являются специфическими для вашего варианта использования или иным образом не могут быть частью стандартной базы данных логотипов, вы также можете использовать Custom Vision для создания пользовательского детектора объектов и, по существу, для обучения своей собственной базе данных.

Детектор логотипа Computer Vision, обнаруживающий логотип Microsoft.

В дополнение к описанию изображений и обнаружению логотипов API-интерфейсы Computer Vision предоставляют различные возможности, такие как обнаружение объектов, категоризация изображений и многое другое. Возможности безграничны, когда вы используете ключевые кадры с высоким разрешением в сочетании с этими предложениями.

Например, модель обнаружения объектов в Computer Vision предоставляет ограничивающие рамки для общих готовых объектов, которые уже обнаружены как часть Video Indexer сегодня. Вы можете использовать эти ограничивающие рамки, чтобы размыть некоторые объекты, которые не соответствуют вашим стандартам.

Модель обнаружения объекта

Ключевые кадры высокого разрешения в сочетании с Custom Vision могут быть использованы для достижения множества различных пользовательских сценариев использования. Например, вы можете обучить модель, чтобы определить, какой тип машины (или даже породы кошек) показывает на снимке.

Если есть интересующие вас объекты, которые могут быть уникальными, откройте Custom Vision для создания пользовательского классификатора для тегов-визуалов или пользовательского детектора объектов для тегов и предоставления ограничивающих рамок визуальных объектов.

Comments are closed.