Бураков А.Ю.   Сидоров Н.Я.  

Особенности использования алгоритмов компьютерного зрения в задаче поиска (анализа) объектов на гидроакустическом изображении

Reporter: Бураков А.Ю.

ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ В ЗАДАЧЕ ПОИСКА (АНАЛИИЗА) ОБЪЕКТОВ НА ГИДРОАКУСТИЧЕСКОМ ИЗОБРАЖЕНИИ.

А.Ю. Бураков (МФТИ (ГУ) г.Долгопрудный), Н.Я. Сидоров («Лаборатория Касперского» г. Москва)

 

            В настоящее время широкое распространение получили методы технического зрения. Это связано как с ростом производительности вычислительной техники и повышением качества съемки, так и с широким спектром задач, к которым они применимы. Интенсивные исследования в этой области имеют многолетнюю историю и связаны с работами О. Селфриджа, Ф.Розенблатта, Л. Робертса, Г.-Х. Нагеля и других.

Из всего разнообразия разработанных алгоритмов можно выделить несколько ключевых групп: предварительная обработка, выделение деталей, детектирование/сегментация и высокоуровневая обработка. Для решения (или улучшения точности решения) некоторых задач требуется последовательное применение алгоритмов из разных групп. При этом особенности съемки могут значительно повлиять на итоговое изображение, и как следствие – на результаты работы различных алгоритмов. В частности, при создании гидроакустического изображения возможны такие искажения как: двоение объекта, дрейф, и другие.

Стоит отметить, что в последнее время значительный прогресс в распознавании визуальных образов был достигнут с появлением методов снижения размерности и сверточных нейронных сетей. Однако для качественного обучения нейронной сети требуется предоставить большое количество однотипных изображений, содержащих распознаваемый объект, что в рамках работы с акустическими изображениями является практически невозможным, так как объекты на данных изображениях практически всегда подвержены серьезным искажениям. Исходя из этого предлагается сделать выбор в пользу методов, основанных на выделении особы точек изображения, выделении границ объектов, и сверке их с некоторым шаблонным изображением (или небольшим набором изображений) искомого объекта.

Используя модель акустического изображения на основе линейной комбинации В-сплайнов 2, 3, 4 и 5-го порядков, получены операторы частных производных первого и второго порядка и их дискретные аналоги. На основе этой модели найдены дискретные значения операторов магнитуды градиента, лапласиана, детерминанта гессиана и кривизны уровня масштабирования которые использовались в предложенных методах распознавания. Так же опробована модификация метода SIFT использующая модель акустического изображения на основе линейной комбинации В-сплайнов вместо гауссова подхода представления изображения.

Проверка методов на акустических изображениях с различными искаженными подводными объектами показала ее принципиальную работоспособность. Используемые методы позволяют быстро выделить все области подозрительные на наличие объекта, что существенно облегчает работу оператору, просматривающему карту подводной обстановки. Также по итогам тестирования для выборки из 7 тестовых изображений, лучшими операторами оказались: магнитуда градиента и кривизна уровня масштабирования.

Несмотря на имеющиеся успехи, современные исследования подтверждают факт, что алгоритмы распознавания изображений до сих пор не обладают полноценными способностями биологических систем, такими как способность функционировать на широкой, а не ограниченном множестве классов распознавания, устойчивость к инвариантным преобразованиям и вариативности объектов в пределах категорий.

Литература

1.Е.Ю. Зуева. Компьютерное зрение в ИПМ им. В.М. Келдыша РАН – история развития. [Электронный ресурс]. URL: http://www.keldysh.ru/papers/2009/art04/Zueva_09.htm (Дата обращения: 17.02.2018).

2.Д. Форсайт, Ж. Понс. Компьютерное зрение. Современный подход. –М.: «Вильямс», 2004.

3.С.Ю. Желтов. Обработка и анализ изображений в задачах машинного зрения. — М.: Физматкнига, 2010.

4.Л. Шапиро, Дж. Стокман. Компьютерное зрение. – М.: Бином. Лаборатория знаний, 2009.

5.Сойфер В.А. Методы компьютерной обработки изображений, М.: Физматлит, 2003.

6.Р. Гонсалес, Р. Вудс. Цифровая обработка изображений. – М.: Техносфера, 2012.

7.Hubel D.H. Brain and visual perception / D.H. Hubel, T. N. Wiesel, с. 34-36, 2005.


To reports list