Обратная сторона лая

Семь лет назад появились сообщения о созданном японскими специалистами электронном переводчике с "собачьего". Стоило собаке залаять, как нехитрый приборчик стоимостью в несколько десятков долларов отображал на своем дисплее одну из заранее запрограммированных фраз-переводов, например, «я голоден» или «хочу гулять». Мнения о пользе такого прибора разделились: серьезные специалисты считали его не более чем игрушкой, но многие рядовые собаководы отмечали, что коробочка с дисплеем и вправду дает адекватный перевод. Так есть ли в собачьем лае строгие закономерности и возможен ли его смысловой анализ? Ученые кафедры этологии Университета Лоранда Этвеша (Будапешт), вооружившись новейшим оборудованием, ищут ответ на этот вопрос.

Введение

В своих ранних исследованиях ученые установили, что в принципе люди способны на слух различать лай собак и по нему определять эмоциональное состояние животного. Как правило, владелец пса прекрасно понимает лай своего четвероногого спутника. Однако даже опытный собаковод не всегда может «расшифровать» лай незнакомой ему собаки. Поэтому для сбора исходной статистической информации исследователи использовали компьютерное оборудование и адаптивный «обучающийся» алгоритм акустического анализа. В базу данных компьютера было загружено более шести тысяч образцов собачьего лая в различных ситуациях. Задача используемого алгоритма состояла в том, чтобы научиться определять акустические особенности лая в различном контексте. На этапе сбора данных с помощью алгоритма анализировали «знакомый» лай в ряде стандартных ситуаций. После того как был достигнут самый высокий порог идентификации, эффективность уже «обученного» алгоритма была проверена в задаче классификации ранее неизвестного лая. Нормы распознавания были выше случайного уровня: алгоритм мог классифицировать лай согласно ситуации с эффективностью 43% и мог распознавать лай отдельных собак с эффективностью 52%. Ученые пришли к выводу, что подобного рода алгоритмы являются эффективным инструментом для анализа акустических данных в различных исследованиях поведения.

К сожалению, венгерские ученые не были знакомы с трудами советских дельфинологов, проводивших подобные исследования в конце 70-х годов XX века, используя метод информационно-логического анализа. Полученные результаты были весьма похожи на результаты венгерских специалистов. В любом поведенческом исследовании, особенно когда сбор данных автоматизирован (например, акустический анализ сигнала), набирается очень большая база данных. Автоматизированный процесс анализа не только помогает ученым справляться с информационной перегрузкой, но и ускоряет решение задач, касающихся классификации.

Модели ситуации

В опытах принимали участие 14 собак венгерской пастушьей породы муди (четыре кобеля, десять сук). Их лай записывался в шести различных поведенческих ситуациях, большинство которых моделировалось в доме владельца, за исключением таких ситуаций, как «борьба»(происходила на дрессировочной площадке) и «одиночество»(на улице или в парке).
НЕЗНАКОМЕЦ
Экспериментатор (мужчина, 23 года), незнакомый собакам, появлялся возле калитки сада владельца или входной двери квартиры в отсутствие хозяев. Он записывал лай собак в течение двух-трех минут. Всего было записано 1802 фонограммы.
БОРЬБА
Владелец держал собаку на поводке, дрессировщик дразнил ее, а хозяин поощрял лай питомца. Записано 1 118 фонограмм.
ПРОГУЛКА
Хозяин делал вид, что собирается на прогулку: брал в руки поводок и ошейник, подходил к двери и говорил: «Пойдем гулять!». записана 1 231 фонограмма.
ОДИНОЧЕСТВО
Хозяин привязывал собаку к дереву в парке или на улице и уходил от нее. Записано 752 фонограммы.
МЯЧИК
Хозяин держал в руке мячик или другую любимую игрушку собаки и поднимал ее повыше, дразня питомца, чтобы вызвать его лай. Записана 1 001 фонограмма.
ИГРА
Владельца просили поиграть с собакой в обычную игру, например в перетягивание игрушки или догонялки. Экспериментатор записывал лай в ходе шуточной борьбы. Записано742 фонограммы.

Подготовка звукового материала

Во время записи лая экспериментатор держал микрофон не дальше чем в четырех-пяти метрах от собаки. По возможности он старался стоять прямо перед животным. Собранный материал был оцифрован и занесен в компьютер. Большинство записей содержало три-четыре спектрограммы (т.е. изображения частотно-временной характеристики сигнала) «такта» лая, но каждый «гав» вручную выделялся в отдельный файл. Это привело к получению исходной базы данных в 6 646 звуковых файлов, каждый из которых содержал единственный «гав». Конечно, при такой обработке утратился интервал между тактами, который в реальной обстановке также нес смысловую нагрузку, зато из фонограмм была удалена значительная часть фонового шума, которая могла помешать анализу.

Для анализа собранного материала была использована компьютерная программа на основе древовидного алгоритма Байеса, который в настоящее время считается лучшим «обучающимся» алгоритмом для решения задач селекции и классификации. В частности, этот же алгоритм используется для фильтрации сообщений электронной почты и автоматического отсеивания спама. Как уже говорилось выше, селекция велась в двух направлениях: определение ситуации, в которой лаяла собака, и узнавание лая той или иной особи. Кроме того, полученные результаты сравнивались с аналогичными результатами ранних исследований, в которых распознавание лая проводилось на слух.

Результаты

Эксперимент 1: классификация лая в контексте ситуации
Здесь машине надо было понять, в какой ситуации раздается тот или иной лай (типа «эта собака лает на дверь, или ее дразнит какой-то балбес?»). Компьютер смог правильно классифицировать лай в 43% случаев (2 835 лаев из 6 46). Лучше всего он идентифицировал лай, записанный в ситуациях «борьба» и «незнакомец», хуже всего - в ситуации «игра». Эффективность программного распознавания лая была соизмерима той, с какой человек распознает лай незнакомой собаки в ситуациях «незнакомец» "борьба" (они были также самыми легкими для людей). В ситуациях «прогулка» и «мячик» программа лучше поняла лай, чем люди. Однако в контекстах «игра» и «одиночество» собаководы понимали лай лучше, чем компьютер.

В более раннем исследовании была отмечена следующая закономерность в распознавании смысла лая в той или иной ситуации: люди могли с высокой точностью определить, в каком бытовом контексте издается лай в ситуациях "незнакомец",«борьба» и «одиночество» (в процентном соотношении это составило 45-50% успеха). А вот в ситуациях «игра», «прогулка» и «мячик» распознавание людьми «смыслового контекста» лая было менее эффективно. Лай «понимался» лишь в 30% случаев. Что удивительно, автоматический анализ показал схожее распределение!

Возможно, причина подобной закономерности объясняется тем, что в «напряженных» ситуациях лай собак различается особенно сильно. В то же время при виде незнакомца, в борьбе или оставшись в одиночестве разные собаки подают голос одинаково, что облегчает незнакомому с ними и их лаем человеку распознать ситуацию. Все вместе это означает, что лай разных собак в той или иной ситуации имеет определенные сходные, но различаемые и человеком, и машиной особенности. То есть неодинаковые по накалу и окраске эмоциональные состояния собак заставляли их подавать голос по-разному в разных ситуациях.

Эксперимент 2: узнавание лая отдельных собак
Если первый эксперимент сводился к получению ответа на вопрос: «В какой ситуации находится лающая собака?», то во втором программа должна была в известных ситуациях распознать собак по их лаю (типа «а кто это сейчас играет в мячик: Бобик или Пушок?»). Программа, анализировавшая индивидуальные частотно-временные характеристики собачьего гавканья, оказалась способна различать лай отдельных собак с эффективностью 52%. Особенно хорошо алгоритм распознавал собак по их лаю в ситуациях "прогулка", «одиночество», «мячик» и «игра». Это было особенно удивительно, потому что до их пор не было данных, что именно каждый отдельный «гав» (а не промежутки между ними, подвизгивания, девиации громкости)содержит «индивидуальную» информацию. К слову, существование индивидуально-опознавательных сигналов(звуковых визитных карточек отдельной особи) известно у ряда птиц и млекопитающих, в частности китов и дельфинов. В ситуациях «незнакомец» и «борьба» программа гораздо хуже распознавала лай отдельных собак, в то время как в задаче определения ситуации, в которой звучит лай, программа более успешно определяла его именно в этих двух, вышеприведенных,ситуациях. Это дает возможность предполагать, что в ситуациях «незнакомец» и «борьба» лай «разъяренных» собак теряет явные индивидуальные различия. Интересно, что людям задача узнавания собак по лаю показалась очень трудной.

Сравнение действий человека и компьютерного алгоритма могло быть полезно и познавательно, но, к сожалению, его нельзя назвать точным, потому что программа классифицировала каждый отдельный «такт», в то время как люди анализировали полную запись лая. В предыдущем исследовании было установлено, что люди, оценивая эмоциональное состояние собаки, принимали во внимание интервалы между издаваемыми ею отдельными «гавами». Лай с короткими интервалами расценивался как «агрессивный», а с длинными считался «отчаянным», "осторожным" или «счастливым». Причем по лаю люди лучше всего узнавали ситуации «одиночество» и «игра». Причина этого может крыться в том, что человек ориентировался ещё и на интервалы между «гавами», а у компьютера при анализе и классификации не было возможности использовать эту особенность собачьего лая. Зато компьютер намного лучше смог распознать индивидуальные особенности лая собак. Следовательно, они, эти особенности, существуют, но люди почти всегда не в состоянии расслышать и понять их.

Выводы

В перспективе использование автоматических классификаторов на основе «обучающихся» алгоритмов открывает новые возможности для понимания коммуникации животных. Важно подчеркнуть, что метод, используемый в данном исследовании, является полностью автоматическим (кроме сегментации «тактов» - отдельных «гавов» - лая). То есть компьютер анализирует только поступающую в его железное нутро информацию. Результаты можно считать многообещающими, и данную методику вполне возможно рассматривать как новый инструмент для этологических исследований. Что же касается автоматического и универсального «переводчика с собачьего», то создать его в принципе реально. Но это - дело отдаленного будущего.

Администратор: