Сборник ответов на ваши вопросы

ГлавнаяКатегорияТехника и технологии → Нейросеть научили искать китов по одной песне

Как нейросеть находит редких китов в океане по одной аудиозаписи

 

Нейросеть смогла обнаружить песни синих китов в массивах аудиоданных за целые десятилетия, имея в распоряжении всего один пример записи. Исследователи из Университета Нового Южного Уэльса в Сиднее совершили прорыв, который позволяет находить редких морских гигантов в океане информации с точностью до 99,4%. Обычно для обучения подобных алгоритмов требуются тысячи аннотированных образцов, но новая методика обходит это ограничение, превращая единственный звуковой фрагмент в масштабную обучающую выборку.

 

Искусственный интеллект на грани акустического воображения

Традиционный подход к анализу записей пассивного акустического мониторинга изнурителен. Ученые годами вручную прослушивают или просматривают спектрограммы, чтобы отметить каждый крик кита. Это тупиковый путь для экологии, когда речь идет об архивах, охватывающих 25 лет непрерывной записи в масштабах целого океанского бассейна. Бен Янкович, аспирант UNSW и ведущий автор проекта, предложил систему, в основе которой лежит глубокое обучение и метод дополнения данных.

Синий кит в океане с наложением цифровых волн

Вместо того чтобы искать новые записи, ученые взяли один качественный сигнал и начали над ним экспериментировать: менять тональность, растягивать во времени и накладывать различные типы океанического шума. Такие модификации имитируют реальные условия, когда звук искажается, проходя через толщу воды на огромные расстояния. В итоге из одной песни получились тысячи полусинтетических образцов, на которых нейросеть «набила руку» перед выходом в реальное поле.

 

Почему предсказуемость стала спасением для науки

Метод работает не со всеми животными. Его успех обусловлен биологической особенностью синих китов — их песни крайне стереотипны. В пределах одной популяции особи издают практически идентичные звуки. Например, все киты вокруг Мадагаскара исполняют одну и ту же партию, а антарктическая популяция — совершенно иную. Эта стабильность позволила модели не отвлекаться на индивидуальные различия, которые у других видов превратили бы данные в хаос.

  • Синие киты — крупнейшие животные на планете, ведущие скрытный образ жизни;
  • Их вокализация предсказуема и поддается математическому моделированию;
  • Метод неприменим к дельфинам, так как у каждой особи есть уникальный свист-автограф;
  • Алгоритм одинаково эффективен как для редких, так и для массовых видов со стабильным репертуаром.

 

Энергоэффективные вычисления против суперкомпьютеров

Одной из скрытых проблем современных нейросетей является их чудовищное энергопотребление. Обучение крупных моделей требует недель работы мощных серверов. Янкович и его команда пошли другим путем: они адаптировали систему, изначально созданную для распознавания человеческой речи. Такой перенос обучения (transfer learning) позволил создать легкий инструмент, который можно запустить на обычном ноутбуке. Обучение занимает всего несколько часов, что делает технологию доступной для экологов с ограниченным бюджетом.

Согласно исследованию, опубликованному в журнале Scientific Reports, новая модель показывает результаты, сопоставимые с детекторами, обученными на колоссальных массивах данных. Это открывает дорогу к изучению «культурных слоев» океана: ученые теперь могут проследить, как менялась песенная традиция китов на протяжении четверти века. Животные, как и люди, модифицируют свои мелодии из поколения в поколение, и теперь этот процесс можно увидеть в цифрах.

 

Глобальная сеть подслушивания за природой

Микрофоны сегодня спрятаны везде: в лесах, на болотах и на дне океанов. Но большая часть этих данных — мертвый груз. Исследователи планируют применить свою разработку к архиву записей из центральной части Индийского океана, накопленному за 25 лет. Это позволит понять не только численность популяций, но и пути их миграции, на которые влияет глобальное потепление и шум от судоходства.

Если мы можем обучить точный детектор на одной хорошей записи, это дает шанс услышать скрытых и редчайших существ, которых человек почти никогда не встречал вживую.

Технология потенциально масштабируема на птиц и даже насекомых, чьи сигналы так же повторяемы. Это превращает любой смартфон в руках полевого биолога в мощный инструмент мониторинга фауны. Готовы ли мы к тому, что через несколько лет ИИ сможет буквально перевести все звуки дикой природы в структурированные графики изменений климата и биологического разнообразия?

Автор: Олег Кербиков
Это интересно:
Ваш комментарий (без регистрации):


Полужирный Наклонный текст Подчёркнутый текст Зачёркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Вставка ссылкиВставка защищённой ссылки Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера