
Компания NCC Group, специализирующаяся на вопросах кибербезопасности, представила свою разработку — метод воссоздания человеческого голоса на основе искусственного интеллекта, который функционирует в режиме реального времени. Отмечается, что созданная система построена на общедоступных программных решениях и не требует для работы специализированного оборудования.
После недолгого обучения система для создания голосовых дипфейков активируется одним нажатием кнопки через веб-интерфейс, что позволяет потенциальным злоумышленникам легко выдать себя за другого человека. Качество исходного аудиосигнала может быть невысоким, однако голос на выходе все равно звучит убедительно, а задержка оказывается незначительной. Это означает, что технологию можно применять даже с микрофонами, встроенными в смартфоны и ноутбуки.
Ключевым преимуществом новой разработки является ее способность работать без задержек. Существующие ранее технологии подделки голоса могли лишь создавать аудиофайлы с заранее записанными фразами, что позволяло легко разоблачить обман при отклонении разговора от сценария. Инженеры NCC Group успешно протестировали свою систему на клиентах, получив их согласие, и никто из участников эксперимента не смог распознать подделку.
В то же время создание видеодипфейков в реальном времени остается сложной задачей. Крупные социальные сети, включая TikTok, YouTube и Instagram (принадлежит Meta, признана в РФ экстремистской и запрещена), столкнулись с волной видеоподделок. Однако их слабой стороной остается недостаточная синхронизация изображения и звука: мимика говорящего не всегда соответствует интонациям, что выдает фальшивку.
На фоне появления новых решений эксперты в области кибербезопасности призывают к совершенствованию средств защиты. По их мнению, методы аутентификации личности больше не должны полностью полагаться на голосовые и видеозвонки, поскольку такие технологии ставят под сомнение их надежность.