Статья опубликована в рамках: Научного журнала «Студенческий» № 17(355)
Рубрика журнала: Юриспруденция
КРИМИНАЛИСТИЧЕСКИЕ И ПРОЦЕССУАЛЬНЫЕ АСПЕКТЫ РАЗОБЛАЧЕНИЯ АУДИОДИПФЕЙКОВ ПРИ РАССЛЕДОВАНИИ ТЕЛЕФОННОГО МОШЕННИЧЕСТВА
АННОТАЦИЯ
В статье рассматриваются актуальные проблемы выявления и расследования телефонного мошенничества, совершенного с использованием аудиодипфейков (синтезированной речи). Проанализирован механизм дипфейк-атак, включающий сбор биометрических данных и использование методов социальной инженерии. Особое внимание уделено криминалистическим методикам обнаружения подделок: фоноскопической экспертизе, анализу акустических и лингвистических признаков, а также активным методам верификации на основе криптографических стандартов. Освещены процессуальные аспекты квалификации деяний по ст. 159 УК РФ и определения статуса цифровых доказательств. Выявлены ключевые пробелы в нормативно-правовом регулировании, недостаточная надежность экспертных методик при исследовании коротких аудиосообщений, а также дефицит IT-компетенций у сотрудников правоохранительных органов. Обосновывается необходимость комплексного междисциплинарного подхода, включающего разработку новых стандартов судебной экспертизы, совершенствование уголовного законодательства и внедрение программ повышения квалификации.
Ключевые слова: аудиодипфейк, синтез речи, телефонное мошенничество, цифровые доказательства, фоноскопическая экспертиза, социальная инженерия, спуфинг, верификация контента, криминалистическая методика, искусственный интеллект.
Стремительное развитие технологий искусственного интеллекта породило принципиально новый инструмент обмана — аудиодипфейки (войсфейки). Под ними понимают синтетические аудиозаписи, созданные с помощью генеративно-состязательных сетей, диффузионных моделей и систем синтеза речи, которые практически неотличимы от голоса реального человека. В криминалистический обиход уже прочно вошли термины «клонирование голоса» (синтез на основе образцов речи) и «спуфинг» — имитация голоса с целью выдать себя за другого [1; 2]. Телефонные мошенники активно применяют эти технологии, в частности по схеме «fakeboss», когда с помощью синтеза речи подделывается голос руководителя, отдающего распоряжения о переводе денег. Рост реалистичности дипфейков ставит под угрозу надёжность цифровых доказательств и требует от правоохранителей пересмотра привычных подходов.
Современную дипфейк-атаку можно представить, как трёхэтапный процесс. На первом этапе злоумышленники собирают цифровое досье: добывают образцы голоса через открытые записи в интернете, утечки биометрических данных, фишинг или прямой обзвон с записью разговора. По данным Я.А. Климовой, сегодня широко используется такой приём, как «случайный звонок» в мессенджер с просьбой включить демонстрацию экрана — этого достаточно для захвата биометрической информации [3].
Второй этап — формирование психологической анкеты жертвы. С помощью серии предварительных, часто спам-звонков преступники выясняют личные данные, финансовое положение и индивидуальные особенности, на которые будет опираться последующая социальная инженерия.
Наконец, на третьем этапе на основе собранного материала генерируется адресный аудиодипфейк и совершается целевой звонок или отправляется голосовое сообщение. По прогнозам Климовой, уже к концу 2026 года злоумышленники получат возможность в реальном времени имитировать разговор от лица родственников или знакомых жертвы, что ещё сильнее усложнит разоблачение.
Ключевые проблемы, которые выделяют исследователи, — это высокая убедительность синтезированной речи, анонимность мессенджеров (шифрование, возможность удаления сообщений, отсутствие идентифицирующих данных) и лёгкость получения исходных образцов голоса [1; 2].
В ответ на вызовы формируются две группы методик — методики расследования и методики судебно-экспертного исследования.
Я.А. Климова предлагает частную криминалистическую методику расследования преступлений, связанных с дипфейками [3]. Её ядро — детальный осмотр цифровых устройств подозреваемого с анализом истории браузера, учётных записей в соцсетях, поисковых запросов, касающихся технологий синтеза речи и дипфейков. Автор отдельно подчёркивает, что острейшей проблемой остаётся нехватка IT-компетенций у следователей, без которых полноценное исследование подобных следов невозможно.
И.М. Куприянова детально разбирает пассивные и активные методы выявления аудиоподделок [1]. К пассивным она относит анализ уникальных акустических характеристик голоса (частота, интонация, тембр) и проверку цифровых шумовых шаблонов, например, метод PRNU, позволяющий создать для аудиофайла уникальный идентификатор. К активным методам относится, прежде всего, стандарт C2PA (Coalition for Content Provenance and Authenticity), основанный на криптографической подписи метаданных и позволяющий подтвердить подлинность контента и проследить цепочку его изменений.
Е.И. Галяшина, опираясь на разработанную ею методологию речеведческого исследования, предлагает использовать комплекс просодико-лингвистических признаков, чтобы отличить спонтанную речь человека от искусственной. По её мнению, именно в особенностях речемыслительной деятельности — паузах хезитации, самокоррекциях, «мусорных» словах — скрывается ключ к разоблачению синтезированной речи [4].
Цельным примером практического применения этих идей служит кейс, описанный Судебно-экспертным агентством в 2026 году [5]. Эксперты исследовали короткую восьмисекундную запись и образцы голоса, применив трёхэтапную методику. На этапе аудитивного сравнения сразу бросилась в глаза чрезмерная «гладкость» спорной записи — отсутствие живых оговорок, запинок, эмоциональных перепадов. Лингвистический анализ показал: лексика разговорная, но речь поразительно правильная, нормированная, без обычных для устной речи перестроений фраз; одновременно наблюдалось явное подражание отдельным фонетическим привычкам диктора. Инструментальные методы (программы SIS II и «Янтарь») выявили подозрительно гладкий график основного тона и «стерильную» спектрограмму без естественных шумов дыхания и мелких гармоник. Именно совокупность этих признаков позволила экспертам сделать вывод о синтезированной природе записи.
В специальной литературе обобщены следующие типичные маркеры аудиодипфейка: неестественная правильность и монотонность речи, отсутствие пауз хезитации и слов-паразитов, нехарактерный для диктора темп речи, несовпадение лексических конструкций с его привычным словарём, а также «цифровые следы» — идеально ровный тон и отсутствие хаотичности на спектрограммах [1; 2].
Однако существует и серьёзное ограничение: Галяшина прямо указывает, что надёжность существующих экспертных методик пока недостаточна, особенно когда исследуются короткие монологические сообщения из мессенджеров, где нет возможности сравнить спонтанный поток речи [2].
С точки зрения уголовного закона, использование аудиодипфейка для обмана полностью охватывается общим составом мошенничества (ст. 159 УК РФ) [8]. Как разъяснил Пленум Верховного Суда РФ в постановлении от 30.11.2017 № 48, обман может заключаться в сознательном сообщении заведомо ложных сведений, в том числе о личности говорящего, а злоупотребление доверием — в использовании доверительных отношений с корыстной целью [6]. Воздействие в таких преступлениях направлено на сознание человека, а не на компьютерную систему, поэтому квалификация по ст. 159.6 УК РФ (мошенничество в сфере компьютерной информации) здесь неприменима [8]. Отсутствие в Уголовном кодексе специальной нормы, упоминающей дипфейки, создаёт некоторую правовую неопределённость, но не меняет базовой квалификации. При этом сам по себе факт использования искусственного интеллекта не рассматривается как отягчающее обстоятельство — технология лишь модернизирует способ обмана, не увеличивая характер и степень общественной опасности деяния [7].
Процессуальная природа аудиодипфейка зависит от обстоятельств получения. Запись может быть признана иным документом (ст. 84 УПК РФ), если, например, она была добровольно предоставлена потерпевшим, свидетелем или истребована у оператора связи [9]. Если же аудиофайл изъят в ходе следственного действия (обыска, выемки) на материальном носителе (телефоне, компьютере), он, как правило, признаётся вещественным доказательством (ст. 81 УПК РФ), что предполагает более строгую процедуру фиксации, хранения и исследования [9]. В любом случае достоверность такого доказательства проверяется путём сопоставления с другими материалами дела, установления источника происхождения, а при малейших сомнениях — назначением судебной экспертизы.
Правовая основа для производства экспертиз — Федеральный закон № 73-ФЗ «О государственной судебно-экспертной деятельности в РФ» [10]. Заключение эксперта должно содержать описание применённых методов и обоснованные ответы на поставленные вопросы. В уже упомянутом кейсе Агентства экспертам был задан прямой вопрос: «Являются ли голос и речь… синтезированными с использованием нейросетевых алгоритмов на основании голоса и речи лица, образцы которого представлены?» [5]. Именно такая конкретная формулировка позволяет получить результат, пригодный для доказывания.
При этом, как замечает Климова, на практике у следователей возникают не имеющие пока однозначного решения вопросы: что считать местом происшествия в цифровом пространстве, какие именно цифровые объекты подлежат изъятию, как обеспечить их сохранность и какие экспертизы следует назначать в первую очередь [3]. Эти неопределённости серьёзно тормозят расследование.
Проведённый анализ позволяет говорить о трёх взаимосвязанных проблемах и одновременно о направлениях дальнейшей работы.
Технологическое развитие генеративных моделей существенно опережает методическое оснащение экспертов. Даже комплексные методики, как показывает практика, не всегда дают надёжный результат при исследовании коротких аудиосообщений, поэтому существующая достоверность выводов экспертизы уже сейчас ставится под сомнение и будет лишь снижаться без введения новых стандартов.
В нормативной сфере сохраняются ощутимые пробелы. С одной стороны, отсутствует специальный состав или хотя бы квалифицирующий признак, учитывающий применение дипфейков, что вынуждает квалифицировать деяния по общим нормам и не вполне отражает их специфику. С другой — нечёткость процессуального положения цифровых аудиозаписей и отсутствие утверждённых регламентов их изъятия, хранения и исследования создают риски признания таких доказательств недопустимыми.
Организационно-кадровый блок проблем включает анонимность мессенджеров как препятствие для идентификации отправителей, острую нехватку IT-компетенций у следователей и экспертов, а также отсутствие унифицированных ведомственных методик расследования и экспертного исследования дипфейков.
Вместе с тем первоочередные шаги достаточно ясны. В научно-методической плоскости необходима интеграция передовых алгоритмов детекции синтезированного контента (в том числе на базе самого ИИ) в практику фоноскопической экспертизы и разработка закреплённых стандартов. В правовой сфере целесообразны разъяснения Пленума Верховного Суда, конкретизирующие особенности квалификации и доказывания по делам с дипфейк-технологиями, и обсуждение специальной нормы. Наконец, организационный ответ — это внедрение программ повышения квалификации для сотрудников правоохранительных органов и экспертов, формирующих устойчивые навыки работы с цифровыми следами.
Только комплексный междисциплинарный подход, объединяющий юристов, криминалистов и IT-специалистов, способен обеспечить эффективное противодействие телефонному мошенничеству с использованием аудиодипфейков.
Список литературы:
- Куприянова И.М. Цифровая криминалистика в эпоху дипфейков: вызовы и методики выявления ИИ-генерированных аудио- и видеозаписей // Multidisciplinary Journal of Science and Technology (MJST). — 2026. — Vol. 6, No. 1. — Article 6661. — URL: http://www.mjstjournal.com/index.php/mjst/article/view/6661 (дата обращения: 01.05.2026).
- Галяшина Е.И. Подделка голосовых сообщений в мессенджерах с помощью информационно-коммуникационных технологий: проблемы выявления и противодействия // КиберЛенинка. — 2023. — URL: https://cyberleninka.ru/article/n/poddelka-golosovyh-soobscheniy-v-messendzherah-s-pomoschyu-informatsionno-kommunikatsionnyh-tehnologiy-problemy-vyyavleniya-i (дата обращения: 01.05.2026).
- Климова Я.А. Основные положения частной криминалистической методики расследования преступлений, совершенных с использованием технологии дипфейк // КиберЛенинка. — 2024. — URL: https://cyberleninka.ru/article/n/osnovnye-polozheniya-chastnoy-kriminalisticheskoy-metodiki-rassledovaniya-prestupleniy-sovershennyh-s-ispolzovaniem-tehnologii (дата обращения: 01.05.2026).
- Галяшина Е.И. Речеведческое исследование в криминалистике : монография. — М. : РГБ, 2005. — URL: https://search.rsl.ru/ru/record/01002706916 (дата обращения: 01.05.2026).
- Судебно-экспертное агентство. Корпоративные скандалы, созданные ИИ: экспертиза синтезированной речи (кейс 2026 г.). — URL: https://sudagent.ru/practice/korporativnye-skandaly-sozdannye-ii-ekspertiza-sintezirovannoy-rechi/ (дата обращения: 01.05.2026).
- О судебной практике по делам о мошенничестве, присвоении и растрате : постановление Пленума Верховного Суда РФ от 30.11.2017 № 48 (ред. От 15.12.2022) // СПС КонсультантПлюс. — URL: https://www.consultant.ru/document/Cons_doc_LAW_283918/ (дата обращения: 01.05.2026).
- Квалификация дипфейк-мошенничества и киберпохищения человека // КиберЛенинка. — 2023. — URL: https://cyberleninka.ru/article/n/kvalifikatsiya-dipfeyk-moshennichestva-i-kiberpohischeniya-cheloveka (дата обращения: 01.05.2026).
- Уголовный кодекс Российской Федерации от 13.06.1996 № 63-ФЗ (ред. От 09.04.2026) // СПС КонсультантПлюс. — URL: https://www.consultant.ru/document/cons_doc_LAW_10699/ (дата обращения: 01.05.2026).
- Уголовно-процессуальный кодекс Российской Федерации от 18.12.2001 № 174-ФЗ (ред. От 08.03.2026) (с изм. И доп., вступ. В силу с 26.04.2026) // СПС КонсультантПлюс. — URL: https://www.consultant.ru/document/cons_doc_LAW_34481/ (дата обращения: 01.05.2026).
- О государственной судебно-экспертной деятельности в Российской Федерации : Федеральный закон от 31.05.2001 № 73-ФЗ (ред. От 22.07.2024) // СПС КонсультантПлюс. — URL: https://www.consultant.ru/document/cons_doc_LAW_31801/ (дата обращения: 01.05.2026).

