Статья опубликована в рамках: Научного журнала «Студенческий» № 5(301)
Рубрика журнала: Юриспруденция
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4
ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В РАССЛЕДОВАНИЯХ ПРЕСТУПЛЕНИЙ ДЛЯ ИДЕНТИФИКАЦИИ ПОДОЗРЕВАЕМЫХ ПО ГОЛОСУ
PROSPECTS OF USING ARTIFICIAL INTELLIGENCE IN CRIME INVESTIGATIONS TO IDENTIFY SUSPECTS BY VOICE
Yulia Frolova
master's student, Department of Criminal Law and Procedure, Donetsk State University,
Russia, Donetsk
Gennady Han
scientific supervisor, Candidate of Law Sciences, Donetsk State University,
Russia, Donetsk
АННОТАЦИЯ
В статье рассмотрен перспективы использования искусственного интеллекта в расследованиях преступлений для идентификации подозреваемых по голосу, предложены направления совершенствования законодательства Российской Федерации в сфере персональных данных с учетом необходимости охраны общественной безопасности.
ABSTRACT
The article examines the prospects of using artificial intelligence in crime investigations to identify suspects by voice, and suggests ways to improve the legislation of the Russian Federation in the field of personal data, taking into account the need to protect public safety.
Ключевые слова: криминалистическая идентификация, методы идентификации, идентификация по голосу, искусственный интеллект.
Keywords: forensic identification, identification methods, voice identification, artificial intelligence.
Актуальность. Исследовательский процесс, осуществляемый в рамках криминалистической идентификации, не является произвольным. Он основывается на специализированных методиках, которые формируют практические процедуры установления значимых для уголовного дела фактов. Такие методики используются в экспертных исследованиях, а также в следственных действиях и оперативно-разыскных мероприятиях [6, с. 197].
Цель статьи – рассмотреть перспективы использования искусственного интеллекта в расследованиях преступлений для идентификации подозреваемых по голосу.
История криминалистической идентификации голоса восходит к семнадцатому веку при дворе Карла I Английского. Первое научное исследование было проведено в 1937 году по делу Линдберга, где голос обвиняемого, Бруно Р. Гауптмана, был положительно идентифицирован врачом Джоном Ф. Кондоном, в конечном итоге посредником в переговорах о выкупе.
Идентификация говорящих началась с использования методов распознавания по слуху с использованием распознавания голосов людьми. Идентификация говорящих начинает систематически практиковаться судебными экспертами в конце 40-х годов в Союзе Советских Социалистических Республик и в 50-х годах в Соединенных Штатах Северной Америки.
В 60-х годах и в свете надежности систем распознавания отпечатков пальцев, разработанных в конце XIX века, была предложена аналогичная система, получившая название «голосовой отпечаток», основанная на визуальном анализе спектрограмм, который не дал ожидаемых результатов, учитывая изменчивость изображения внутренней части речи. Споры по поводу целесообразности его использования длились более 10 лет и завершились докладом Стивенса и др. с 1968 года, который определил, что слуховой метод был более точным, чем визуальный осмотр.
Начиная с 70-х годов ХХ века, методы, основанные на людях, опирались на автоматизированные системы распознавания говорящих, разработанные для биометрических приложений. Несмотря на то, что такие системы превратились в коммерческие приложения, надежные системы для использования в криминалистической идентификации создать не удалось, поскольку их использование судебными экспертами и специалистами по распознаванию говорящих остается предметом постоянных споров.
В 2003 году Бонастре и др. они представили отчет, предупреждающий о невозможности однозначной идентификации человека по его голосу с учетом научных достижений, достигнутых к настоящему времени, особенно в области судебной медицины, где окружающая среда и факторы, влияющие на производительность, могут сильно отличаться от коммерческой сферы.
В 2005 году Сакс и Келер предложили смену парадигмы в науке об идентификации применительно к различимости и уникальности образцов на основе доказательств ошибок в проведенных тестах и реальных случаях. Этот постулат завершается необходимостью достижения уровней надежности, аналогичных тем, которые достигаются при идентификации по ДНК с помощью стандартизированных эмпирических и вероятностных анализов. Примерно в то же время в судебной медицине начала применяться новая методология оценки автоматических систем распознавания говорящих, называемая логарифмической функцией затрат (Cllr), которая вводит показатели достоверности и надежности.
В контексте идентификации говорящих в судебно-медицинской экспертизе следователь должен быть в состоянии оценить вероятность того, что речь преступника соответствует речи сопоставляемого (сходство), в сравнении с вероятностью того, что речь преступника соответствует речи другого лица из соответствующей группы населения (типичность). Европейская сеть институтов судебной экспертизы (ENFSI) опубликовала в 2015 году руководящие принципы стандартизации и совершенствования экспертных заключений (оценочного типа) по всем дисциплинам судебной экспертизы [1]. Пункт 2.4 руководящих принципов ENFSI гласит, что судебно-медицинская экспертиза, в зависимости от конкретной дисциплины, о которой идет речь, должна основываться на присвоении коэффициента или отношения правдоподобия (LR коэффициента правдоподобия). Это соотношение измеряет поддерживающую силу, которую результаты обеспечивают для различения интересующих предложений. Обычно эти предложения представляют собой гипотезу о том, что речевые фразы исходят от одного и того же говорящего (гипотеза обвинения), и гипотезу о том, что они исходят от разных говорящих (гипотеза защиты). С другой стороны, LR являются общепринятыми с научной точки зрения и обеспечивают логический способ работы с логическими выводами.
В 2011 году Дехак и соавторы предложили новую систему отсчета для автоматических систем распознавания говорящих, основанную на фактическом анализе в качестве экстрактора параметров. Факторный анализ используется для определения нового пространства малой размерности, называемого пространством полной изменчивости. В этом новом пространстве речевое излучение представлено новым вектором, называемым полным множителем или i-вектором. Компенсация между сеансами выполняется в этом новом пространстве с уменьшенными размерами, для чего были предложены различные методы нормализации i-векторов, при этом пробабилистический линейный дискриминативный анализ (PLDA) показал наилучшие результаты. Автоматические системы на основе i-векторов/PLDA в настоящее время считаются современными.
Комбинированные методы, включающие основные методологии, лежащие в основе судебной идентификации речи (спектрографически-слуховая, слухово-перцептивная, оптико - акустическая, полуавтоматическая и автоматическая), рассматриваются передовым судебно-медицинским сообществом как методологическая альтернатива с наибольшей надежностью. Когда какая-либо научная процедура рассматривает объект исследования с переменным характером, она обычно использует как можно больше точек зрения на исследование, чтобы полученные выводы обладали высокой степенью объективности. По этой причине в качестве наилучшего подхода к решению проблемы предлагается использование комбинированных методов, которые позволяют использовать группу дополнительных процедур, но различного или сходного характера [2].
Ст. 193 Уголовно-процессуального кодекса Российской Федерации (УПК РФ) [5] подробно не регламентирует тактику опознания по голосу, в отличие от предъявления для опознания лица или фотографий. Наличие большого количества признаков голоса предоставляет возможность использования их для опознания личности. Однако следователь не всегда может определить эти признаки, а потенциальный опознающий не всегда может их назвать.
В таком случае подготовка к допросу потенциально опознающего лица по голосу должна включать в себя выяснение следователем особенностей звучания голоса человека. Следователь может ознакомиться с этими признаками, проконсультировавшись со специалистом-фоноскопистом или другим лицом, разбирающимся в этом вопросе.
В отличие от опознания по речи человека, при опознании по голосу следователю необходимо выяснить факторы пространства, в котором потенциальный опознаваемый слышал голос. Акустические возможности пространства могут быть различными, и восприятие голоса в закрытых или открытых пространствах отличается.
Акустика помещений зависит от ряда факторов, таких как конструкция помещения, окна, потолки, полы, стены и мебель. Эти факторы влияют на качество звука и создают определённые звуковые эффекты, такие как реверберация, флаттер, ранние отражения, комнатные резонансы и стоячие волны.
На открытой местности звук также может претерпевать изменения, отличающие его от первоначального источника. Например, восприятие звука улучшается в безветренную погоду, в тумане, при высокой влажности воздуха, после дождя и зимой. Имеет значение сила и направление ветра. Ветер, идущий от источника, даёт возможность слышать звуки на более удалённом расстоянии. Ветер, дующий сбоку от источника звука, создаёт помехи для распространения звуковой волны. Препятствия на местности, такие как строения, горы и деревья, также влияют на звук, отражая его или меняя направление. На открытой местности часто возникает звуковой эффект в виде эха, особенно в оврагах, ущельях и глубоких лощинах. На водоёмах звук распространяется на большие расстояния [3]. Криминалистическое распознавание в досудебном уголовном производстве представляет собой сложный и многогранный процесс, который имеет ряд специфических особенностей. Прежде всего, это связано с тем, что данная форма познавательной деятельности направлена на изучение признаков, которые не могут быть восприняты органами чувств. Кроме того, результатом этой деятельности является так называемое опосредованное знание, которое может быть получено только с помощью мыслительной деятельности. Данное знание может быть получено только при условии тесного взаимодействия чувственного и рационального уровней познания [4, с. 160]. Полагаем, что не только человек может быть опознающим, но и искусственный интеллект (ИИ), например, если момент преступления зафиксирован на аудио- или видеозаписи, где четко различимы особенности голоса преступника, при этом проводить идентификацию он может не только путем сличения тех голосов, которые ему предоставят для сравнения, а используя большие массивы данных. Обработка больших объемов данных: Искусственный интеллект способен анализировать огромные массивы голосовых данных, что повышает точность идентификации. При этом ИИ минимизирует ошибки, связанные с субъективной оценкой, обеспечивая более объективные результаты.
Каждый человек имеет уникальный голос, который зависит от анатомии голосового аппарата, привычек речи и окружения. ИИ может учитывать эти нюансы для более точной идентификации, в отличие от обычного человека, который не является фониатром или фоноскопистом. Голосовые характеристики остаются относительно стабильными на протяжении жизни, что делает метод надежным для длительного использования.
Технология позволяет проводить идентификацию на расстоянии, без необходимости физического контакта, что следует учитывать при работе с опасными преступниками. Для анализа достаточно записи голоса, что упрощает процесс сбора улик и доказательств. При этом ИИ постоянно обучается и совершенствуется на новых данных, что позволяет улучшать точность и скорость обработки голосовых сигналов. Голосовая идентификация может быть интегрирована с другими биометрическими методами (например, с распознаванием лиц или отпечатков пальцев), что повышает надежность системы. Итак, опознание по голосу с использованием ИИ представляет собой перспективное и многообещающее направление, которое сочетает в себе высокую точность, удобство и широкие возможности применения в криминалистической идентификации.
Полагаем возможным использование искусственного интеллекта в расследованиях преступлений для идентификации подозреваемых по голосу по записям телефонных разговоров или видеозаписям, что позволит использовать сложные алгоритмы для анализа и распознавания голосовых паттернов.
Однако требуют правового урегулирования вопросы защиты данных и анонимности при сборе и обработке голосовых записей искусственным интеллектом в Конституции РФ и Федеральном законе «О персональных данных», конфиденциальность не может быть превыше общественной безопасности, в особенности в условиях повышенной террористической угрозы, связанной с деятельностью украинских спецслужб.
Список литературы:
- ENFSI guideline for evaluative reporting in forensic science [Электронный ресурс]. – Режим доступа: https://www.unil.ch/esc/files/live/sites/esc/files/Fichiers%202015/ENFSI%20Guideline%20Evaluative%20Reporting (дата обращения: 11.01.2025).
- Univaso, Pedro & Gurlekian, Jorge & Soler, Miguel & Stalker, Germán. FORENSIA: un sistema de identificación forense por voz. – 2020 [Электронный ресурс]. – Режим доступа: https://www.researchgate.net/publication/344929766_FORENSIA_un_sistema_de_identificacion_forense_por_voz (дата обращения: 11.01.2025).
- Гусев А.В., Бутяева Н.А. Проблемы тактики опознания по голосу // Вестник КРУ МВД России. – 2022. – №3 (57). [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/problemy-taktiki-opoznaniya-po-golosu (дата обращения: 11.01.2025).
- Корма В.Д., Образцов В.А. Проблемы и пути совершенствования парадигмы криминалистического распознавания // Актуальные проблемы российского права. – 2015. – № 7 (56). – С. 158-168.
- Уголовно-процессуальный кодекс Российской Федерации от 18 декабря 2001 г. № 174-ФЗ (с изм. и доп.) // Собрание законодательства Российской Федерации. – 2001. – № 52 (часть I). – Ст. 4921.
- Фомичев А.А. О некоторых аспектах криминалистической идентификации // Уголовно-процессуальные и криминалистические проблемы борьбы с преступностью. Сборник научных статей. – Орёл, 2023. – С. 194-198.
Оставить комментарий