Так работает распознавание лиц. Коллаж: Наша Ніва

Так работает распознавание лиц. Коллаж: Наша Ніва

Распознавание лиц — это настоящая наука

Раньше распознаванием лиц занимались криминалисты, которые имели собственные методики, и делалось это вручную, занимая много времени. На самых ранних этапах развития компьютеры не могли распознавать лица, так как им не хватало мощности.

Первые эксперименты по распознаванию лиц с помощью компьютеров в 1960-е проводила группа исследователей из США по заказу спецслужб. Цель была в том, чтобы проверить, может ли быть вообще возможным компьютерное распознавание лиц, которое на тот момент никогда не реализовывалось. Методика была в том, что исследователи обозначали руками «опорные пункты», как нос или скулы, впоследствии программа поворачивала снимки и высчитывала расстояния между опорными пунктами. Результат был положительный.

Вудро Уильсон Бледса и Хелен Чан Вульф — часть первой команды по работе над компьютерным распознаванием лиц. С ними был еще Чарльз Биссон, но его фото не сохранилось. Фото: chessprogramming.wikispaces.com, Dougfairbairn (wikimedia.org)

Вудро Уильсон Бледса и Хелен Чан Вульф — часть первой команды по работе над компьютерным распознаванием лиц. С ними был еще Чарльз Биссон, но его фото не сохранилось. Фото: chessprogramming.wikispaces.com, Dougfairbairn (wikimedia.org)

Таким образом исследователи доказали, что компьютер вообще способен к распознаванию лиц (и делает это быстрее людей) и дали толчок этому направлению, прежде всего для криминалистики. Но делалось это все еще медленно (обрабатывалось до 40 фото в час) и требовало много ручной работы.

Только в самом начале 90-х исследователи разработали систему, которая позволяла распознавать лица полностью автоматически, но точность была далекой от идеала, да и лицо должно было быть сфотографировано в анфас и полностью неподвижно. Системы распознавания лиц вошли в широкий обиход только в середине 2000-х и при этом сильно продвинулись. Face Recognition Challenge, проведенный в 2006-м, показал, что алгоритмы стали в 100 раз более точными с 1995 года — то есть всего за десять лет.

Нейросеть может распознавать много лиц одновременно — так это будет выглядеть. Фото: Southbank Centre / flickr. com

Нейросеть может распознавать много лиц одновременно — так это будет выглядеть. Фото: Southbank Centre / flickr. com

В 2010-м Facebook представил собственную технологию распознавания лиц, которая автоматически помечала людей на фото. А в 2017-м вышел первый в мире смартфон, который можно было разблокировать с помощью лица — Apple X с функцией Face ID. Китай еще в 2006-м начал программу по развитию технологий распознавания лиц и соорудил самую продвинутую систему слежения за своими гражданами в мире, которая до сих пор совершенствуется.

Как это работает сейчас?

Теперь распознавание лиц имеет очень высокую точность. Чтобы это сделать, потребовалось 60 лет непрерывной работы и увеличение мощности компьютеров на несколько порядков. Эти системы до сих пор далеки от идеала, но работают в сотни тысяч раз лучше, чем на рассвете этой науки.

Распознавание лиц делают системы, как правило, созданные с помощью нейросетей. Причем не одной нейросети, а нескольких, объединенных в одну, каждая из которых выполняет свою функцию и передает информацию далее. Это наглядно показано в видео.

Задача первой из нейросетей — найти на представленном фото лица вообще. Она ищет какие-то универсальные параметры любого лица человека и пытается выделить их внутри изображения.

Пример того, как сеть выделяет лицо на изображении. Фото: teguhjatipras / pixabay. com

Пример того, как сеть выделяет лицо на изображении. Фото: teguhjatipras / pixabay. com

Следующая нейросеть пытается понять, насколько «качественные» эти изображения, в случае с лицами — очень грубо говоря, насколько они близки к «фото человека в анфас с хорошим освещением», ведь именно так видно максимальное количество уникальных параметров лица. Пример хорошего фото — снимок на паспорт или на визу. Это нужно для того, чтобы не передавать дальше совершенно некачественные (фото с определенной стороны в движении, например) или ошибочно найденные фото людей, ведь нейросети все же не совсем точные.

Следующая нейросеть означает специальные пункты на фото, которые называют «антропометрическими» или «знаковыми». В разных системах разное их количество — обычно от 20 до 60 (но бывает и больше). Это точки на элементах лица, которые в итоге могут однозначно выделить лицо среди других с той или иной точностью.

Один из примеров записи антропометрических пунктов. Источник: Кухарев Г. А., Казиева Н. Применение цифровой лицевой антропометрии / / Научно-технический вестник информационных технологий, механики и оптики (2019)

Один из примеров записи антропометрических пунктов. Источник: Кухарев Г. А., Казиева Н. Применение цифровой лицевой антропометрии / / Научно-технический вестник информационных технологий, механики и оптики (2019)

Следующая нейросеть на основе итогового изображения и антропометрических точек формирует некий набор цифр, вектор. Это набор из сотен цифр, характеризующих именно это лицо.

В результате, когда вы загружаете два изображения каких-то лиц, система формирует из них числа, которые при сравнении показывают, насколько эти лица похожи для алгоритмов. Вы получаете значение в процентах, которое говорит, насколько по мнению нейросети велика вероятность того, что на двух (или более) изображениях один и тот же человек. Если пройдена граница в какой-то процент, то люди считаются одинаковыми.

Пример верификации фото с помощью нейросети из программы IAT для Android. Несмотря на то, что между фотографиями 50 лет, нейросеть говорит, что на фото один и тот же человек с вероятностью 72% — довольно высокий процент для неидеальных фото. Источники фото: сайт Лукашенко и kremlin.ru

Пример верификации фото с помощью нейросети из программы IAT для Android. Несмотря на то, что между фотографиями 50 лет, нейросеть говорит, что на фото один и тот же человек с вероятностью 72% — довольно высокий процент для неидеальных фото. Источники фото: сайт Лукашенко и kremlin.ru

Таким образом, с таким совершенным алгоритмом распознавания нейросети не важен макияж или похудение или потолстение, а также на результат никак не влияет прическа. Нейросеть также способна сопоставить лица, если они затемнены или видны не полностью (к примеру, человек в очках), но тогда точность значительно падает. Возраст иногда влияет на сходство, но алгоритмы во многих случаях способны находить людей с разницей во сколько угодно лет.

Но бывают и «фальшивые позитивные» или «негативные» результаты. То есть нейросетям нельзя доверять на 100%, ради чего обычно используется многоступенчатая система проверки личности — в ЕС это фотофиксация и фиксация отпечатков пальцев при запросе на получение какого-то документа (визы, ВНЖ, нового паспорта и т.д.).

Технологии развиваются, и вскоре будет возможно распознавать лица людей даже в случае, если они сделали себе пластическую операцию. Ведь на лице есть ряд неизменных черт, уникальных для каждого человека (расстояние между глазами, расстояние от уха до уха, переносица, форма и размер глаз).

«Кейс Эрика Клэнтона»

Но достаточно ли маски и очков, чтобы надежно спрятаться от распознавания? Не всегда. Для этого мы расскажем об одном примечательном случае, когда для этого не понадобилась даже помощь спецслужб. В англоязычных статьях этот случай назвали Eric Clanton case.

Махачи между крайними консерваторами и активистами движения «антифа» (представители крайне левых, которые ведут уличное противостояние с крайне правыми) — это привычное дело. Обычно для этого люди вооружаются бутафорскими щитами из ДСП и дубинками, а также надевают на головы шлемы. Это часть своеобразного «протестного перфоманса» в США, как и погромы во время демонстраций во Франции или Греции. Полиция к этому тоже готова и знает, что делать, но обычно не вмешивается, пока дела не приобретают серьезного характера.

На одной из очередных демонстраций в Беркли 15 апреля 2017 года, в которой сошлись крайние консерваторы и антифа в США, появился мужчина, который исподтишка бил людей тяжелым велосипедным замком и сбегал. В результате несколько человек были травмированы, из них одному потребовалась госпитализация. Мужчина был в маске и в очках, которые, казалось бы, полностью защищали его от идентификации. Но за дело взялись пользователи «теневого» форума 4chan — их возмутило, что этот человек использовал довольно опасное оружие против безоружных людей и просто сбегал.

Эрик Клэнтон на демонстрации (по центру в черном). Большую часть времени он был также в темных очках. Скриншот с видео YouTube / GreatSarcophagus

Эрик Клэнтон на демонстрации (по центру в черном). Большую часть времени он был также в темных очках. Скриншот с видео YouTube / GreatSarcophagus

Они собрали все возможные фото этого человека, просмотрев сотни снимков и видео очевидцев. Им попался вот этот человек, который незадолго был у места демонстрации и имел подобный рюкзак.

Подозреваемый. Скриншот из видео «Распознование лиц (face recognition» в OSINT» / CyberYozh

Подозреваемый. Скриншот из видео «Распознование лиц (face recognition» в OSINT» / CyberYozh

Также у тех, кто искал этого человека, была часть фото, на которой было видно, что человек носит бороду. Обратили внимание на его сапоги и очки. И сопоставили это с фото из социальных сетей человека, отыскав ряд совпадений.

Процесс сопоставления «человека X», который избил людей замком и подозреваемого с предыдущего фото. Скриншот из видео «Распознование лиц (face recognition» в OSINT» / CyberYozh

Процесс сопоставления «человека X», который избил людей замком и подозреваемого с предыдущего фото. Скриншот из видео «Распознование лиц (face recognition» в OSINT» / CyberYozh

В результате удалось отыскать фото, где человек был в тех же сапогах, что и на демонстрации, и в тех же очках. Также у него борода и такая же форма лица. Подозреваемым оказался Эрик Клэнтон, преподаватель философии в Diablo Valley College. После этого мужчину арестовали и осудили на три года условного срока, а также уволили из колледжа.

А какие возможности есть у белорусских спецслужб?

На самом деле, они сильно отстают от зарубежных коллег, но система работает. Во-первых, существуют «обычные» камеры, которые пока не подключены к системе автоматического распознавания лиц, и их большинство (в столице таких, например, 6 тысяч). Все же по сравнению с Москвой или Пекином деньги в запуск и обслуживание системы автоматического распознавания лиц вкладываются небольшие (обслуживание одной «умной» камеры обходилось в 2020-м в 50-60 долларов ежегодно). «Простые» камеры, к примеру, есть на каждом доме у подъездов — у них низкое качество видео, но они позволяют проследить путь подозреваемого по какой-то местности при проведении оперативно-розыскных мероприятий.

Также существует система, поддерживающая автоматическое распознавание уже известных лиц — то, что часто называют «системой Kipod», хотя на самом деле обслуживает ее уже другая компания, а сайт оригинального «Кипода» не работает. Таких камер в Беларуси, по данным МВД от апреля 2023-го, чуть больше 1 100 и все они в Минске, но спецслужбы говорят, что хотели бы увеличить их количество в пять раз. На 2020-й год камеры распознавали лица с точностью 94% и могли распознать до 20 человек в кадре, но какова точность новой системы — непонятно.

Интерфейс программы Kipod. Скриншот из видео «Kipod-как найти персону по фото с камеры видеонаблюдения» /YouTube

Интерфейс программы Kipod. Скриншот из видео «Kipod-как найти персону по фото с камеры видеонаблюдения» /YouTube

Также не до конца понятно, каковы ее реальные возможности. Директор Synesis, компании, которая обслуживала ранее Kipod, говорил, что система имела ограниченные возможности и не могла распознавать всех граждан Беларуси даже теоретически, так как просто не потянула бы такой объем данных о стольких людях в таком количестве пунктов одновременно. В нее можно загрузить ограниченное количество лиц, которые она может отслеживать и идентифицировать. В любом случае, это тысячи или десятки тысяч человек.

Новая система пока держится в тайне, и ее возможности непонятны. Возможно, распознавание для потребностей криминалистики до сих пор делается в ручном режиме — берутся скриншоты с камер, на которых человек «засветился», а спецслужбист вручную «пробивает» их по базе АИС «Паспорт», в которой есть фото всех белорусов. Подобная система есть и у «Киберпартизан».

Но если человек не был распознан автоматически и не засветил лицо, то его маршрут при желании могут отследить по разным пунктам. Тогда вероятность успешной идентификации будет значительно выше.

Какие фото обычно используют для поиска протестующих? Бывший сотрудник ГУБОПиКа Станислав Лупоносов рассказывал, что это видео, снятое тихарями, записи с городских камер и фото, сделанные в РУВД при задержании людей.

По его словам, если нужно идентифицировать человека, то стоп-кадр с камеры сверяют с паспортными фото или снимками в базе ГАИ.

«Идентификация идет только по лицу, по одежде и по походке не происходит», — описывал Лупоносов.

Вместе с тем, недавно был суд, на котором жительницу Жлобина осудили за участие в протестах, узнав по рубашке. При осмотре изъятой у девушки рубашки и сопоставлении ее с видеофайлами камер видеонаблюдения суд установил, что именно в ней она была в тот вечер на акции протеста. Но в этом кейсе вряд ли рубашка стала первоначальной зацепкой.

Кого может или не может распознать система?

Система не может распознать человека, если закрыты антропометрические точки на лице. Самый простой вариант — комплект из маски, которая полностью закрывает нос и рот, или большого респиратора, кепки и темных очков, которые плотно прилегают к лицу. Также это может быть маска на все лицо или балаклава. Важно не демонтировать эту конструкцию на всем протяжении маршрута под камерами и не переодеваться там, где есть камеры.

В западных странах система поиска радикальных протестующих одна из наиболее отлаженных в мире. Поэтому анархисты, одни из самых радикальных представителей протестов, пользуются тактикой «Черного блока» — все они одеты в темную незаметную одежду и закрывают лица. Отыскать так конкретного человека намного сложнее. На фото протесты анархистов в Бразилии в 2013 году. Фото: Silvia Izquierdo / Associated Press

В западных странах система поиска радикальных протестующих одна из наиболее отлаженных в мире. Поэтому анархисты, одни из самых радикальных представителей протестов, пользуются тактикой «Черного блока» — все они одеты в темную незаметную одежду и закрывают лица. Отыскать так конкретного человека намного сложнее. На фото протесты анархистов в Бразилии в 2013 году. Фото: Silvia Izquierdo / Associated Press

При этом криминалисты способны выделить постфактум еще много признаков, по которым можно распознать человека. К примеру, форма головы и прически, «посадка» и цвет глаз, татуировки, «девайсы» и аксессуары, повседневная одежда.

Но даже в самом базовом варианте на поиск каждого отдельного человека уходит больше времени. И в толпе это значительно снижает вероятность, что человека отыщут, так как автоматический поиск в таком случае не работает, а искать вручную намного сложнее и дороже просто финансово.

Но ведь в наши дни и в нашей стране невозможно ходить в маске постоянно. Пандемия закончилась, и каждый человек в маске на улице мгновенно привлечет к себе внимание милиции. Да и ни один человек не способен идеально просчитать размещение видеокамер и другие, не связанные с видеонаблюдением, факторы.

К сожалению, реальность такова, что в тоталитарных странах в эпоху развитого видеонаблюдения человек, на данный момент житель городов, становится тотально подконтрольным властям, которые способны отслеживать каждое его передвижение и почти каждое действие в уличном пространстве.

Читайте также:

Мессенджеры, камеры, жучки. Как спецслужбы могут прослушивать белорусов и чего опасаться?

За москвичами следят сразу четыре алгоритма распознавания лиц. Один из них — скандально известный белорусский

Задерживают людей, у которых отыскали фото с протестов в Google Photos. Как защитить себя — пошаговый гайд

Клас
Панылы сорам
Ха-ха
Ого
Сумна
Абуральна

Хочешь поделиться важной информацией анонимно и конфиденциально?