Reconhecimento facial, como funciona?
A maioria das pessoas se sente à vontade com o reconhecimento facial pelo uso nos filtros do Instagram e no Face ID. Mas essa tecnologia relativamente nova pode parecer um pouco assustadora. Seu rosto é como uma impressão digital e a tecnologia por trás do reconhecimento facial é complexa.
Como em qualquer nova tecnologia, há desvantagens no reconhecimento facial. Essas desvantagens estão se tornando mais aparentes à medida que militares, policiais, anunciantes e criadores de deepfake encontram novas maneiras desonestas de tirar proveito do software de reconhecimento facial.
Leia também
Agora, mais do que nunca, é essencial que as pessoas entendam como o reconhecimento facial funciona. Também é importante conhecer as limitações do reconhecimento facial e como ele se desenvolverá no futuro.
Como funciona o sistema de reconhecimento facial?
Antes de entrar nos vários meios diferentes de reconhecimento facial, é importante entender como o processo de reconhecimento facial funciona. Aqui estão três aplicativos para o software de reconhecimento facial e uma explicação simples de como eles reconhecem ou identificam rostos:
Reconhecimento facial básico: para os filtros e Instagram, a câmera do telefone “procura” os recursos definidores de um rosto, especificamente um par de olhos, um nariz e uma boca. Em seguida, ele usa algoritmos para bloquear um rosto e determinar em qual direção ele está olhando, se sua boca está aberta etc. Vale a pena mencionar que isso não é uma identificação facial, é apenas um software procurando rostos.
ID do rosto e programas similares: ao configurar o ID facial (ou programas similares) em seu telefone, ele tira uma foto do seu rosto e mede a distância entre seus recursos faciais. Então, toda vez que você desbloqueia seu telefone, ele “olha” pela câmera para medir e confirmar sua identidade.
Identificando um estranho: quando uma organização deseja identificar uma face para fins de segurança, publicidade ou policiamento, ela usa algoritmos para comparar essa face a um extenso banco de dados de faces. Esse processo é quase idêntico ao Face ID da Apple, mas em uma escala maior. Teoricamente, qualquer banco de dados poderia ser usado (cartões de identificação, perfis do Facebook), mas um banco de dados de fotos claras e pré-identificadas é o ideal.
Tudo bem, vamos entrar no âmago da questão. Como o “reconhecimento facial básico” usado para os filtros do Instagram é um processo tão simples e inofensivo, vamos nos concentrar inteiramente na identificação facial e nas muitas tecnologias diferentes que podem ser usadas para identificar um rosto.
Identificação facial e imagens 2D
Como era de se esperar, a maioria dos softwares de reconhecimento facial se baseia inteiramente em imagens 2D. Mas isso não é feito porque a imagem facial 2D é super precisa, é feita por uma questão de conveniência. A grande maioria das câmeras tira fotos sem profundidade e as fotos públicas que podem ser usadas para bancos de dados de reconhecimento facial (fotos de perfil do Facebook, por exemplo) são todas em 2D.
Por que a imagem facial 2D não é super precisa? Bem, porque uma imagem plana do seu rosto carece de recursos de identificação, como profundidade. Com uma imagem plana, um computador pode medir a distância pupilar e a largura da boca, entre outras variáveis. Mas não pode dizer o comprimento do nariz ou a proeminência da testa.
Além disso, a imagem facial 2D depende do espectro de luz visível. Isso significa que a imagem facial 2D não funciona no escuro e pode não ser confiável em condições de iluminação descoladas ou sombrias.
Claramente, o caminho para contornar algumas dessas deficiências é usar imagens faciais em 3D. Mas como isso é possível? Você precisa de equipamento especial para ver um rosto em 3D?
Câmeras de infravermelho no reconhecimento de face
Embora alguns aplicativos de reconhecimento facial dependam apenas de imagens 2D, não é incomum que o reconhecimento facial dependa também de imagens 3D. De fato, sua experiência com o reconhecimento facial provavelmente envolve uma pitada de 3D.
Isto é conseguido através de uma técnica chamada lidar, que é semelhante ao sonar. Essencialmente, os dispositivos de digitalização de rosto, como o seu iPhone, oferecem uma matriz IR inofensiva em seu rosto. Essa matriz (uma parede de lasers) se reflete no seu rosto e é captada por uma câmera infravermelha (ou câmera ToF) no telefone.
Onde a mágica 3D acontece? A câmera de infravermelho do seu telefone mede quanto tempo leva para cada bit de luz infravermelha ricochetear no seu rosto e retornar ao telefone. Naturalmente, a luz refletida pelo nariz terá uma jornada mais curta do que a refletida pelos ouvidos, e a câmera infravermelha usa essas informações para criar um mapa de profundidade exclusivo do seu rosto. Quando usada juntamente com a imagem 2D básica, a imagem 3D pode aumentar significativamente a precisão do software de reconhecimento facial.
A imagem Lidar é um conceito estranho que pode ser difícil de entender. Se ajudar, tente imaginar que a malha de infravermelho do telefone (ou qualquer dispositivo de reconhecimento facial) é um brinquedo de quadro de anúncios. Seu rosto deixa um recuo na malha de infravermelho, onde seu nariz é visivelmente mais profundo do que, digamos, seus olhos.
Imagem térmica permite o trabalho de reconhecimento facial à noite
Uma das deficiências do reconhecimento facial 2D é que ele depende do espectro visível da luz. Em termos leigos, o reconhecimento facial básico não funciona no escuro. Mas isso pode ser contornado usando uma câmera de imagem térmica.
“Espere um minuto”, você pode dizer, “as imagens térmicas não dependem da luz infravermelha?” Sim. Mas as câmeras de imagem térmica não emitem raios de luz infravermelha; eles simplesmente detectam a luz infravermelha que emite dos objetos. Objetos quentes emitem uma tonelada de luz infravermelha, enquanto objetos frios emitem uma quantidade desprezível de luz infravermelha. As caras câmeras de imagem térmica podem até detectar sutis diferenças de temperatura em uma superfície, sendo a tecnologia ideal para o reconhecimento facial.
Existem várias maneiras diferentes de identificar um rosto com imagens térmicas. Todas essas técnicas são incrivelmente complicadas, mas compartilham algumas semelhanças fundamentais; portanto, tentaremos simplificar as coisas com uma lista:
São necessárias várias fotos: uma câmera de imagem térmica tira várias fotos do rosto de um sujeito. Cada foto foca em um espectro diferente de luz infravermelha (ondas longas, curtas e médias). Normalmente, o espectro de ondas longas fornece os detalhes mais faciais.
Mapas de vasos sanguíneos são úteis: essas imagens de IV também podem ser usadas para extrair a formação de vasos sanguíneos no rosto de uma pessoa. É assustador, mas os mapas dos vasos sanguíneos podem ser usados como impressões digitais faciais únicas. Eles também podem ser usados para encontrar a distância entre os órgãos faciais (se imagens térmicas típicas produzem imagens de má qualidade) ou para identificar hematomas e cicatrizes.
O alvo pode ser identificado: uma imagem composta (ou conjunto de dados) é criada usando várias imagens IR. Essa imagem composta pode ser comparada a um banco de dados facial para identificar o assunto.
É claro que o reconhecimento facial térmico é geralmente usado pelos militares, não é algo que você encontrará facilmente e não é algo que virá com o seu próximo celular. Além disso, a geração de imagens térmicas não funciona bem durante o dia (ou em ambientes geralmente bem iluminados), por isso não tem muitas aplicações em potencial fora das forças armadas.
Limitações do reconhecimento facial
Passamos muito tempo conversando sobre as deficiências do reconhecimento facial. Como vimos em IR e imagem térmica, é possível superar algumas dessas limitações. Mas ainda existem alguns problemas que ainda não foram resolvidos:
Obstrução: como seria de esperar, óculos de sol e outros acessórios podem ativar o software de reconhecimento facial.
Poses: o reconhecimento facial funciona melhor com uma imagem neutra e voltada para a frente. Uma inclinação ou virada da cabeça pode dificultar o reconhecimento facial, mesmo para softwares de reconhecimento baseados em IR. Além disso, um sorriso, bochechas inchadas ou qualquer outra pose pode mudar a forma como o computador mede seu rosto.
Luz: todas as formas de reconhecimento facial dependem da luz, seja o espectro visível ou a luz infravermelha. Como resultado, condições estranhas de iluminação podem diminuir a precisão da identificação facial. Isso pode mudar, pois os cientistas estão desenvolvendo atualmente a tecnologia de reconhecimento facial baseada em sonar.
O banco de dados: sem um bom banco de dados, o reconhecimento facial não funciona. Nessa mesma linha, é impossível identificar um rosto que não foi identificado corretamente no passado.
Processamento de dados: dependendo do tamanho e formato de um banco de dados, os computadores podem demorar um pouco para identificar os rostos corretamente. Em algumas situações, como o policiamento, as limitações no processamento de dados restringem o uso da identificação facial para aplicações diárias (o que provavelmente é uma coisa boa).
A partir de agora, a melhor maneira de contornar essas limitações é usar outras formas de identificação em conjunto com o reconhecimento facial. Seu telefone solicitará uma senha ou uma impressão digital se não conseguir identificar seu rosto, e o governo chinês usará cartões de identificação e tecnologia de rastreamento para fechar a margem de erro existente em sua rede de reconhecimento facial.
No futuro, os cientistas certamente encontrarão uma maneira de contornar essas questões. Eles podem usar a tecnologia de sonar juntamente com o lidar para criar mapas de faces 3D em qualquer ambiente, e podem encontrar maneiras de processar dados de faces (e identificar estranhos) em um período incrivelmente curto. De qualquer forma, essa tecnologia tem muito potencial para abuso, por isso vale a pena acompanhar.
Ficou alguma dúvida? Deixem nos comentários suas perguntas!
Sobre o autor
No final da década de 90, André começou a lidar diretamente com tecnologia ao comprar seu primeiro computador. Foi um dos primeiros a ter acesso à internet em sua escola. Desde então, passou a usar a internet e a tecnologia para estudar, jogar, e se informar, desde 2012 compartilhando neste site tudo o que aprendeu.
Veja também
Tradutor de imagem, como funciona?
Veja o que o Google já sabe sobre você
Google Maps em 3D, como abrir?
Como transformar imagem em texto e texto em imagem?