O algoritmo facial do SAFR ficou ainda mais rápido

19 de Julho de 2019 , por Dan Grimm, GM e VP Computer Vision.

O Instituto Nacional de Padrões e Tecnologia dos Estados Unidos (NIST) realiza uma bateria contínua de testes, conhecida como Teste de Fornecedor de Reconhecimento Facial (FRVT), para medir as principais características dos algoritmos de reconhecimento facial, incluindo precisão, desempenho e viés. Empresas e instituições acadêmicas têm a oportunidade de enviar um ou mais algoritmos para que o NIST aplique um conjunto de testes. Os dois resultados mais recentes do teste FRVT têm mais de 370 páginas e foram publicados em Abril de 2019 e Julho de 2019.

Entre os algoritmos que excederam a precisão de 96%, o SAFR é o modelo mais rápido e mais leve.

Os resultados do NIST de Julho de 2019 descobriram que o SAFR foi o mais rápido e mais compacto entre os algoritmos de reconhecimento facial para rostos no mundo real (wild faces) com precisão de primeira linha – taxa para Falso Non- Match menor que 0,0335. Em comparação com outros algoritmos de alta precisão, o SAFR é 2 vezes mais rápido que a média e 35% menor que o segundo menor algoritmo. O SAFR foi o algoritmo mais rápido testado nos resultados do NIST de Abril de 2019 e sua velocidade melhorou em 30% nos novos resultados de Julho. O SAFR tem 99,87% de precisão comprovada no teste de rostos marcados no mundo real da Universidade de Massachusetts.

O NIST não só mede características específicas de algoritmos faciais, tais como desempenho, precisão e viés, a normas e medidas corporais, como também informa sobre os atributos de tipo de imagem, como fotos de vistos, mugshots, webcam, ou imagens em situações reais. Imagens de situações reais (wild images) são rostos desconhecidos capturados por imagens de vídeo: são imagens complexas porque os rostos podem ter variações de ângulo e inclinação; sem mencionar que pode haver muitas faces dentro de um mesmo frame de vídeo. As wild images desafiam qualidades faciais porque estão inseridas em condições do mundo real, para as quais o SAFR foi projetado. O NIST realiza seus testes de reconhecimento facial usando fotografias estáticas. O reconhecimento facial em vídeo ao vivo requer otimização combinada na aquisição, precisão e velocidade.

O SAFR da RealNetworks é o algoritmo de reconhecimento facial de alto desempenho mais preciso para vídeo ao vivo, conforme testado pelo NIST.

Fornecedores, pesquisadores e instituições acadêmicas podem otimizar seus envios para o FRVT (Teste de Fornecedor de Reconhecimento Facial) e não precisam enviar seu algoritmo de reconhecimento facial comercial real, o que pode levar a resultados incorretos. Um fornecedor ou acadêmico pode enviar um algoritmo que funcione bem em precisão mas que em condições comerciais reais talvez seja tão computacionalmente caro que se torne impraticável.  Por exemplo, nos resultados do FRVT de Julho de 2019, vários algoritmos alcançaram marcas de alta precisão para wild faces mas executaram tão lentamente – 1.5 a 55 vezes mais lento que o algoritmo SAFR – que seriam impraticáveis em muitas condições do mundo real, exigindo poder computacional extremamente caro, tempo excessivo para reconhecer um rosto e ser sobrecarregado por muitos rostos no vídeo.

Alguns dos algoritmos testados pelo NIST podem ser comparados com os carros de Fórmula 1: são construídos para um bom desempenho em um determinado circuito, mas não refletem o mundo comercial real, que exige equilíbrio nas condições de direção, ruído, freagem, capacidade de alcance, segurança, e conforto.

Então, como o SAFR performou contra o algoritmo de maior precisão no relatório de Julho? O algoritmo de maior precisão do relatório de Julho tem uma pontuação para wild faces de 0,0271 mas é 3,6 vezes mais lento e 7 vezes mais pesado que o algoritmo SAFR, que tem uma pontuação de 0,0334. Vários algoritmos têm um bom desempenho na precisão, mas em comparação com o SAFR em uma implantação comercial em grande escala e no mundo real, seria necessário ter um número significativamente maior de hardware no local para obter resultados que seriam de 3 a 4 vezes mais lentos, como ilustrado no gráfico abaixo. O aumento na precisão de wild faces em 0,0064 tem um efeito debilitante no desempenho e custo.

O alto desempenho faz uma diferença material, uma vez que aumenta o número de oportunidades para ter o reconhecimento em um sistema computacionalmente restrito. No grupo de algoritmos que ultrapassaram a precisão de 96%, o SAFR é o modelo mais rápido e mais leve. Isso significa que o SAFR pode identificar uma face várias vezes durante o mesmo período de tempo de outros algoritmos, compondo posteriormente a precisão da plataforma.

O SAFR é altamente competitivo em precisão para fotos. O NIST mede a correspondência de uma única imagem com uma única imagem para wild faces, enquanto na vida real as pessoas que se deslocam dentro de um frame de vídeo estão em constante movimento. O SAFR usa inteligência de ponta para selecionar a imagem certa a partir de centenas de frames de vídeo. Isso significa que a precisão do SAFR é realmente maior do que a medida pelo NIST, já que o SAFR monitora continuamente o vídeo para capturar e enviar o melhor frame para reconhecimento. O NIST não usa vídeo em seus testes.

O SAFR se diferencia de outros algoritmos de reconhecimento facial porque atinge resultados com uma fração do poder computacional exigido pela maioria dos algoritmos de sua categoria. Muitas empresas que se submetem ao NIST estão otimizadas para obter alta precisão, mas não conseguem encontrar um equilíbrio entre desempenho e precisão.

O SAFR da RealNetworks está comprometido em fornecer a melhor precisão e desempenho com o mínimo de viés, usando hardware prontamente disponível para reconhecer pessoas em condições do mundo real.

O SAFR é a principal plataforma para reconhecimento facial no mundo real.