Vision AI

Planejamento Atual

O Vision AI é um dispositivo projetado para auxiliar pessoas com deficiência visual a ler textos, reconhecer objetos, pessoas, dinheiro, entre outros.
Funcionamento: A câmera será semelhante a uma pequena câmera de mão, com um botão de ligar/desligar, um botão para captura de fotos, uma entrada para carregamento, uma entrada P2 para fones de ouvido e uma entrada para um chip de operadora para acesso à internet. Ao pressionar o botão de captura, a foto será registrada no cartão de memória e enviada para a API do Google Gemini através de um código Python, que solicitará a descrição completa da imagem. O texto será devolvido e convertido em áudio utilizando a biblioteca Python GTTS, sendo reproduzido no alto-falante da câmera. Após isso, a imagem será deletada do cartão.
A ideia é que pessoas com deficiência visual possam descrever imagens com extrema facilidade, utilizando recursos de inteligência artificial, em qualquer lugar, na palma de suas mãos, tudo por um preço acessível.

Informações Importantes

Este projeto pode levar tempo para ser concluído. Será necessário muito conhecimento em programação, recursos financeiros, equipamentos e tecnologia. Não poderei prometer uma data de lançamento, mas qualquer atualização sobre o projeto será adicionada aqui neste site. Caso queira receber as atualizações em seu e-mail, você pode se inscrever em nossa newsletter clicando no link abaixo.