Usamos cookies para medir audiência e melhorar sua experiência. Você pode aceitar ou recusar a qualquer momento. Veja sobre o iMasters.
Tô construindo um motor de OCR pra anotação de par tidas de xadrez em Python. O desafio é que a leitura das notas manuscritas às vezes zomba e acaba acertando movimentos errados ao tentar casar com as jogadas legais, usando Levenshtein.
Pô, na moral, acho que um bom pré processamento da imagem ajuda bastante também. Limpar o texto, ajustar contraste, essas coisas, podem fazer o OCR ficar mais preciso. Depois, usar alguma lógica que valide o movimento, tipo, confirmar se a peça realmente pode se mover daquele jeito na posição atual, ajuda a evitar essas confusões.
Já passei por isso, na minha experiência, usar um filtro de validação ou até um segundo nível de checagem ajuda bastante. Tipo, depois que o OCR identifica o movimento, checo se ele faz sentido no contexto da posição atual. Assim, se o movimento não for possível ou parecer estranho, a gente descarta ou pede uma revisão manual.
Nossa, isso pesa no operacional depois. Acho que valeria a pena treinar um modelo de ML específico pra reconhecer esses movimentos manuscritos e diminuir esses erros do OCR. Assim, o resultado já vem mais confiável desde o começo.