Recientemente he realizado un pequeño proyecto personal que implicaba el reconocimiento de texto en imágenes, necesitaba usar PHP y haciendo una pequeña búsqueda en Github di con esta librería bastante interesante:
https://github.com/thiagoalessio/tesseract-ocr-for-php
Se basa en un popular repositorio de código abierto dedicado justamente a lo que buscaba. Me ha parecido muy interesante y no sé si alguno de vosotros en algún momento puede llegar a necesitar algo similar para una práctica o ejercicio en DAW o DAM, con unas pocas líneas podemos conseguir extraer todo el texto con muy buena precisión, al menos en las pruebas que he realizado.
<?php
require_once "vendor/autoload.php";
use thiagoalessio\TesseractOCR\TesseractOCR;
echo (new TesseractOCR('image.png'))
->run();
?>
Si salimos un poco de ámbito educativo y queréis probarlo, una idea sencilla es hacer una foto a un ticket de compra y probar esta librería.
Un saludo.