Usando pdftotext:#
Instalación:
- Si no está instalado, necesitarás instalar el paquete
poppler-utilsque incluyepdftotext.
sudo apt install poppler-utilso
yum install poppler-utilsdependiendo de su distribución.
- Si no está instalado, necesitarás instalar el paquete
Uso:
- Una vez instalado, puedes convertir un PDF a texto y luego contar las palabras de la siguiente manera:
pdftotext input.pdf - | wc -wAquí,
input.pdfes su archivo PDF de origen ywc -wcuenta el número de palabras. El-enpdftotextespecifica que la salida debe enviarse a la salida estándar, que luego se canaliza awc.