Cómo extraer texto de imágenes en Windows 11: Herramientas y métodos técnicos

  • 05 Jun 2025 03:05 PM

Soluciones, basadas en inteligencia artificial, permiten convertir imágenes, capturas de pantalla o documentos escaneados en texto editable.

Windows 11 ofrece múltiples herramientas integradas y de terceros para extraer texto de imágenes mediante Reconocimiento Óptico de Caracteres (OCR).

Estas soluciones, basadas en inteligencia artificial, permiten convertir imágenes, capturas de pantalla o documentos escaneados en texto editable.

A continuación, detallamos los métodos disponibles, sus requisitos técnicos y limitaciones.

Herramienta de Recortes (Snipping Tool) con OCR

Requisitos:

  • Windows 11 versión 22H2 o posterior.

  • Microsoft Edge WebView2 Runtime instalado (necesario para el motor OCR).

Funcionamiento técnico:

  1. Captura de imagen:

    • Presiona Win + Shift + S para abrir la superposición de recortes y selecciona un área con texto.

    • La imagen se guarda en el portapapeles y se abre en la Herramienta de Recortes.

  2. Extracción de texto:

    • Haz clic en "Acciones de texto" (icono de "T" en la barra superior).

    • El motor OCR analiza la imagen y muestra el texto detectado, permitiendo copiarlo (Ctrl + C) o editarlo directamente.

Limitaciones:

  • Solo compatible con idiomas como inglés, español, francés y alemán.

  • Precisión variable en imágenes con baja resolución o texto manuscrito.

Aplicación Fotos con OCR

Configuración necesaria:

Habilitar manualmente la función OCR mediante el Editor de Registro (requiere permisos de administrador):

Ruta: `HKEY_LOCAL_MACHINE > Photos`  
Clave: `EnableTextExtraction` (valor 1)  

Uso:

  1. Abre una imagen en la aplicación Fotos.

  2. Pasa el cursor sobre el texto para seleccionarlo y copiarlo.

Ventajas:

  • Procesamiento local (sin enviar datos a la nube).

Desventajas:

  • Requiere ajustes manuales en el registro.

  • No soporta textos complejos (ej: tablas).

PowerToys Text Extractor

Características técnicas:

  • Herramienta de código abierto basada en Text Grab.

  • Usa OCR local con aceleración por hardware (NPU en dispositivos compatibles).

Instalación y uso:

  1. Descarga PowerToys desde GitHub y activa el módulo Text Extractor.

  2. Presiona Win + Shift + T para seleccionar un área de la pantalla.

  3. El texto se copia automáticamente al portapapeles.

Idiomas soportados:

Requiere instalar paquetes de idioma OCR via PowerShell:

Add-WindowsCapability -Online -Name "Language.OCR~~~es-ES~0.0.1.0"

Lista completa de idiomas disponible con:

Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }

Excel con "Datos de imagen"

Requisitos:

  • Excel para Microsoft 365 (versión 1903+).

  • Imágenes con tablas o datos estructurados .

Proceso:

  1. En Excel, ve a: Datos > Desde imagen > Imagen desde archivo.

  2. El motor OCR convierte la imagen en una tabla editable, permitiendo revisar y corregir errores.

Limitaciones:

  • Solo reconoce 20 idiomas (incluyendo español e inglés).

  • Requiere imágenes enfocadas y sin distorsiones angulares.

API de IA de Windows (para desarrolladores)

Tecnología subyacente:

  • Motor OCR basado en Windows AI Foundry, con soporte para NPU y modelos de IA avanzados.

  • Proporciona límites de texto poligonales y niveles de confianza por palabra.

Ejemplo de código (C#):

var textRecognizer = await TextRecognizer.CreateAsync();  
ImageBuffer buffer = ImageBuffer.CreateBufferAttachedToBitmap(bitmap);  
RecognizedText result = textRecognizer.RecognizeTextFromImage(buffer);  
string extractedText = string.Join("
", result.Lines.Select(line => line.Text));

Aplicaciones:

  • Ideal para integración en apps empresariales que requieran procesamiento batch de documentos.

Comparativa de métodos

Método Precisión Idiomas Procesamiento Requisitos
Herramienta de Recortes Media-Alta ~20 Local Windows 11 22H2
PowerToys Text Extractor Alta +50 Local/NPU Instalación manual
Excel "Datos de imagen" Alta* 20 Local/Nube Suscripción Microsoft 365
API Windows AI Muy Alta +100 Local/NPU SDK Windows App 1.7.1+

*Solo para datos tabulares.

Conclusión

Windows 11 ofrece soluciones OCR versátiles, desde herramientas nativas hasta APIs para desarrolladores. Para usuarios casuales, la Herramienta de Recortes es la opción más accesible, mientras que PowerToys y las APIs de IA brindan mayor control y precisión. La elección depende del uso:

  • Privacidad: PowerToys y Fotos procesan datos localmente.

  • Productividad: Excel es ideal para tablas.

  • Personalización: Las APIs permiten integrar OCR en flujos de trabajo personalizados.

Para obtener mejores resultados, asegúrate de usar imágenes nítidas y actualizar Windows 11 a la última versión.