LlamaParse cobra por página.
1
LlamaParse cobra por página.
Azure Document Intelligence cobra por página.
AWS Textract cobra por página.
alguien publicó en GitHub lo mismo, gratis, y procesa 122 páginas por segundo.
PDFs, DOCX, PPTX, XLSX, EPUB e imágenes
tablas, ecuaciones y matemáticas en línea
GPU, CPU y Apple Silicon
todos los idiomas principales
salida en Markdown y JSON lista para RAG
si estás montando pipelines de IA o bases de conocimiento, esto te borra una factura.
36.8k estrellas. GPL-3.0. Gratis.
se llama Marker
{{IMAGE_0}}
2
https://
github.com/datalab-to/mar
ker
…
Todo esto y más en el canal:
http://
t.me/fluyeporlaweb
https://t.co/gTw264rjxx
https://t.co/ANlD2Ch1y9
{{IMAGE_1}}
1 / 2
Arifi Labs how is this different from docling or microsoft's markdown converting tool? 9h ago
Nahid marker at 122 pages/sec is impressive saves big time 9h ago