Kir4ik52 :blobfoxsanta:<p>Pdf-extract-API </p><p>Проект предлагает инструмент для конвертации изображений и PDF-файлов в текст форматов Markdown и JSON с высокой точностью, включая поддержку табличных данных и математических формул. </p><p>Он основан на FastAPI, использует Celery для асинхронной обработки и Redis для кэширования результатов OCR, предоставляя различные стратегии для конвертации, такие как Marker, Surya-OCR и Tesseract, а также возможность удаления персонально идентифицируемой информации. </p><p>src: <a href="https://github.com/CatchTheTornado/pdf-extract-api" rel="nofollow noopener noreferrer" translate="no" target="_blank"><span class="invisible">https://</span><span class="ellipsis">github.com/CatchTheTornado/pdf</span><span class="invisible">-extract-api</span></a></p><p><a href="https://mastodon.ml/tags/blacktriangle" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>blacktriangle</span></a> <a href="https://mastodon.ml/tags/opensorce" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>opensorce</span></a> <a href="https://mastodon.ml/tags/github" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>github</span></a> <a href="https://mastodon.ml/tags/OCR" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>OCR</span></a> <a href="https://mastodon.ml/tags/tesseract_ocr" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>tesseract_ocr</span></a> <a href="https://mastodon.ml/tags/tesseract" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>tesseract</span></a> <a href="https://mastodon.ml/tags/markdown" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>markdown</span></a> <a href="https://mastodon.ml/tags/pdf" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>pdf</span></a> <a href="https://mastodon.ml/tags/fastapi" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>fastapi</span></a> <a href="https://mastodon.ml/tags/json" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>json</span></a> <a href="https://mastodon.ml/tags/marker" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>marker</span></a> <a href="https://mastodon.ml/tags/Surya" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Surya</span></a>-OCR <a href="https://mastodon.ml/tags/Celery" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Celery</span></a></p>