Found 612 repositories(showing 30)
opendatalab
Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows.
xerrors
结合知识库管理的 Agent Harness 平台。 An agent harness that integrates a LightRAG knowledge base and knowledge graphs. Build with LangChain v1 + Vue + FastAPI, support DeepAgents、MinerU PDF、Neo4j 、MCP.
magicyuan876
天枢 - 企业级 AI 一站式数据预处理平台 | PDF/Office转Markdown | 支持MCP协议AI助手集成 | Vue3+FastAPI全栈方案 | 文档解析 | 多模态信息提取
opendatalab
A diffusion-based framework for document OCR that replaces autoregressive decoding with block-level parallel diffusion decoding. Topics
liuhuapiaoyuan
MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。
opendatalab
MinerU-HTML: An SLM-powered HTML main content extractor that outputs clean HTML bodies. Perfect for Deep Research Agents, RAG applications, and training data generation.
1sdv
将论文(Markdown格式)转换为可运行的Python代码(Mineru一键转化pdf为Markdown文件).
lpdswing
A user-friendly PDF-to-Markdown conversion tool based on Mineru.
liuhuapiaoyuan
基于MinerU的桌面应用程序,MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。
KylinMountain
Convert files into markdown to help RAG or LLM understand, based on markitdown and MinerU, which could provide high quality pdf parser.
JuniverseCoder
This tool converts PDF files and images into editable PowerPoint presentations (`.pptx`) by leveraging structured data from the MinerU PDF Extractor. It accurately reconstructs text, images, and layout, providing a high-fidelity, editable version of the original document.
opendatalab
A Python package for interacting with the MinerU Vision-Language Model.
neka-nat
MinerU API server
liunian-Jay
PDF Parsing Tool: GOT's vLLM acceleration implementation, MinerU for layout recognition, and GOT for table formula parsing.
icecraft
No description available
BukeLy
Multi-tenant RAG API powered by LightRAG/RAG-Anything. Auto-selects best parser (DeepSeek-OCR/MinerU/Docling) via complexity scoring
OpenDCAI
Ray-based accelerator for MinerU VLM inference pipeline. Lightweight, multi-GPU friendly PDF → Markdown processing. 基于 Ray 的 MinerU VLM 推理加速器,轻量、低侵入,面向多 GPU / 国产算力环境的 PDF → Markdown 处理方案。
kv1830
Fast pdf translate是一款pdf翻译软件,基于MinerU实现pdf转markdown的功能,接着对markdown进行分割, 送给大模型翻译,最后组装翻译结果并由pypandoc生成结果pdf。
opendatalab
No description available
Quantatirsk
High-performance OCR microservice based on PaddleOCR-VL-0.9B (PaddleOCR-VL-1.5-0.9B) with MinerU-compatible API
poswalsameer
Cloned one of the most popular game from Stake Casino - Mines.
max2star
RAGForge 是基于 RAGFlow、MinerU等项目,进行功能增强的开源 RAG(Retrieval-Augmented Generation)引擎。在保持原有 RAGFlow 核心功能的基础上,新增了多项企业级功能增强,为开发人员提供更强大的 RAG 解决方案。
lzc-shake
Deep academic paper analyzer for ML/DL research. Formula-by-formula explanation, reproducibility analysis, and research idea generation using MinerU API.
aidayang
MonkeyOCR:PDF/图片转Markdown格式软件免安装一键启动整合包
l0o0
Zotero插件,全文翻译(支持MinerU,pdf2zh,dox2x)。AI智能文献总结,AI列文献矩阵。7天免费试用。
iptag
基于mineru网页端,抓包分析后将核心的上传及转换功能集成为api,供其他服务调用
opendatalab
No description available
wzdavid
Enterprise-grade MinerU document parsing service with asynchronous queue processing based on Celery. 企业级 MinerU 文档解析服务,基于 Celery 实现异步队列处理,采用完全解耦的 API/Worker 架构。
aidayang
MinerU免安装部署一键启动整合包
zjnuxsl
基于 MinerU 2.5 的智能论文内容提取工具,专为科研工作者设计。支持 PDF 批量处理,智能提取文本、图片(自动识别 Fig.1/Figure 2 等编号)、表格(JPG + Excel 双格式)、公式(图片 + LaTeX)。采用正则表达式 + LLM 双引擎策略智能提取论文章节(Abstract/Introduction/Methods/Results & Discussion/Conclusion),输出为 Markdown 文档,方便构建素材库。