DocTron 是一个在通用视觉语言模型架构上实现结构化内容解析和理解的开源项目,而无需定制化的模块开发,覆盖通用文档、学科公式、图表代码等场景。 论文标题:DocTron-Formula: Generalized Formula Recognition in Complex and Structured Scenarios论文链接:https://arxiv.org/abs/2508.00311Github 链接:https://github.com/DocTron-hub/DocTron-Formula项目开源地址:https://huggingface.co/DocTron 创新点与技术突破