TexTeller / README_zh.md
OleehyO's picture
Upload folder using huggingface_hub
40913ca verified

关于TexTeller

  • 📮[2024-03-25] TexTeller2.0发布!TexTeller2.0的训练数据增大到了7.5M(相较于TexTeller1.0增加了~15倍并且数据质量也有所改善)。训练后的TexTeller2.0在测试集中展现出了更加优越的性能,尤其在生僻符号、复杂多行、矩阵的识别场景中。

    这里有更多的测试图片以及各家识别模型的横向对比。

TexTeller是一个基于ViT的端到端公式识别模型,可以把图片转换为对应的latex公式

TexTeller用了550K7.5M的图片-公式对进行训练(550K的数据集可以在这里获取),相比于LaTeX-OCR(使用了一个100K的数据集),TexTeller具有更强的泛化能力以及更高的精确度,可以覆盖你大部分的使用场景

详情信息请参阅TexTeller的github仓库