File size: 1,065 Bytes
40913ca
bcf8d58
40913ca
 
bcf8d58
40913ca
bcf8d58
40913ca
0212f78
40913ca
1
2
3
4
5
6
7
8
9
10
11
# 关于TexTeller

* 📮[2024-03-25] TexTeller2.0发布!TexTeller2.0的训练数据增大到了7.5M(相较于TexTeller1.0**增加了~15倍**并且数据质量也有所改善)。训练后的TexTeller2.0在测试集中展现出了**更加优越的性能**,尤其在生僻符号、复杂多行、矩阵的识别场景中。
    > 在[这里](https://github.com/OleehyO/TexTeller/blob/main/assets/test.pdf)有更多的测试图片以及各家识别模型的横向对比。

TexTeller是一个基于ViT的端到端公式识别模型,可以把图片转换为对应的latex公式

TexTeller用了~~550K~~7.5M的图片-公式对进行训练(550K的数据集可以在[这里](https://huggingface.co./datasets/OleehyO/latex-formulas)获取),相比于[LaTeX-OCR](https://github.com/lukas-blecher/LaTeX-OCR)(使用了一个100K的数据集),TexTeller具有**更强的泛化能力**以及**更高的精确度**,可以**覆盖你大部分的使用场景**> 详情信息请参阅[TexTeller的github仓库](https://github.com/OleehyO/TexTeller?tab=readme-ov-file)