全部开源,完全可商用的中文版 Llama2 模型及中文 SFT 数据集。
Talk is cheap, Show you the Demo.
我们使用了中文 SFT 数据集,数据量 1000 万。
python train.py --args ...
Apache-2.0 license