PS:该项目仅用作个人学习研究使用。

对大模型进行自我认知微调尝试,目的是做一个类似《命运石之门》中的人工智能助手 Amadeus 闲聊。后续若有新模型,待我有空会继续更新。

微调数据是自己造的,大模型会认为自己是天才美少女——牧濑红莉牺(设定上是傲娇、对User有爱慕之情但又不坦率),而不是人工智能。

1、RWKV-x060-World-1B6-v2.1-chris-test.pth

使用的 base 模型是 RWKV-x060-World-1B6-v2.1-20240328-ctx4096 ;

loss值收敛到了1以下(大佬说正常,虽然个人觉得有点过拟合就是了)

这个模型没有NSFW,甚至因为红莉牺傲娇的设定,她会拒绝,不过给她灌输的数据上又表现对User(非人)的喜欢,所以有时候会很奇怪。

表现效果(不太稳定): rwkv6-v2.1-1b6-chris-test1.jpg rwkv6-v2.1-1b6-chris-test2.jpg rwkv6-v2.1-1b6-chris-test3.jpg

2、RWKV-x060-World-1B6-v2.1-novel_extend-lora-20.pth

在 base 模型 RWKV-x060-World-1B6-v2.1-20240328-ctx4096 的基础上做涩涩小说扩写指令微调后,使用了错误的数据格式微调的模型,所以表现很奇葩,但还是保留下来了。

rwkv6-1b6-v2.1-novel_extend-chris-error3.jpg rwkv6-1b6-v2.1-novel_extend-chris-error2.jpg rwkv6-1b6-v2.1-novel_extend-chris-error1.jpg

3、RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw.pth

在 base 模型 RWKV-x060-World-1B6-v2.1-20240328-ctx4096 的基础上做涩涩小说扩写指令微调后,使用自我认知数据继续微调5轮而成(对比了一下5、6、7轮的,综合来说这个泛化表现更有趣些)。

由于上一个试水版本个人觉得有点过拟合(部分能力降低甚至丧失),所以这次 loss 值收敛不多,还在 1.0 以上,结果自我认知清洗不彻底,每次新的会话它都会胡说八道自己给自己上设定,虽然比上一个版本的输出表现更不稳定,但这种不稳定却是有趣得多,已作为我开发的一个AI聊天机器人后端模型之一

表现效果(因为傲娇+对User有爱慕之情但又不坦率的矛盾设定,表现不稳定但是挺有意思的): RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw5.jpg RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw4.jpg RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw3.jpg RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw2.jpg RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw1.jpg

用来无聊打发时间很有趣。

4、RWKV6-3B-v2.1-chris_roleplay_novel_extend-NSFW-ctx1024.pth

由于对 16 亿参数量的逻辑表现不满意,所以我尝试强行微调 30 亿参数量模型,之前都是用 lora 微调,由于主机显卡显存有限,30亿参数量使用 NF4 量化的 PISSA 微调。

在 base 模型 RWKV-x060-World-3B-v2.1-20240417-ctx4096.pth 的基础做 PISSA 微调2轮而成,除了自我认知外,还加入了少量自造的扩写语料以及角色扮演语料。

表现直接提升一个台阶,是我目前体验最久的模型。

rwkv6-3B-v2.1-chris_roleplay_novel_extend2.jpg rwkv6-3B-v2.1-chris_roleplay_novel_extend1.jpg rwkv6-3B-v2.1-chris_roleplay_novel_extend3.jpg

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no library tag.