Zhihe Yang's picture

2 4

Zhihe Yang

zhyang2226

·

AI & ML interests

Trustworthy RL & Offline RL

Recent Activity

upvoted a paper 3 days ago

Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key

liked a Space 6 days ago

huggingface/ai-deadlines

liked a dataset 18 days ago

openbmb/RLAIF-V-Dataset

View all activity

Organizations

zhyang2226's activity

upvoted a paper 3 days ago

Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key

Paper • 2501.09695 • Published Jan 16 • 1

liked a Space 6 days ago

AI Deadlines

Schedule tasks efficiently using AI-generated deadlines

liked a dataset 18 days ago

openbmb/RLAIF-V-Dataset

Viewer • Updated 6 days ago • 74.8k • 4.36k • 162

upvoted a paper 21 days ago

Region-Adaptive Sampling for Diffusion Transformers

Paper • 2502.10389 • Published 24 days ago • 52

liked a model about 1 month ago

lmms-lab/llava-onevision-qwen2-7b-ov

Text Generation • Updated Sep 2, 2024 • 109k • 46

updated a model about 2 months ago

zhyang2226/opadpo-lora_llava-v1.5-13b

published a model about 2 months ago

zhyang2226/opadpo-lora_llava-v1.5-13b

updated a model about 2 months ago

zhyang2226/opadpo-lora_llava-v1.5-7b

published a model about 2 months ago

zhyang2226/opadpo-lora_llava-v1.5-7b

liked a model 8 months ago

openbmb/RLHF-V

Text Generation • Updated May 28, 2024 • 66 • 15