Zhi-Yi Chin's picture

25 1

Zhi-Yi Chin

joycenerd

·

https://joycenerd.github.io/

AI & ML interests

Trustworthy AI, Generative Model, Self-supervised Learning

Organizations

joycenerd's activity

upvoted a paper about 1 month ago

Interpreting and Editing Vision-Language Representations to Mitigate Hallucinations

Paper • 2410.02762 • Published Oct 3 • 9

upvoted 3 papers 3 months ago

Self-Taught Evaluators

Paper • 2408.02666 • Published Aug 5 • 26

MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models

Paper • 2408.02718 • Published Aug 5 • 60

MM-Vet v2: A Challenging Benchmark to Evaluate Large Multimodal Models for Integrated Capabilities

Paper • 2408.00765 • Published Aug 1 • 12

upvoted 2 papers 4 months ago

Self-Recognition in Language Models

Paper • 2407.06946 • Published Jul 9 • 24

A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses

Paper • 2407.02551 • Published Jul 2 • 7

upvoted a collection 5 months ago

P4D Red-teamer

Resources for ICML 2024 paper "Prompting4Debugging: Red-Teaming Text-to-Image Diffusion Models by Finding Problematic Prompts" • 2 items • Updated Aug 27 • 2

upvoted 3 papers 5 months ago

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

Paper • 2405.20204 • Published May 30 • 32

EasyAnimate: A High-Performance Long Video Generation Method based on Transformer Architecture

Paper • 2405.18991 • Published May 29 • 12

T2V-Turbo: Breaking the Quality Bottleneck of Video Consistency Model with Mixed Reward Feedback

Paper • 2405.18750 • Published May 29 • 20

upvoted 2 papers 6 months ago

FIFO-Diffusion: Generating Infinite Videos from Text without Training

Paper • 2405.11473 • Published May 19 • 53

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published May 2 • 116

upvoted 5 papers 7 months ago

Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings

Paper • 2404.16820 • Published Apr 25 • 15

MoDE: CLIP Data Experts via Clustering

Paper • 2404.16030 • Published Apr 24 • 12

A Multimodal Automated Interpretability Agent

Paper • 2404.14394 • Published Apr 22 • 20

Measuring Style Similarity in Diffusion Models

Paper • 2404.01292 • Published Apr 1 • 16

TextCraftor: Your Text Encoder Can be Image Quality Controller

Paper • 2403.18978 • Published Mar 27 • 13

upvoted 3 papers 8 months ago

Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression

Paper • 2403.15447 • Published Mar 18 • 16

Be Yourself: Bounded Attention for Multi-Subject Text-to-Image Generation

Paper • 2403.16990 • Published Mar 25 • 25

VidLA: Video-Language Alignment at Scale

Paper • 2403.14870 • Published Mar 21 • 12