Hyemin Lee

hmlee

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Kanana: Compute-efficient Bilingual Language Models

liked a model 2 days ago

perplexity-ai/r1-1776

upvoted a paper 11 days ago

Large Language Diffusion Models

View all activity

Organizations

None yet

hmlee's activity

upvoted a paper 1 day ago

Kanana: Compute-efficient Bilingual Language Models

Paper • 2502.18934 • Published 3 days ago • 50

upvoted a paper 11 days ago

Large Language Diffusion Models

Paper • 2502.09992 • Published 15 days ago • 95

upvoted a paper 15 days ago

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published 16 days ago • 142

upvoted a paper about 2 months ago

Accelerating LLM Inference with Staged Speculative Decoding

Paper • 2308.04623 • Published Aug 8, 2023 • 25

upvoted a paper 4 months ago

AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions

Paper • 2410.20424 • Published Oct 27, 2024 • 40

upvoted 4 papers 5 months ago

PrefixQuant: Static Quantization Beats Dynamic through Prefixed Outliers in LLMs

Paper • 2410.05265 • Published Oct 7, 2024 • 30

TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices

Paper • 2410.00531 • Published Oct 1, 2024 • 31

VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models

Paper • 2409.17066 • Published Sep 25, 2024 • 28

MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models

Paper • 2409.17481 • Published Sep 26, 2024 • 47

upvoted a paper 6 months ago

LLM Pruning and Distillation in Practice: The Minitron Approach

Paper • 2408.11796 • Published Aug 21, 2024 • 58

upvoted a paper 7 months ago

Tuning LayerNorm in Attention: Towards Efficient Multi-Modal LLM Finetuning

Paper • 2312.11420 • Published Dec 18, 2023 • 2

upvoted 2 papers 8 months ago

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 161

DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation

Paper • 2406.16855 • Published Jun 24, 2024 • 55

upvoted an article 9 months ago

Article

Overview of natively supported quantization schemes in 🤗 Transformers

Sep 12, 2023

• 12

upvoted 2 papers 9 months ago

Reducing Transformer Key-Value Cache Size with Cross-Layer Attention

Paper • 2405.12981 • Published May 21, 2024 • 32

Your Transformer is Secretly Linear

Paper • 2405.12250 • Published May 19, 2024 • 153

upvoted a paper 10 months ago

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published May 2, 2024 • 121

upvoted 3 papers about 1 year ago

DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model

Paper • 2402.17412 • Published Feb 27, 2024 • 23

Neural Network Diffusion

Paper • 2402.13144 • Published Feb 20, 2024 • 95

Scalable Diffusion Models with Transformers

Paper • 2212.09748 • Published Dec 19, 2022 • 18