Sergei Averkiev's picture

Sergei Averkiev

averoo

·

https://lingtra.in

averkij

AI & ML interests

None yet

Recent Activity

liked a model about 11 hours ago

tencent/HunyuanVideo

updated a model about 16 hours ago

averoo/flux-lora-tolstoy

updated a model about 16 hours ago

averoo/flux-lora-pushkin

View all activity

Organizations

averoo's activity

upvoted 3 papers 16 days ago

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published 19 days ago • 61

MMFactory: A Universal Solution Search Engine for Vision-Language Tasks

Paper • 2412.18072 • Published 19 days ago • 16

Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation

Paper • 2412.18176 • Published 19 days ago • 15

upvoted 3 papers 19 days ago

Deliberation in Latent Space via Differentiable Cache Augmentation

Paper • 2412.17747 • Published 19 days ago • 29

Fietje: An open, efficient LLM for Dutch

Paper • 2412.15450 • Published 23 days ago • 4

Multi-LLM Text Summarization

Paper • 2412.15487 • Published 23 days ago • 5

upvoted 3 papers 20 days ago

Parallelized Autoregressive Visual Generation

Paper • 2412.15119 • Published 23 days ago • 50

SCOPE: Optimizing Key-Value Cache Compression in Long-context Generation

Paper • 2412.13649 • Published 25 days ago • 20

Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Paper • 2412.15322 • Published 23 days ago • 18

upvoted 2 papers 23 days ago

AniDoc: Animation Creation Made Easier

Paper • 2412.14173 • Published 24 days ago • 49

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

Paper • 2412.14161 • Published 24 days ago • 49

upvoted a paper 30 days ago

AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials

Paper • 2412.09605 • Published about 1 month ago • 27

upvoted 8 papers about 1 month ago

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

Paper • 2412.04862 • Published Dec 6, 2024 • 50

CompCap: Improving Multimodal Large Language Models with Composite Captions

Paper • 2412.05243 • Published Dec 6, 2024 • 18

PanoDreamer: 3D Panorama Synthesis from a Single Image

Paper • 2412.04827 • Published Dec 6, 2024 • 10

Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

Paper • 2412.01819 • Published Dec 2, 2024 • 34

LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification

Paper • 2411.19638 • Published Nov 29, 2024 • 6

Video Depth without Video Models

Paper • 2411.19189 • Published Nov 28, 2024 • 33

On Domain-Specific Post-Training for Multimodal Large Language Models

Paper • 2411.19930 • Published Nov 29, 2024 • 25

Puzzle: Distillation-Based NAS for Inference-Optimized LLMs

Paper • 2411.19146 • Published Nov 28, 2024 • 14