darkz baron's picture

darkz baron

darkzbaron

·

AI & ML interests

nlp and cv and ai

Recent Activity

liked a Space about 1 hour ago

microsoft/phi-4-multimodal

liked a Space about 1 hour ago

merve/pix2struct

liked a Space about 3 hours ago

google/paligemma2-10b-mix

View all activity

Organizations

None yet

darkzbaron's activity

upvoted a paper 18 days ago

Soundwave: Less is More for Speech-Text Alignment in LLMs

Paper • 2502.12900 • Published 19 days ago • 76

upvoted a paper about 1 month ago

OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

Paper • 2502.01061 • Published Feb 3 • 186

upvoted a collection about 1 month ago

Talking - Avatar

4 items • Updated Jun 22, 2024 • 4

upvoted a paper about 2 months ago

MangaNinja: Line Art Colorization with Precise Reference Following

Paper • 2501.08332 • Published Jan 14 • 57

upvoted a collection 2 months ago

Spaces for Image-to-Image / Video

424 items • Updated about 8 hours ago • 21

upvoted a collection 5 months ago

Spaces for Audio / Voices

493 items • Updated about 10 hours ago • 20

upvoted an article 5 months ago

Article

Clarity AI Upscaler Reproduction

By

and 4 others •

Jul 30, 2024

• 21

upvoted a paper 5 months ago

SpreadsheetLLM: Encoding Spreadsheets for Large Language Models

Paper • 2407.09025 • Published Jul 12, 2024 • 135

upvoted a collection 5 months ago

Resources for Sound Processing

667 items • Updated about 23 hours ago • 9

upvoted a collection 6 months ago

Audio Denoiser

6 items • Updated Mar 10, 2024 • 1

upvoted a paper 6 months ago

Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency

Paper • 2409.02634 • Published Sep 4, 2024 • 94

upvoted a collection 7 months ago

Minitron

A family of compressed models obtained via pruning and knowledge distillation • 12 items • Updated Jan 17 • 60

upvoted a collection 8 months ago

3D generation

15 items • Updated Jan 21, 2024 • 2

upvoted a paper 9 months ago

Evaluating RAG-Fusion with RAGElo: an Automated Elo-based Framework

Paper • 2406.14783 • Published Jun 20, 2024 • 17

upvoted 2 papers 10 months ago

LightIt: Illumination Modeling and Control for Diffusion Models

Paper • 2403.10615 • Published Mar 15, 2024 • 17

Bio-Inspired Night Image Enhancement Based on Contrast Enhancement and Denoising

Paper • 2307.05447 • Published Jul 11, 2023 • 2

upvoted a paper 12 months ago

VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis

Paper • 2403.08764 • Published Mar 13, 2024 • 36