3 78 85

MoRezaGH

Moreza009

https://github.com/mohammad-gh009

AI & ML interests

None yet

Recent Activity

upvoted a paper about 24 hours ago

Large Language Diffusion Models

upvoted a collection 3 days ago

💻 Local SmolLMs

upvoted a collection 3 days ago

🪐 SmolLM

View all activity

Organizations

None yet

Moreza009's activity

upvoted a paper about 24 hours ago

Large Language Diffusion Models

Paper • 2502.09992 • Published 5 days ago • 65

upvoted 3 collections 3 days ago

upvoted 5 papers about 1 month ago

LUSIFER: Language Universal Space Integration for Enhanced Multilingual Embeddings with Large Language Models

Paper • 2501.00874 • Published Jan 1 • 13

Graph Generative Pre-trained Transformer

Paper • 2501.01073 • Published Jan 2 • 17

SDPO: Segment-Level Direct Preference Optimization for Social Agents

Paper • 2501.01821 • Published Jan 3 • 18

VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation

Paper • 2412.21059 • Published Dec 30, 2024 • 18

Virgo: A Preliminary Exploration on Reproducing o1-like MLLM

Paper • 2501.01904 • Published Jan 3 • 32

upvoted 9 papers about 2 months ago

ProgCo: Program Helps Self-Correction of Large Language Models

Paper • 2501.01264 • Published Jan 2 • 25

MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models

Paper • 2501.00316 • Published Dec 31, 2024 • 22

MLLM-as-a-Judge for Image Safety without Human Labeling

Paper • 2501.00192 • Published Dec 31, 2024 • 25

Unifying Specialized Visual Encoders for Video Language Models

Paper • 2501.01426 • Published Jan 2 • 21

LTX-Video: Realtime Video Latent Diffusion

Paper • 2501.00103 • Published Dec 30, 2024 • 42

SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration

Paper • 2501.01320 • Published Jan 2 • 11

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

Paper • 2501.01427 • Published Jan 2 • 50

VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM

Paper • 2501.00599 • Published Dec 31, 2024 • 41

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published Jan 1 • 99

upvoted a collection about 2 months ago

Reasoning Datasets

Collection

Reasoning datasets that are trending 🔥 • 10 items • Updated Jan 3 • 24

upvoted a paper about 2 months ago

Slow Perception: Let's Perceive Geometric Figures Step-by-step

Paper • 2412.20631 • Published Dec 30, 2024 • 15