Dev Khant's picture

20 3

Dev Khant

DK46

·

AI & ML interests

None yet

Organizations

None yet

DK46's activity

upvoted a paper 4 months ago

Human-like Episodic Memory for Infinite Context LLMs

Paper • 2407.09450 • Published Jul 12 • 60

upvoted 5 papers 7 months ago

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 251

TransformerFAM: Feedback attention is working memory

Paper • 2404.09173 • Published Apr 14 • 43

Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length

Paper • 2404.08801 • Published Apr 12 • 63

Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

Paper • 2404.07143 • Published Apr 10 • 103

Octopus v2: On-device language model for super agent

Paper • 2404.01744 • Published Apr 2 • 57

upvoted 5 papers 8 months ago

Can large language models explore in-context?

Paper • 2403.15371 • Published Mar 22 • 32

PERL: Parameter Efficient Reinforcement Learning from Human Feedback

Paper • 2403.10704 • Published Mar 15 • 57

MoAI: Mixture of All Intelligence for Large Language and Vision Models

Paper • 2403.07508 • Published Mar 12 • 75

Stealing Part of a Production Language Model

Paper • 2403.06634 • Published Mar 11 • 90

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27 • 602

upvoted 3 papers 9 months ago

Chain-of-Thought Reasoning Without Prompting

Paper • 2402.10200 • Published Feb 15 • 99

ChemLLM: A Chemical Large Language Model

Paper • 2402.06852 • Published Feb 10 • 26

More Agents Is All You Need

Paper • 2402.05120 • Published Feb 3 • 51

upvoted 4 papers 10 months ago

MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation

Paper • 2401.04468 • Published Jan 9 • 47

Understanding LLMs: A Comprehensive Overview from Training to Inference

Paper • 2401.02038 • Published Jan 4 • 61

A Vision Check-up for Language Models

Paper • 2401.01862 • Published Jan 3 • 9

DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 181

upvoted a paper 11 months ago

VCoder: Versatile Vision Encoders for Multimodal Large Language Models

Paper • 2312.14233 • Published Dec 21, 2023 • 15

upvoted a paper about 1 year ago

TableGPT: Towards Unifying Tables, Nature Language and Commands into One GPT

Paper • 2307.08674 • Published Jul 17, 2023 • 48