1 6

Hongyu Li

appletea2333

AI & ML interests

None yet

Recent Activity

upvoted a paper 19 days ago

OpenSubject: Leveraging Video-Derived Identity and Diversity Priors for Subject-driven Image Generation and Manipulation

authored a paper 22 days ago

OmniAlpha: A Sequence-to-Sequence Framework for Unified Multi-Task RGBA Generation

authored a paper 22 days ago

Architecture Decoupling Is Not All You Need For Unified Multimodal Model

View all activity

Organizations

None yet

upvoted a paper 19 days ago

OpenSubject: Leveraging Video-Derived Identity and Diversity Priors for Subject-driven Image Generation and Manipulation

Paper • 2512.08294 • Published 21 days ago • 17

authored 4 papers 22 days ago

OmniAlpha: A Sequence-to-Sequence Framework for Unified Multi-Task RGBA Generation

Paper • 2511.20211 • Published Nov 25 • 12

upvoted a paper 22 days ago

EditThinker: Unlocking Iterative Reasoning for Any Image Editor

Paper • 2512.05965 • Published 25 days ago • 38

commented a paper 22 days ago

EditThinker: Unlocking Iterative Reasoning for Any Image Editor

Paper • 2512.05965 • Published 25 days ago • 38 •

upvoted a paper 26 days ago

OneThinker: All-in-one Reasoning Model for Image and Video

Paper • 2512.03043 • Published 28 days ago • 32

upvoted a paper about 1 month ago

OmniAlpha: A Sequence-to-Sequence Framework for Unified Multi-Task RGBA Generation

Paper • 2511.20211 • Published Nov 25 • 12

authored 3 papers about 1 month ago

LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding

Paper • 2501.08282 • Published Jan 14

Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency

Paper • 2506.01908 • Published Jun 2

Thinking-while-Generating: Interleaving Textual Reasoning throughout Visual Generation

Paper • 2511.16671 • Published Nov 20 • 15

upvoted a paper about 1 month ago

Thinking-while-Generating: Interleaving Textual Reasoning throughout Visual Generation

Paper • 2511.16671 • Published Nov 20 • 15

upvoted a paper 3 months ago

Factuality Matters: When Image Generation and Editing Meet Structured Visuals

Paper • 2510.05091 • Published Oct 6 • 19

updated a collection 6 months ago

LLaVA-ST

Collection

1 item • Updated Jul 4

updated a model 6 months ago

appletea2333/LLaVA-ST-Qwen2-7B

8B • Updated Jul 4 • 88 • 1

updated a dataset 6 months ago

appletea2333/ST-Align-Dataset

Preview • Updated Jul 4 • 1.67k • 1

published a model 6 months ago

appletea2333/LLaVA-ST-Qwen2-7B

8B • Updated Jul 4 • 88 • 1

updated a dataset 6 months ago

appletea2333/ST-Align-Benchmark

Updated Jul 4 • 41 • 1

published a dataset 6 months ago

appletea2333/ST-Align-Benchmark

Updated Jul 4 • 41 • 1

Hongyu Li

AI & ML interests

Recent Activity

Organizations

appletea2333's activity