Image-to-Text - a Benjy Collection

Benjy 's Collections

Multi-Recognition

Agentic

Speech Recognition

OCR

Leading Research

Image-to-Text

updated Dec 24, 2024

microsoft/OmniParser

Image-Text-to-Text • Updated Dec 2, 2024 • 339 • 1.7k
Qwen/Qwen2-VL-72B

Image-Text-to-Text • 73B • Updated Dec 6, 2024 • 113 • 80
Qwen/Qwen2-VL-72B-Instruct

Image-Text-to-Text • 73B • Updated Feb 6, 2025 • 19.4k • • 308
Qwen/QVQ-72B-Preview

Image-Text-to-Text • 73B • Updated Jan 12, 2025 • 234 • 609