gaoxin's picture

17 11

gaoxin

GX-XinGao

·

AI & ML interests

None yet

Recent Activity

liked a dataset 2 days ago

OpenDataArena/MathLake

upvoted a paper 24 days ago

GGBench: A Geometric Generative Reasoning Benchmark for Unified Multimodal Models

upvoted a paper 5 months ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

View all activity

Organizations

upvoted a paper 24 days ago

GGBench: A Geometric Generative Reasoning Benchmark for Unified Multimodal Models

Paper • 2511.11134 • Published 27 days ago • 31

upvoted 2 papers 5 months ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published Jul 23 • 36

REST: Stress Testing Large Reasoning Models by Asking Multiple Problems at Once

Paper • 2507.10541 • Published Jul 14 • 29

upvoted an article 7 months ago

Article

Cosmopedia: how to create large-scale synthetic data for pre-training Large Language Models

+1

Mar 20, 2024

•

106

upvoted a paper 7 months ago

Beyond One-Size-Fits-All: Inversion Learning for Highly Effective NLG Evaluation Prompts

Paper • 2504.21117 • Published Apr 29 • 26

upvoted 3 papers 8 months ago

CipherBank: Exploring the Boundary of LLM Reasoning Capabilities through Cryptography Challenges

Paper • 2504.19093 • Published Apr 27 • 18

A Strategic Coordination Framework of Small LLMs Matches Large LLMs in Data Synthesis

Paper • 2504.12322 • Published Apr 11 • 28

FUSION: Fully Integration of Vision-Language Representations for Deep Cross-Modal Understanding

Paper • 2504.09925 • Published Apr 14 • 38

upvoted 2 papers 9 months ago

MathFusion: Enhancing Mathematic Problem-solving of LLM through Instruction Fusion

Paper • 2503.16212 • Published Mar 20 • 25

MetaLadder: Ascending Mathematical Solution Quality via Analogical-Problem Reasoning Transfer

Paper • 2503.14891 • Published Mar 19 • 22

upvoted 3 papers about 1 year ago

DocLayout-YOLO: Enhancing Document Layout Analysis through Diverse Synthetic Data and Global-to-Local Adaptive Perception

Paper • 2410.12628 • Published Oct 16, 2024 • 41

Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining

Paper • 2410.08102 • Published Oct 10, 2024 • 21

LOKI: A Comprehensive Synthetic Data Detection Benchmark using Large Multimodal Models

Paper • 2410.09732 • Published Oct 13, 2024 • 54

upvoted 4 papers over 1 year ago

UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios

Paper • 2408.17267 • Published Aug 30, 2024 • 23

CDM: A Reliable Metric for Fair and Accurate Formula Recognition Evaluation

Paper • 2409.03643 • Published Sep 5, 2024 • 19

Controllable Text Generation for Large Language Models: A Survey

Paper • 2408.12599 • Published Aug 22, 2024 • 65

TrackGo: A Flexible and Efficient Method for Controllable Video Generation

Paper • 2408.11475 • Published Aug 21, 2024 • 18