Oishi Deb's picture

2

Oishi Deb PRO

OishiDeb

·

AI & ML interests

None yet

Recent Activity

authored a paper about 1 month ago

Measuring what Matters: Construct Validity in Large Language Model Benchmarks

liked a dataset 5 months ago

unreasonablebenchmark/unreasonable-benchmark

liked a dataset 5 months ago

ambean/construct-validity-review

View all activity

Organizations

None yet

authored a paper about 1 month ago

Measuring what Matters: Construct Validity in Large Language Model Benchmarks

Paper • 2511.04703 • Published Nov 3 • 7