Hanna Hajishirzi

papers

888

total citations

papers (12)

Tulu 3: Pushing Frontiers in Open Language Model Post-Training

COLM 2025arXiv

494

citations

What's In My Big Data?

ICLR 2024arXiv

126

citations

One Question Answering Model for Many Languages with Cross-lingual Dense Passage Retrieval

NEURIPS 2021arXiv

citations

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

ICML 2025arXiv

citations

Generalizing Verifiable Instruction Following

NEURIPS 2025arXiv

citations

OMEGA: Can LLMs Reason Outside the Box in Math? Evaluating Exploratory, Compositional, and Transformative Generalization

NEURIPS 2025arXiv

citations

Critical Batch Size Revisited: A Simple Empirical Approach to Large-Batch Language Model Training

NEURIPS 2025arXiv

citations

Signal and Noise: A Framework for Reducing Uncertainty in Language Model Evaluation

NEURIPS 2025arXiv

citations

ParaPO: Aligning Language Models to Reduce Verbatim Reproduction of Pre-training Data

COLM 2025arXiv

citations

Hanna Hajishirzi

papers (12)

Tulu 3: Pushing Frontiers in Open Language Model Post-Training

What's In My Big Data?

One Question Answering Model for Many Languages with Cross-lingual Dense Passage Retrieval

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

Generalizing Verifiable Instruction Following

OMEGA: Can LLMs Reason Outside the Box in Math? Evaluating Exploratory, Compositional, and Transformative Generalization

Establishing Task Scaling Laws via Compute-Efficient Model Ladders

EvalTree: Profiling Language Model Weaknesses via Hierarchical Capability Trees

Fluid Language Model Benchmarking

Critical Batch Size Revisited: A Simple Empirical Approach to Large-Batch Language Model Training

Signal and Noise: A Framework for Reducing Uncertainty in Language Model Evaluation

ParaPO: Aligning Language Models to Reduce Verbatim Reproduction of Pre-training Data

papers (12)

Tulu 3: Pushing Frontiers in Open Language Model Post-Training

What's In My Big Data?

One Question Answering Model for Many Languages with Cross-lingual Dense Passage Retrieval

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

Generalizing Verifiable Instruction Following

OMEGA: Can LLMs Reason Outside the Box in Math? Evaluating Exploratory, Compositional, and Transformative Generalization

Establishing Task Scaling Laws via Compute-Efficient Model Ladders

EvalTree: Profiling Language Model Weaknesses via Hierarchical Capability Trees

Fluid Language Model Benchmarking

Critical Batch Size Revisited: A Simple Empirical Approach to Large-Batch Language Model Training

Signal and Noise: A Framework for Reducing Uncertainty in Language Model Evaluation

ParaPO: Aligning Language Models to Reduce Verbatim Reproduction of Pre-training Data