Francesco Croce

papers

2,052

total citations

papers (11)

Revisiting Adversarial Training for ImageNet: Architectures, Training and Generalization across Threat Models

NEURIPS 2023arXiv

citations

Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models

ICML 2024arXiv

citations

Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning

ICML 2024arXiv

citations

OS-Harm: A Benchmark for Measuring Safety of Computer Use Agents

NEURIPS 2025arXiv

citations

Is In-Context Learning Sufficient for Instruction Following in LLMs?

ICLR 2025arXiv

citations

Seasoning Model Soups for Robustness to Adversarial and Natural Distribution Shifts

CVPR 2023arXiv

citations

Towards Reliable Evaluation and Fast Training of Robust Semantic Segmentation Models

ECCV 2024arXiv

citations

Selective induction Heads: How Transformers Select Causal Structures in Context

ICLR 2025arXiv

citations

Francesco Croce

papers (11)

Square Attack: a query-efficient black-box adversarial attack via random search

Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks

Diffusion Visual Counterfactual Explanations

Revisiting Adversarial Training for ImageNet: Architectures, Training and Generalization across Threat Models

Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models

Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning

OS-Harm: A Benchmark for Measuring Safety of Computer Use Agents

Is In-Context Learning Sufficient for Instruction Following in LLMs?

Seasoning Model Soups for Robustness to Adversarial and Natural Distribution Shifts

Towards Reliable Evaluation and Fast Training of Robust Semantic Segmentation Models

Selective induction Heads: How Transformers Select Causal Structures in Context

papers (11)

Square Attack: a query-efficient black-box adversarial attack via random search

Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks

Diffusion Visual Counterfactual Explanations

Revisiting Adversarial Training for ImageNet: Architectures, Training and Generalization across Threat Models

Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models

Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning

OS-Harm: A Benchmark for Measuring Safety of Computer Use Agents

Is In-Context Learning Sufficient for Instruction Following in LLMs?

Seasoning Model Soups for Robustness to Adversarial and Natural Distribution Shifts

Towards Reliable Evaluation and Fast Training of Robust Semantic Segmentation Models

Selective induction Heads: How Transformers Select Causal Structures in Context