Xiongkuo Min

papers

948

total citations

papers (21)

AIGV-Assessor: Benchmarking and Evaluating the Perceptual Quality of Text-to-Video Generation with LMM

CVPR 2025arXiv

citations

Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content

CVPR 2025arXiv

citations

Video-based Human-Object Interaction Detection from Tubelet Tokens

NEURIPS 2022arXiv

citations

LMM4LMM: Benchmarking and Evaluating Large-multimodal Image Generation with LMMs

ICCV 2025arXiv

citations

Image Quality Assessment: From Human to Machine Preference

CVPR 2025arXiv

citations

Textured Mesh Saliency: Bridging Geometry and Texture for Human Perception in 3D Graphics

AAAI 2025arXiv

citations

Information Density Principle for MLLM Benchmarks

ICCV 2025arXiv

citations

Mesh Mamba: A Unified State Space Model for Saliency Prediction in Non-Textured and Textured Meshes

CVPR 2025arXiv

citations

Who is a Better Talker: Subjective and Objective Quality Assessment for AI-Generated Talking Heads

ICCV 2025arXiv

citations

FPEM: Face Prior Enhanced Facial Attractiveness Prediction for Live Videos with Face Retouching

ICCV 2025

citations

Learning Invisible Markers for Hidden Codes in Offline-to-Online Photography

CVPR 2022

citations

Xiongkuo Min

papers (21)

Q-Align: Teaching LMMs for Visual Scoring via Discrete Text-Defined Levels

Blurry Video Frame Interpolation

End-to-End Human-Gaze-Target Detection With Transformers

MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos

Perceptual Attacks of No-Reference Image Quality Models with Human-in-the-Loop

A-Bench: Are LMMs Masters at Evaluating AI-generated Images?

Self-Conditioned Probabilistic Learning of Video Rescaling

Iwin: Human-Object Interaction Detection via Transformer with Irregular Windows

Q-Bench-Video: Benchmark the Video Quality Understanding of LMMs

FineVQ: Fine-Grained User Generated Content Video Quality Assessment

AIGV-Assessor: Benchmarking and Evaluating the Perceptual Quality of Text-to-Video Generation with LMM

Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content

Video-based Human-Object Interaction Detection from Tubelet Tokens

LMM4LMM: Benchmarking and Evaluating Large-multimodal Image Generation with LMMs

Image Quality Assessment: From Human to Machine Preference

Textured Mesh Saliency: Bridging Geometry and Texture for Human Perception in 3D Graphics

Information Density Principle for MLLM Benchmarks

Mesh Mamba: A Unified State Space Model for Saliency Prediction in Non-Textured and Textured Meshes

Who is a Better Talker: Subjective and Objective Quality Assessment for AI-Generated Talking Heads

FPEM: Face Prior Enhanced Facial Attractiveness Prediction for Live Videos with Face Retouching

Learning Invisible Markers for Hidden Codes in Offline-to-Online Photography

papers (21)

Q-Align: Teaching LMMs for Visual Scoring via Discrete Text-Defined Levels

Blurry Video Frame Interpolation

End-to-End Human-Gaze-Target Detection With Transformers

MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos

Perceptual Attacks of No-Reference Image Quality Models with Human-in-the-Loop

A-Bench: Are LMMs Masters at Evaluating AI-generated Images?

Self-Conditioned Probabilistic Learning of Video Rescaling

Iwin: Human-Object Interaction Detection via Transformer with Irregular Windows

Q-Bench-Video: Benchmark the Video Quality Understanding of LMMs

FineVQ: Fine-Grained User Generated Content Video Quality Assessment

AIGV-Assessor: Benchmarking and Evaluating the Perceptual Quality of Text-to-Video Generation with LMM

Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content

Video-based Human-Object Interaction Detection from Tubelet Tokens

LMM4LMM: Benchmarking and Evaluating Large-multimodal Image Generation with LMMs

Image Quality Assessment: From Human to Machine Preference

Textured Mesh Saliency: Bridging Geometry and Texture for Human Perception in 3D Graphics

Information Density Principle for MLLM Benchmarks

Mesh Mamba: A Unified State Space Model for Saliency Prediction in Non-Textured and Textured Meshes

Who is a Better Talker: Subjective and Objective Quality Assessment for AI-Generated Talking Heads

FPEM: Face Prior Enhanced Facial Attractiveness Prediction for Live Videos with Face Retouching

Learning Invisible Markers for Hidden Codes in Offline-to-Online Photography