rleak.com - Spot the Future of AI Research

#1

T2I-Adapter: Learning Adapters to Dig Out More Controllable Ability for Text-to-Image Diffusion

Chong Mou, Xintao Wang, Liangbin Xie et al.

AAAI 2024

1,460

citations

#2

Graph of Thoughts: Solving Elaborate Problems with Large Language Models

Maciej Besta, Nils Blach, Ales Kubicek et al.

AAAI 2024

1,116

citations

#3

Benchmarking Large Language Models in Retrieval-Augmented Generation

Jiawei Chen, Hongyu Lin, Xianpei Han et al.

AAAI 2024

475

citations

#4

ExpeL: LLM Agents Are Experiential Learners

Andrew Zhao, Daniel Huang, Quentin Xu et al.

AAAI 2024

376

citations

#5

Preference Ranking Optimization for Human Alignment

Feifan Song, Bowen Yu, Minghao Li et al.

AAAI 2024

337

citations

#6

MemoryBank: Enhancing Large Language Models with Long-Term Memory

Wanjun Zhong, Lianghong Guo, Qiqi Gao et al.

AAAI 2024

290

citations

#7

Follow Your Pose: Pose-Guided Text-to-Video Generation Using Pose-Free Videos

Yue Ma, Yingqing HE, Xiaodong Cun et al.

AAAI 2024

284

citations

#8

NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large Language Models

Gengze Zhou, Yicong Hong, Qi Wu

AAAI 2024

283

citations

#9

MedSegDiff-V2: Diffusion-based Medical Image Segmentation with Transformer

Junde Wu, Wei Ji, Huazhu Fu et al.

AAAI 2024

274

citations

#10

NuScenes-QA: A Multi-Modal Visual Question Answering Benchmark for Autonomous Driving

Tianwen Qian, Jingjing Chen, Linhai Zhuo et al.

AAAI 2024

271

citations

#11

Detecting and Preventing Hallucinations in Large Vision Language Models

Anisha Gunjal, Jihan Yin, Erhan Bas

AAAI 2024

264

citations

#12

AnomalyGPT: Detecting Industrial Anomalies Using Large Vision-Language Models

Zhaopeng Gu, Bingke Zhu, Guibo Zhu et al.

AAAI 2024

252

citations

#13

Knowledge Graph Prompting for Multi-Document Question Answering

Yu Wang, Nedim Lipka, Ryan A. Rossi et al.

AAAI 2024

240

citations

#14

Omni-Kernel Network for Image Restoration

Yuning Cui, Wenqi Ren, Alois Knoll

AAAI 2024

235

citations

#15

Zhongjing: Enhancing the Chinese Medical Capabilities of Large Language Model through Expert Feedback and Real-World Multi-Turn Dialogue

Songhua Yang, Hanjie Zhao, Senbin Zhu et al.

AAAI 2024

210

citations

#16

BLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual Questions

Wenbo Hu, Yifan Xu, Yi Li et al.

AAAI 2024

192

citations

#17

ODTrack: Online Dense Temporal Token Learning for Visual Tracking

Yaozong Zheng, Bineng Zhong, Qihua Liang et al.

AAAI 2024

188

citations

#18

PMET: Precise Model Editing in a Transformer

Xiaopeng Li, Shasha Li, Shezheng Song et al.

AAAI 2024

187

citations

#19

MSGNet: Learning Multi-Scale Inter-series Correlations for Multivariate Time Series Forecasting

Wanlin Cai, Yuxuan Liang, Xianggen Liu et al.

AAAI 2024

185

citations

#20

Generalized Planning in PDDL Domains with Pretrained Large Language Models

Tom Silver, Soham Dan, Kavitha Srinivas et al.

AAAI 2024

178

citations

AAAI

Top Papers in AAAI 2024

T2I-Adapter: Learning Adapters to Dig Out More Controllable Ability for Text-to-Image Diffusion

Graph of Thoughts: Solving Elaborate Problems with Large Language Models

Benchmarking Large Language Models in Retrieval-Augmented Generation

ExpeL: LLM Agents Are Experiential Learners

Preference Ranking Optimization for Human Alignment

MemoryBank: Enhancing Large Language Models with Long-Term Memory

Follow Your Pose: Pose-Guided Text-to-Video Generation Using Pose-Free Videos

NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large Language Models

MedSegDiff-V2: Diffusion-based Medical Image Segmentation with Transformer

NuScenes-QA: A Multi-Modal Visual Question Answering Benchmark for Autonomous Driving

Detecting and Preventing Hallucinations in Large Vision Language Models

AnomalyGPT: Detecting Industrial Anomalies Using Large Vision-Language Models

Knowledge Graph Prompting for Multi-Document Question Answering

Omni-Kernel Network for Image Restoration

Zhongjing: Enhancing the Chinese Medical Capabilities of Large Language Model through Expert Feedback and Real-World Multi-Turn Dialogue

BLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual Questions

ODTrack: Online Dense Temporal Token Learning for Visual Tracking

PMET: Precise Model Editing in a Transformer

MSGNet: Learning Multi-Scale Inter-series Correlations for Multivariate Time Series Forecasting

Generalized Planning in PDDL Domains with Pretrained Large Language Models