Publications

A complete and continuously updated list is also available on Google Scholar and Semantic Scholar. For the canonical record, see my CV.

* denotes equal contribution.

Yiqiao Jin, Kartik Sharma, Vineeth Rakesh, Yingtong Dou, Menghai Pan, Mahashweta Das, Srijan Kumar (2026). SARA: Selective and Adaptive Retrieval-augmented Generation with Context Compression. ACL'26.

PDF Cite

Mohit Chandra, Siddharth Sriraman, Harneet Singh Khanuja, Yiqiao Jin, Munmun De Choudhury (2026). Reasoning Is Not All You Need: Examining LLMs for Multi-Turn Mental Health Conversations. ACL'26.

PDF

Hanoz Bhathena, Parin Rajesh Jhaveri, Rohan Mittal, Prateek Singh, Aymen Kallala, Rachneet Kaur, Yiqiao Jin, Zhen Zeng, Adwait Ratnaparkhi, Denis Kochedykov (2026). MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A. ACL'26 Industry.

Yiyang Wang, Yiqiao Jin, Alex Cabral, Josiah Hester (2026). MASCOT: Towards Multi-Agent Socio-Collaborative Companion Systems. ACL'26 TrustNLP Workshop.

PDF Source Document

Vibhor Agarwal, Yiqiao Jin, Mohit Chandra, Munmun De Choudhury, Srijan Kumar, Nishanth Sastry (2026). MedHalu: Hallucinations in Responses to Healthcare Queries by Large Language Models. ICWSM'26.

PDF

Yiqiao Jin, Yiyang Wang, Lucheng Fu, Yijia Xiao, Yinyi Luo, Haoxin Liu, B. Aditya Prakash, Josiah Hester, Jindong Wang, Srijan Kumar (2026). UniSD: Towards a Unified Self-Distillation Framework for Large Language Models. Preprint.

PDF

Lucheng Fu, Ye Yu, Yiyang Wang, Yiqiao Jin, Haibo Jin, B. Aditya Prakash, Haohan Wang (2026). TextReg: Mitigating Prompt Distributional Overfitting via Regularized Text-Space Optimization. Preprint.

PDF

Kartik Sharma, Yiqiao Jin, Vineeth Rakesh, Yingtong Dou, Menghai Pan, Mahashweta Das, Srijan Kumar (2026). Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts. ICLR'26.

PDF Cite

Guancheng Wan, Lucheng Fu, Haoxin Liu, Yiqiao Jin, Hejia Geng, Eric Hanchen Jiang, Hui Yi Leong, Jinhe Bi, Yunpu Ma, Xiangru Tang, B. Aditya Prakash, Yizhou Sun, Wei Wang (2026). Beyond Magic Words: Sharpness-Aware Prompt Evolving for Robust Large Language Models. ICLR'26.

PDF

Yinyi Luo, Yiqiao Jin, Weichen Yu, Mengqi Zhang, Srijan Kumar, Xiaoxiao Li, Weijie Xu, Xin Chen, Jindong Wang (2026). AgentArk: Distilling Multi-Agent Intelligence into a Single LLM Agent. Preprint.

PDF

Zhaolong Su, Yinyi Luo, Yiqiao Jin, Mengqi Zhang, Wenyue Hua, Srijan Kumar, Qingsong Wen, Jindong Wang (2026). Consistency Should Be the Priority for Unified Multimodal Models. Preprint.

PDF

Kartik Sharma, Yiqiao Jin, Rakshit Trivedi, Srijan Kumar (2026). Efficient Knowledge Probing of Large Language Models by Adapting Pre-trained Embeddings. Preprint.

PDF

Yiqiao Jin, Rachneet Kaur, Zhen Zeng, Sumitra Ganesh, Srijan Kumar (2025). SlideAgent: Hierarchical Agentic Framework for Multi-Page Visual Document Understanding. ACL'26.

PDF Cite Project Poster

Yijia Xiao, Wanjia Zhao, Junkai Zhang, Yiqiao Jin, Han Zhang, Zhicheng Ren, Renliang Sun, Haixin Wang, Guancheng Wan, Pan Lu, Xiao Luo, Yu Zhang, James Zou, Yizhou Sun, Wei Wang (2025). Protein Large Language Models: A Comprehensive Survey. EMNLP'25.

PDF

Yiqiao Jin, Andrew Zhao, Yeon-Chang Lee, Meng Ye, Ajay Divakaran, Srijan Kumar (2025). Empowering Interdisciplinary Insights with Dynamic Graph Embedding Trajectories. KDD'25 TGL Workshop.

PDF Source Document

Chengyuan Deng, Yiqun Duan, Xin Jin, Heng Chang, Yijun Tian, Han Liu, Henry Peng Zou, Yiqiao Jin, Yijia Xiao, Yichen Wang, Shenghao Wu, Zongxing Xie, Kuofeng Gao, Sihong He, Jun Zhuang, Lu Cheng, Haohan Wang (2025). Deconstructing The Ethics of Large Language Models from Long-standing Issues to New-emerging Dilemmas. AI and Ethics.

PDF

Junyu Luo, Bohan Wu, Xiao Luo, Zhiping Xiao, Yiqiao Jin, Rong-Cheng Tu, Nan Yin, Yifan Wang, Jingyang Yuan, Wei Ju, Ming Zhang (2025). A Survey on Efficient LLM Training: From Data-centric Perspectives. ACL'25.

PDF

Yijia Xiao, Edward Sun, Yiqiao Jin, Qifan Wang, Wei Wang (2025). ProteinGPT: Multimodal LLM for Protein Property Prediction and Structure Understanding. ICML'25 FM4LS Workshop.

PDF

Jiaxi Yang, Mengqi Zhang, Yiqiao Jin, Hao Chen, Qingsong Wen, Lu Lin, Yi He, Srijan Kumar, Weijie Xu, James Evans, Jindong Wang (2025). Topological Structure Learning Should Be A Research Priority for LLM-Based Multi-Agent Systems. Preprint.

PDF Cite

Shudong Liu, Yiqiao Jin, Cheng Li, Derek F. Wong, Qingsong Wen, Lichao Sun, Haipeng Chen, Xing Xie, Jindong Wang (2025). CultureVLM: Characterizing and Improving Cultural Understanding of Vision-Language Models for over 100 Countries. CVPR'25 VLMs4All Workshop.

PDF Cite

Yiqiao Jin, Gang Wu, Yu Shen, Stefano Petrangeli (2025). ScreenLLM: Stateful Screen Schema for Efficient Action Understanding and Prediction. WebConf'25 MM4SG.

PDF DOI

Sejoon Oh, Yiqiao Jin, Megha Sharma, Donghyun Kim, Gaurav Verma, Eric Ma, Srijan Kumar (2025). UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models. AAAI'25 DAI Workshop.

PDF

Yiqiao Jin, Yijia Xiao, Yiyang Wang, Jindong Wang (2025). SciEvo: A 2 Million, 30-Year Cross-disciplinary Dataset for Temporal Scientometric Analysis. Good Data AAAI 2025.

PDF Cite Code Dataset Project Source Document

Yijia Xiao, Edward Sun, Yiqiao Jin, Wei Wang (2024). RNA-GPT: Multimodal Generative System for RNA Sequence Understanding. NeurIPS'24 MLSB Workshop.

PDF

Yijia Xiao, Yiqiao Jin, Yushi Bai, Yue Wu, Xianjun Yang, Xiao Luo, Wenchao Yu, Xujiang Zhao, Yanchi Liu, Haifeng Chen, Wei Wang, Wei Cheng (2024). PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners. EMNLP'24.

PDF

Yiqiao Jin, Qinlin Zhao, Yiyang Wang, Hao Chen, Kaijie Zhu, Yijia Xiao, Jindong Wang (2024). AgentReview: Exploring Peer Review Dynamics with LLM Agents. EMNLP'24.

PDF Cite Code Dataset Source Document

Neng Kai Nigel Neo, Yeon-Chang Lee, Yiqiao Jin, Sang-Wook Kim, Srijan Kumar (2024). Towards Fair Graph Anomaly Detection: Problem, Benchmark Datasets, and Evaluation. CIKM'24.

PDF Cite Code Dataset Project DOI

Qinlin Zhao, Jindong Wang, Yixuan Zhang, Yiqiao Jin, Kaijie Zhu, Hao Chen, Xing Xie (2024). CompeteAI: Understanding the Competition Behaviors in Large Language Model-based Agents. ICML'24.

PDF Cite Code Dataset Project Slides

Jinghan Zhang, Xiting Wang, Yiqiao Jin, Changyu Chen, Xinhao Zhang, Kunpeng Liu (2024). Prototypical Reward Network for Data-Efficient RLHF. ACL'24.

PDF Cite

Yiqiao Jin, Minje Choi, Gaurav Verma, Jindong Wang, Srijan Kumar (2024). MM-SOC: Benchmarking Multimodal Large Language Models in Social Media Platforms. ACL'24.

PDF Cite DOI

Yiqiao Jin, Mohit Chandra, Gaurav Verma, Yibo Hu, Munmun De Choudhury, Srijan Kumar (2024). Better to Ask in English: Cross-Lingual Evaluation of Large Language Models for Healthcare Queries. WWW'24.

PDF Cite DOI

Changyu Chen, Xiting Wang, Yiqiao Jin, Victor Ye Dong, Li Dong, Jie Cao, Yi Liu, Rui Yan (2023). Semi-Offline Reinforcement Learning for Optimized Text Generation. ICML'23.

PDF Cite Code Project DOI

Yiqiao Jin, Yunsheng Bai, Yanqiao Zhu, Yizhou Sun, Wei Wang (2023). Code Recommendation for Open Source Project Developers. WWW'23.

PDF DOI

Yiqiao Jin, Xiting Wang, Yaru Hao, Yizhou Sun, Xing Xie (2023). Prototypical Fine-Tuning: Towards Robust Performance under Varying Data Sizes. AAAI'23.

PDF Cite Project

Yiqiao Jin, Yeon-Chang Lee, Kartik Sharma, Meng Ye, Karan Sikka, Ajay Divakaran, Srijan Kumar (2023). Predicting Information Pathways Across Online Communities. KDD'23.

PDF Cite

Ruichao Yang, Xiting Wang, Yiqiao Jin, Chaozhuo Li, Jianxun Lian, Xing Xie (2022). Reinforcement Subgraph Reasoning for Fake News Detection. KDD'22.

PDF Cite DOI

Yiqiao Jin, Xiting Wang, Ruichao Yang, Yizhou Sun, Wei Wang, Hao Liao, Xing Xie (2022). Towards Fine-Grained Reasoning for Fake News Detection. AAAI'22.

PDF Cite Code Project DOI