:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Jiang, Houcheng, Fang, Junfeng, Wu, Jiaxin, Zhang, Tianyu, Gao, Chen, Li, Yong, Wang, Xiang, He, Xiangnan, Deng, Yang
Format:	Preprint
Published:	2025
Subjects:	Computation and Language Artificial Intelligence
Online Access:	https://arxiv.org/abs/2510.07884
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models
by: Fang, Junfeng, et al.
Published: (2024)

UniVLR: Unifying Text and Vision in Visual Latent Reasoning for Multimodal LLMs
by: Jiang, Houcheng, et al.
Published: (2026)

SOD: Step-wise On-policy Distillation for Small Language Model Agents
by: Zhong, Qiyong, et al.
Published: (2026)

NExT-Guard: Training-Free Streaming Safeguard without Token-Level Labels
by: Fang, Junfeng, et al.
Published: (2026)

DualEdit: Mitigating Safety Fallback in LLM Backdoor Editing via Affirmation-Refusal Regulation
by: Jiang, Houcheng, et al.
Published: (2025)

AlphaDPO: Adaptive Reward Margin for Direct Preference Optimization
by: Wu, Junkang, et al.
Published: (2024)

Neuron-Level Sequential Editing for Large Language Models
by: Jiang, Houcheng, et al.
Published: (2024)

Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization
by: Wu, Junkang, et al.
Published: (2024)

AnyEdit: Edit Any Knowledge Encoded in Language Models
by: Jiang, Houcheng, et al.
Published: (2025)

bi-GRPO: Bidirectional Optimization for Jailbreak Backdoor Injection on LLMs
by: Ji, Wence, et al.
Published: (2025)

APCD: Adaptive Path-Contrastive Decoding for Reliable Large Language Model Generation
by: Zheng, Tianyu, et al.
Published: (2026)

Larger or Smaller Reward Margins to Select Preferences for Alignment?
by: Huang, Kexin, et al.
Published: (2025)

CPTuning: Contrastive Prompt Tuning for Generative Relation Extraction
by: Duan, Jiaxin, et al.
Published: (2025)

Knowledge Pyramid Construction for Multi-Level Retrieval-Augmented Generation
by: Chen, Rubing, et al.
Published: (2024)

Bilateral Personalized Dialogue Generation with Contrastive Learning
by: Li, Bin, et al.
Published: (2021)

Search and Refine During Think: Facilitating Knowledge Refinement for Improved Retrieval-Augmented Reasoning
by: Shi, Yaorui, et al.
Published: (2025)

SPUQ: Perturbation-Based Uncertainty Quantification for Large Language Models
by: Gao, Xiang, et al.
Published: (2024)

Customizing Language Model Responses with Contrastive In-Context Learning
by: Gao, Xiang, et al.
Published: (2024)

Dynamic Generation of Personalities with Large Language Models
by: Liu, Jianzhi, et al.
Published: (2024)

Less is More: Improving LLM Alignment via Preference Data Selection
by: Deng, Xun, et al.
Published: (2025)

Chart-HQA: A Benchmark for Hypothetical Question Answering in Charts
by: Chen, Xiangnan, et al.
Published: (2025)

Unveiling the Competitive Dynamics: A Comparative Evaluation of American and Chinese LLMs
by: Jiang, Zhenhui, et al.
Published: (2024)

Large Language Models are Learnable Planners for Long-Term Recommendation
by: Shi, Wentao, et al.
Published: (2024)

Contrastive Identification and Generation in the Limit
by: Li, Xiaoyu, et al.
Published: (2026)

Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization
by: Yang, Wenkai, et al.
Published: (2024)

Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors
by: Fang, Hao, et al.
Published: (2025)

AlpsBench: An LLM Personalization Benchmark for Real-Dialogue Memorization and Preference Alignment
by: Xiao, Jianfei, et al.
Published: (2026)

ViSP: A PPO-Driven Framework for Sarcasm Generation with Contrastive Learning
by: Wang, Changli, et al.
Published: (2025)

Contrastive Learning Subspace for Text Clustering
by: Yong, Qian, et al.
Published: (2024)

Tournament-GRPO: Group-Wise Tournament Rewards for Reinforcement Learning in Open-Ended Long-Form Generation
by: Yang, Zixuan, et al.
Published: (2026)

MACPO: Weak-to-Strong Alignment via Multi-Agent Contrastive Preference Optimization
by: Lyu, Yougang, et al.
Published: (2024)

Selective Weak-to-Strong Generalization
by: Lang, Hao, et al.
Published: (2025)

Well Begun is Half Done: Low-resource Preference Alignment by Weak-to-Strong Decoding
by: Song, Feifan, et al.
Published: (2025)

TNCSE: Tensor's Norm Constraints for Unsupervised Contrastive Learning of Sentence Embeddings
by: Zong, Tianyu, et al.
Published: (2025)

IceBreaker for Conversational Agents: Breaking the First-Message Barrier with Personalized Starters
by: Zheng, Hongwei, et al.
Published: (2026)

Generation-driven Contrastive Self-training for Zero-shot Text Classification with Instruction-following LLM
by: Zhang, Ruohong, et al.
Published: (2023)

GAPS: Geometry-Aware Problem Solver
by: Zhang, Jiaxin, et al.
Published: (2024)

StruEdit: Structured Outputs Enable the Fast and Accurate Knowledge Editing for Large Language Models
by: Bi, Baolong, et al.
Published: (2024)

ProMed: Shapley Information Gain Guided Reinforcement Learning for Proactive Medical LLMs
by: Ding, Hongxin, et al.
Published: (2025)

Debate Helps Weak-to-Strong Generalization
by: Lang, Hao, et al.
Published: (2025)