:: Library Catalog

Buchumschlag

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Xin, Yuan, Li, Zheng, Yu, Ning, Chen, Dingfan, Fritz, Mario, Backes, Michael, Zhang, Yang
Format:	Preprint
Veröffentlicht:	2024
Schlagworte:	Computation and Language
Online-Zugang:	https://arxiv.org/abs/2408.11046
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Ähnliche Einträge

Jailbreaking Attacks vs. Content Safety Filters: How Far Are We in the LLM Safety Arms Race?
von: Xin, Yuan, et al.
Veröffentlicht: (2025)

Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing
von: Xin, Yuan, et al.
Veröffentlicht: (2023)

PoLLMgraph: Unraveling Hallucinations in Large Language Models via State Transition Dynamics
von: Zhu, Derui, et al.
Veröffentlicht: (2024)

Reconsidering Degeneration of Token Embeddings with Definitions for Encoder-based Pre-trained Language Models
von: Zhang, Ying, et al.
Veröffentlicht: (2024)

Probing Language Models for Pre-training Data Detection
von: Liu, Zhenhua, et al.
Veröffentlicht: (2024)

Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models
von: Chu, Junjie, et al.
Veröffentlicht: (2024)

Automated Detection of Pre-training Text in Black-box LLMs
von: Hu, Ruihan, et al.
Veröffentlicht: (2025)

From Unfamiliar to Familiar: Detecting Pre-training Data via Gradient Deviations in Large Language Models
von: Zhang, Ruiqi, et al.
Veröffentlicht: (2026)

On Leveraging Encoder-only Pre-trained Language Models for Effective Keyphrase Generation
von: Wu, Di, et al.
Veröffentlicht: (2024)

Knowledge Distillation of Black-Box Large Language Models
von: Chen, Hongzhan, et al.
Veröffentlicht: (2024)

Black-Box Segmentation of Electronic Medical Records
von: Yuan, Hongyi, et al.
Veröffentlicht: (2024)

Fine-tuning Pre-trained Language Models for Few-shot Intent Detection: Supervised Pre-training and Isotropization
von: Zhang, Haode, et al.
Veröffentlicht: (2022)

Nemotron-CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training
von: Diao, Shizhe, et al.
Veröffentlicht: (2025)

Memory Reviving, Continuing Learning and Beyond: Evaluation of Pre-trained Encoders and Decoders for Multimodal Machine Translation
von: Yu, Zhuang, et al.
Veröffentlicht: (2025)

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration
von: Wang, Shaobo, et al.
Veröffentlicht: (2026)

NuNER: Entity Recognition Encoder Pre-training via LLM-Annotated Data
von: Bogdanov, Sergei, et al.
Veröffentlicht: (2024)

Membership Inference Attacks Against In-Context Learning
von: Wen, Rui, et al.
Veröffentlicht: (2024)

Masked Structural Growth for 2x Faster Language Model Pre-training
von: Yao, Yiqun, et al.
Veröffentlicht: (2023)

Relational Prompt-based Pre-trained Language Models for Social Event Detection
von: Li, Pu, et al.
Veröffentlicht: (2024)

Text to Band Gap: Pre-trained Language Models as Encoders for Semiconductor Band Gap Prediction
von: Yeh, Ying-Ting, et al.
Veröffentlicht: (2025)

Generalist Reward Models: Found Inside Large Language Models
von: Li, Yi-Chen, et al.
Veröffentlicht: (2025)

Adaptive Pre-training Data Detection for Large Language Models via Surprising Tokens
von: Zhang, Anqi, et al.
Veröffentlicht: (2024)

Knowledge-augmented Pre-trained Language Models for Biomedical Relation Extraction
von: Sänger, Mario, et al.
Veröffentlicht: (2025)

The Inverse Scaling Effect of Pre-Trained Language Model Surprisal Is Not Due to Data Leakage
von: Oh, Byung-Doh, et al.
Veröffentlicht: (2025)

Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study
von: An, Keyu, et al.
Veröffentlicht: (2024)

Aptamer Encapsulated Inside the Array Channel of Ni‐MOF for Bisphenol A Determination in Multi‐interference System
von: Xiaokuan Zhang, et al.
Veröffentlicht: (2024)

A Systematic Study of Training-Free Methods for Trustworthy Large Language Models
von: Si, Wai Man, et al.
Veröffentlicht: (2026)

DataMan: Data Manager for Pre-training Large Language Models
von: Peng, Ru, et al.
Veröffentlicht: (2025)

DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment
von: Li, Haitao, et al.
Veröffentlicht: (2024)

Boosting Explainability through Selective Rationalization in Pre-trained Language Models
von: Yuan, Libing, et al.
Veröffentlicht: (2025)

RegMix: Data Mixture as Regression for Language Model Pre-training
von: Liu, Qian, et al.
Veröffentlicht: (2024)

Beyond SFT-to-RL: Pre-alignment via Black-Box On-Policy Distillation for Multimodal RL
von: Wang, Sudong, et al.
Veröffentlicht: (2026)

SSL-WM: A Black-Box Watermarking Approach for Encoders Pre-trained by Self-supervised Learning
von: Lv, Peizhuo, et al.
Veröffentlicht: (2022)

PDR: A Plug-and-Play Positional Decay Framework for LLM Pre-training Data Detection
von: Liu, Jinhan, et al.
Veröffentlicht: (2026)

DataVisT5: A Pre-trained Language Model for Jointly Understanding Text and Data Visualization
von: Wan, Zhuoyue, et al.
Veröffentlicht: (2024)

Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
von: Ishihara, Shotaro, et al.
Veröffentlicht: (2024)

Improving Audio-Visual Speech Recognition by Lip-Subword Correlation Based Visual Pre-training and Cross-Modal Fusion Encoder
von: Dai, Yusheng, et al.
Veröffentlicht: (2023)

Language Models as Hierarchy Encoders
von: He, Yuan, et al.
Veröffentlicht: (2024)

Fuzzy Fingerprinting Encoder Pre-trained Language Models for Emotion Recognition in Conversations: Human Assessment and Validity Study
von: Pereira, Patrícia, et al.
Veröffentlicht: (2026)

SOS! Soft Prompt Attack Against Open-Source Large Language Models
von: Yang, Ziqing, et al.
Veröffentlicht: (2024)