Gespeichert in:
| Hauptverfasser: | Xin, Yuan, Li, Zheng, Yu, Ning, Chen, Dingfan, Fritz, Mario, Backes, Michael, Zhang, Yang |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2408.11046 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
Jailbreaking Attacks vs. Content Safety Filters: How Far Are We in the LLM Safety Arms Race?
von: Xin, Yuan, et al.
Veröffentlicht: (2025)
von: Xin, Yuan, et al.
Veröffentlicht: (2025)
Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing
von: Xin, Yuan, et al.
Veröffentlicht: (2023)
von: Xin, Yuan, et al.
Veröffentlicht: (2023)
PoLLMgraph: Unraveling Hallucinations in Large Language Models via State Transition Dynamics
von: Zhu, Derui, et al.
Veröffentlicht: (2024)
von: Zhu, Derui, et al.
Veröffentlicht: (2024)
Reconsidering Degeneration of Token Embeddings with Definitions for Encoder-based Pre-trained Language Models
von: Zhang, Ying, et al.
Veröffentlicht: (2024)
von: Zhang, Ying, et al.
Veröffentlicht: (2024)
Probing Language Models for Pre-training Data Detection
von: Liu, Zhenhua, et al.
Veröffentlicht: (2024)
von: Liu, Zhenhua, et al.
Veröffentlicht: (2024)
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models
von: Chu, Junjie, et al.
Veröffentlicht: (2024)
von: Chu, Junjie, et al.
Veröffentlicht: (2024)
Automated Detection of Pre-training Text in Black-box LLMs
von: Hu, Ruihan, et al.
Veröffentlicht: (2025)
von: Hu, Ruihan, et al.
Veröffentlicht: (2025)
From Unfamiliar to Familiar: Detecting Pre-training Data via Gradient Deviations in Large Language Models
von: Zhang, Ruiqi, et al.
Veröffentlicht: (2026)
von: Zhang, Ruiqi, et al.
Veröffentlicht: (2026)
On Leveraging Encoder-only Pre-trained Language Models for Effective Keyphrase Generation
von: Wu, Di, et al.
Veröffentlicht: (2024)
von: Wu, Di, et al.
Veröffentlicht: (2024)
Knowledge Distillation of Black-Box Large Language Models
von: Chen, Hongzhan, et al.
Veröffentlicht: (2024)
von: Chen, Hongzhan, et al.
Veröffentlicht: (2024)
Black-Box Segmentation of Electronic Medical Records
von: Yuan, Hongyi, et al.
Veröffentlicht: (2024)
von: Yuan, Hongyi, et al.
Veröffentlicht: (2024)
Fine-tuning Pre-trained Language Models for Few-shot Intent Detection: Supervised Pre-training and Isotropization
von: Zhang, Haode, et al.
Veröffentlicht: (2022)
von: Zhang, Haode, et al.
Veröffentlicht: (2022)
Nemotron-CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training
von: Diao, Shizhe, et al.
Veröffentlicht: (2025)
von: Diao, Shizhe, et al.
Veröffentlicht: (2025)
Memory Reviving, Continuing Learning and Beyond: Evaluation of Pre-trained Encoders and Decoders for Multimodal Machine Translation
von: Yu, Zhuang, et al.
Veröffentlicht: (2025)
von: Yu, Zhuang, et al.
Veröffentlicht: (2025)
OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration
von: Wang, Shaobo, et al.
Veröffentlicht: (2026)
von: Wang, Shaobo, et al.
Veröffentlicht: (2026)
NuNER: Entity Recognition Encoder Pre-training via LLM-Annotated Data
von: Bogdanov, Sergei, et al.
Veröffentlicht: (2024)
von: Bogdanov, Sergei, et al.
Veröffentlicht: (2024)
Membership Inference Attacks Against In-Context Learning
von: Wen, Rui, et al.
Veröffentlicht: (2024)
von: Wen, Rui, et al.
Veröffentlicht: (2024)
Masked Structural Growth for 2x Faster Language Model Pre-training
von: Yao, Yiqun, et al.
Veröffentlicht: (2023)
von: Yao, Yiqun, et al.
Veröffentlicht: (2023)
Relational Prompt-based Pre-trained Language Models for Social Event Detection
von: Li, Pu, et al.
Veröffentlicht: (2024)
von: Li, Pu, et al.
Veröffentlicht: (2024)
Text to Band Gap: Pre-trained Language Models as Encoders for Semiconductor Band Gap Prediction
von: Yeh, Ying-Ting, et al.
Veröffentlicht: (2025)
von: Yeh, Ying-Ting, et al.
Veröffentlicht: (2025)
Generalist Reward Models: Found Inside Large Language Models
von: Li, Yi-Chen, et al.
Veröffentlicht: (2025)
von: Li, Yi-Chen, et al.
Veröffentlicht: (2025)
Adaptive Pre-training Data Detection for Large Language Models via Surprising Tokens
von: Zhang, Anqi, et al.
Veröffentlicht: (2024)
von: Zhang, Anqi, et al.
Veröffentlicht: (2024)
Knowledge-augmented Pre-trained Language Models for Biomedical Relation Extraction
von: Sänger, Mario, et al.
Veröffentlicht: (2025)
von: Sänger, Mario, et al.
Veröffentlicht: (2025)
The Inverse Scaling Effect of Pre-Trained Language Model Surprisal Is Not Due to Data Leakage
von: Oh, Byung-Doh, et al.
Veröffentlicht: (2025)
von: Oh, Byung-Doh, et al.
Veröffentlicht: (2025)
Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study
von: An, Keyu, et al.
Veröffentlicht: (2024)
von: An, Keyu, et al.
Veröffentlicht: (2024)
Aptamer Encapsulated Inside the Array Channel of Ni‐MOF for Bisphenol A Determination in Multi‐interference System
von: Xiaokuan Zhang, et al.
Veröffentlicht: (2024)
von: Xiaokuan Zhang, et al.
Veröffentlicht: (2024)
A Systematic Study of Training-Free Methods for Trustworthy Large Language Models
von: Si, Wai Man, et al.
Veröffentlicht: (2026)
von: Si, Wai Man, et al.
Veröffentlicht: (2026)
DataMan: Data Manager for Pre-training Large Language Models
von: Peng, Ru, et al.
Veröffentlicht: (2025)
von: Peng, Ru, et al.
Veröffentlicht: (2025)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment
von: Li, Haitao, et al.
Veröffentlicht: (2024)
von: Li, Haitao, et al.
Veröffentlicht: (2024)
Boosting Explainability through Selective Rationalization in Pre-trained Language Models
von: Yuan, Libing, et al.
Veröffentlicht: (2025)
von: Yuan, Libing, et al.
Veröffentlicht: (2025)
RegMix: Data Mixture as Regression for Language Model Pre-training
von: Liu, Qian, et al.
Veröffentlicht: (2024)
von: Liu, Qian, et al.
Veröffentlicht: (2024)
Beyond SFT-to-RL: Pre-alignment via Black-Box On-Policy Distillation for Multimodal RL
von: Wang, Sudong, et al.
Veröffentlicht: (2026)
von: Wang, Sudong, et al.
Veröffentlicht: (2026)
SSL-WM: A Black-Box Watermarking Approach for Encoders Pre-trained by Self-supervised Learning
von: Lv, Peizhuo, et al.
Veröffentlicht: (2022)
von: Lv, Peizhuo, et al.
Veröffentlicht: (2022)
PDR: A Plug-and-Play Positional Decay Framework for LLM Pre-training Data Detection
von: Liu, Jinhan, et al.
Veröffentlicht: (2026)
von: Liu, Jinhan, et al.
Veröffentlicht: (2026)
DataVisT5: A Pre-trained Language Model for Jointly Understanding Text and Data Visualization
von: Wan, Zhuoyue, et al.
Veröffentlicht: (2024)
von: Wan, Zhuoyue, et al.
Veröffentlicht: (2024)
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
von: Ishihara, Shotaro, et al.
Veröffentlicht: (2024)
von: Ishihara, Shotaro, et al.
Veröffentlicht: (2024)
Improving Audio-Visual Speech Recognition by Lip-Subword Correlation Based Visual Pre-training and Cross-Modal Fusion Encoder
von: Dai, Yusheng, et al.
Veröffentlicht: (2023)
von: Dai, Yusheng, et al.
Veröffentlicht: (2023)
Language Models as Hierarchy Encoders
von: He, Yuan, et al.
Veröffentlicht: (2024)
von: He, Yuan, et al.
Veröffentlicht: (2024)
Fuzzy Fingerprinting Encoder Pre-trained Language Models for Emotion Recognition in Conversations: Human Assessment and Validity Study
von: Pereira, Patrícia, et al.
Veröffentlicht: (2026)
von: Pereira, Patrícia, et al.
Veröffentlicht: (2026)
SOS! Soft Prompt Attack Against Open-Source Large Language Models
von: Yang, Ziqing, et al.
Veröffentlicht: (2024)
von: Yang, Ziqing, et al.
Veröffentlicht: (2024)
Ähnliche Einträge
-
Jailbreaking Attacks vs. Content Safety Filters: How Far Are We in the LLM Safety Arms Race?
von: Xin, Yuan, et al.
Veröffentlicht: (2025) -
Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing
von: Xin, Yuan, et al.
Veröffentlicht: (2023) -
PoLLMgraph: Unraveling Hallucinations in Large Language Models via State Transition Dynamics
von: Zhu, Derui, et al.
Veröffentlicht: (2024) -
Reconsidering Degeneration of Token Embeddings with Definitions for Encoder-based Pre-trained Language Models
von: Zhang, Ying, et al.
Veröffentlicht: (2024) -
Probing Language Models for Pre-training Data Detection
von: Liu, Zhenhua, et al.
Veröffentlicht: (2024)