Enregistré dans:
| Auteurs principaux: | Qu, Jiaming, Guo, Mengtian, Wang, Yue |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2511.13658 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Meta-Tuning LLMs to Leverage Lexical Knowledge for Generalizable Language Style Understanding
par: Guo, Ruohao, et autres
Publié: (2023)
par: Guo, Ruohao, et autres
Publié: (2023)
Multilingual Lexical Feature Analysis of Spoken Language for Predicting Major Depression Symptom Severity
par: Tokareva, Anastasiia, et autres
Publié: (2025)
par: Tokareva, Anastasiia, et autres
Publié: (2025)
Bias in LLMs as Annotators: The Effect of Party Cues on Labelling Decision by Large Language Models
par: Vera, Sebastian Vallejo, et autres
Publié: (2024)
par: Vera, Sebastian Vallejo, et autres
Publié: (2024)
RLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problems
par: Qu, Yuxiao, et autres
Publié: (2025)
par: Qu, Yuxiao, et autres
Publié: (2025)
Why Does ChatGPT "Delve" So Much? Exploring the Sources of Lexical Overrepresentation in Large Language Models
par: Juzek, Tom S., et autres
Publié: (2024)
par: Juzek, Tom S., et autres
Publié: (2024)
Game of LLMs: Discovering Structural Constructs in Activities using Large Language Models
par: Hiremath, Shruthi K., et autres
Publié: (2024)
par: Hiremath, Shruthi K., et autres
Publié: (2024)
Why is "Problems" Predictive of Positive Sentiment? A Case Study of Explaining Unintuitive Features in Sentiment Classification
par: Qu, Jiaming, et autres
Publié: (2024)
par: Qu, Jiaming, et autres
Publié: (2024)
Shared Lexical Task Representations Explain Behavioral Variability In LLMs
par: Yang, Zhuonan, et autres
Publié: (2026)
par: Yang, Zhuonan, et autres
Publié: (2026)
Neural Recovery of Historical Lexical Structure in Bantu Languages from Modern Data
par: Mutisya, Hillary, et autres
Publié: (2026)
par: Mutisya, Hillary, et autres
Publié: (2026)
On Lexical Invariance on Multisets and Graphs
par: Zhang, Muhan
Publié: (2024)
par: Zhang, Muhan
Publié: (2024)
Survey of NLU Benchmarks Diagnosing Linguistic Phenomena: Why not Standardize Diagnostics Benchmarks?
par: Jallad, Khloud AL, et autres
Publié: (2025)
par: Jallad, Khloud AL, et autres
Publié: (2025)
Discovering Decoupled Functional Modules in Large Language Models
par: Yu, Yanke, et autres
Publié: (2026)
par: Yu, Yanke, et autres
Publié: (2026)
tnGPS: Discovering Unknown Tensor Network Structure Search Algorithms via Large Language Models (LLMs)
par: Zeng, Junhua, et autres
Publié: (2024)
par: Zeng, Junhua, et autres
Publié: (2024)
Deception Abilities Emerged in Large Language Models
par: Hagendorff, Thilo
Publié: (2023)
par: Hagendorff, Thilo
Publié: (2023)
Model Internal Sleuthing: Finding Lexical Identity and Inflectional Features in Modern Language Models
par: Li, Michael, et autres
Publié: (2025)
par: Li, Michael, et autres
Publié: (2025)
Why LLMs Cannot Think and How to Fix It
par: Jahrens, Marius, et autres
Publié: (2025)
par: Jahrens, Marius, et autres
Publié: (2025)
SpurLens: Automatic Detection of Spurious Cues in Multimodal LLMs
par: Hosseini, Parsa, et autres
Publié: (2025)
par: Hosseini, Parsa, et autres
Publié: (2025)
Lexical Hints of Accuracy in LLM Reasoning Chains
par: Vanhoyweghen, Arne, et autres
Publié: (2025)
par: Vanhoyweghen, Arne, et autres
Publié: (2025)
Unified Lexical Representation for Interpretable Visual-Language Alignment
par: Li, Yifan, et autres
Publié: (2024)
par: Li, Yifan, et autres
Publié: (2024)
SafetyNet: Detecting Harmful Outputs in LLMs by Modeling and Monitoring Deceptive Behaviors
par: Chaudhary, Maheep, et autres
Publié: (2025)
par: Chaudhary, Maheep, et autres
Publié: (2025)
Too Big to Fool: Resisting Deception in Language Models
par: Samsami, Mohammad Reza, et autres
Publié: (2024)
par: Samsami, Mohammad Reza, et autres
Publié: (2024)
Luxical: High-Speed Lexical-Dense Text Embeddings
par: DatologyAI, et autres
Publié: (2025)
par: DatologyAI, et autres
Publié: (2025)
Discovering Implicit Large Language Model Alignment Objectives
par: Chen, Edward, et autres
Publié: (2026)
par: Chen, Edward, et autres
Publié: (2026)
When Thinking LLMs Lie: Unveiling the Strategic Deception in Representations of Reasoning Models
par: Wang, Kai, et autres
Publié: (2025)
par: Wang, Kai, et autres
Publié: (2025)
Emergent Bayesian Behaviour and Optimal Cue Combination in LLMs
par: Ma, Julian, et autres
Publié: (2025)
par: Ma, Julian, et autres
Publié: (2025)
Can Language Models Discover Scaling Laws?
par: Lin, Haowei, et autres
Publié: (2025)
par: Lin, Haowei, et autres
Publié: (2025)
Discovering Low-rank Subspaces for Language-agnostic Multilingual Representations
par: Xie, Zhihui, et autres
Publié: (2024)
par: Xie, Zhihui, et autres
Publié: (2024)
Unknown Unknowns: Why Hidden Intentions in LLMs Evade Detection
par: Srivastav, Devansh, et autres
Publié: (2026)
par: Srivastav, Devansh, et autres
Publié: (2026)
Discovering Forbidden Topics in Language Models
par: Rager, Can, et autres
Publié: (2025)
par: Rager, Can, et autres
Publié: (2025)
Who Leads? Comparing Human-Centric and Model-Centric Strategies for Defining ML Target Variables
par: Guo, Mengtian, et autres
Publié: (2025)
par: Guo, Mengtian, et autres
Publié: (2025)
Chatting Up Attachment: Using LLMs to Predict Adult Bonds
par: Soares, Paulo, et autres
Publié: (2024)
par: Soares, Paulo, et autres
Publié: (2024)
Phonetic and Lexical Discovery of a Canine Language using HuBERT
par: Li, Xingyuan, et autres
Publié: (2024)
par: Li, Xingyuan, et autres
Publié: (2024)
Pressure-Testing Deception Probes in LLMs: Scaling, Robustness, and the Geometry of Deceptive Representations
par: Kumar, Sachin
Publié: (2026)
par: Kumar, Sachin
Publié: (2026)
Adaptive Prompt Structure Factorization: A Framework for Self-Discovering and Optimizing Compositional Prompt Programs
par: Liu, Haoyue, et autres
Publié: (2026)
par: Liu, Haoyue, et autres
Publié: (2026)
DeceptionBench: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenarios
par: Huang, Yao, et autres
Publié: (2025)
par: Huang, Yao, et autres
Publié: (2025)
Why Does Self-Distillation (Sometimes) Degrade the Reasoning Capability of LLMs?
par: Kim, Jeonghye, et autres
Publié: (2026)
par: Kim, Jeonghye, et autres
Publié: (2026)
Probing the Limits of the Lie Detector Approach to LLM Deception
par: Berger, Tom-Felix
Publié: (2026)
par: Berger, Tom-Felix
Publié: (2026)
Deception Detection from Linguistic and Physiological Data Streams Using Bimodal Convolutional Neural Networks
par: Li, Panfeng, et autres
Publié: (2023)
par: Li, Panfeng, et autres
Publié: (2023)
Evaluating & Reducing Deceptive Dialogue From Language Models with Multi-turn RL
par: Abdulhai, Marwa, et autres
Publié: (2025)
par: Abdulhai, Marwa, et autres
Publié: (2025)
Uncovering Deceptive Tendencies in Language Models: A Simulated Company AI Assistant
par: Järviniemi, Olli, et autres
Publié: (2024)
par: Järviniemi, Olli, et autres
Publié: (2024)
Documents similaires
-
Meta-Tuning LLMs to Leverage Lexical Knowledge for Generalizable Language Style Understanding
par: Guo, Ruohao, et autres
Publié: (2023) -
Multilingual Lexical Feature Analysis of Spoken Language for Predicting Major Depression Symptom Severity
par: Tokareva, Anastasiia, et autres
Publié: (2025) -
Bias in LLMs as Annotators: The Effect of Party Cues on Labelling Decision by Large Language Models
par: Vera, Sebastian Vallejo, et autres
Publié: (2024) -
RLAD: Training LLMs to Discover Abstractions for Solving Reasoning Problems
par: Qu, Yuxiao, et autres
Publié: (2025) -
Why Does ChatGPT "Delve" So Much? Exploring the Sources of Lexical Overrepresentation in Large Language Models
par: Juzek, Tom S., et autres
Publié: (2024)