Enregistré dans:
| Auteurs principaux: | Petrova, Aleksandra, Larrosa, Javier, Rollón, Emma |
|---|---|
| Format: | Preprint |
| Publié: |
2025
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2501.07432 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Anytime Cooperative Implicit Hitting Set Solving
par: Rollón, Emma, et autres
Publié: (2025)
par: Rollón, Emma, et autres
Publié: (2025)
Efficient and Reliable Hitting-Set Computations for the Implicit Hitting Set Approach
par: Ihalainen, Hannes, et autres
Publié: (2025)
par: Ihalainen, Hannes, et autres
Publié: (2025)
CSPs with Few Alien Constraints
par: Jonsson, Peter, et autres
Publié: (2024)
par: Jonsson, Peter, et autres
Publié: (2024)
Pressure Reveals Character: Behavioural Alignment Evaluation at Depth
par: Petrova, Nora, et autres
Publié: (2026)
par: Petrova, Nora, et autres
Publié: (2026)
Evaluating LLM Behavior in Hiring: Implicit Weights, Fairness Across Groups, and Alignment with Human Preferences
par: Hoffmann, Morgane, et autres
Publié: (2026)
par: Hoffmann, Morgane, et autres
Publié: (2026)
Grammatical Error Feedback: An Implicit Evaluation Approach
par: Bannò, Stefano, et autres
Publié: (2024)
par: Bannò, Stefano, et autres
Publié: (2024)
Learning Set Functions with Implicit Differentiation
par: Özcan, Gözde, et autres
Publié: (2024)
par: Özcan, Gözde, et autres
Publié: (2024)
From In Silico to In Vitro: Evaluating Molecule Generative Models for Hit Generation
par: Osman, Nagham, et autres
Publié: (2025)
par: Osman, Nagham, et autres
Publié: (2025)
Unpacking Human Preference for LLMs: Demographically Aware Evaluation with the HUMAINE Framework
par: Petrova, Nora, et autres
Publié: (2026)
par: Petrova, Nora, et autres
Publié: (2026)
The Missing Red Line: How Commercial Pressure Erodes AI Safety Boundaries
par: Petrova, Nora, et autres
Publié: (2026)
par: Petrova, Nora, et autres
Publié: (2026)
Hitting "Probe"rty with Non-Linearity, and More
par: Pal, Avik, et autres
Publié: (2024)
par: Pal, Avik, et autres
Publié: (2024)
An Empirical Evaluation of Neural and Neuro-symbolic Approaches to Real-time Multimodal Complex Event Detection
par: Han, Liying, et autres
Publié: (2024)
par: Han, Liying, et autres
Publié: (2024)
SEA: State-Exchange Attention for High-Fidelity Physics Based Transformers
par: Esmati, Parsa, et autres
Publié: (2024)
par: Esmati, Parsa, et autres
Publié: (2024)
Implicit Safe Set Algorithm for Provably Safe Reinforcement Learning
par: Zhao, Weiye, et autres
Publié: (2024)
par: Zhao, Weiye, et autres
Publié: (2024)
Graph Drawing for LLMs: An Empirical Evaluation
par: Didimo, Walter, et autres
Publié: (2025)
par: Didimo, Walter, et autres
Publié: (2025)
Empirical Characterization of Temporal Constraint Processing in LLMs
par: Marín, Javier
Publié: (2025)
par: Marín, Javier
Publié: (2025)
Auto-Rubric: Learning From Implicit Weights to Explicit Rubrics for Reward Modeling
par: Xie, Lipeng, et autres
Publié: (2025)
par: Xie, Lipeng, et autres
Publié: (2025)
Evaluating Sample Utility for Efficient Data Selection by Mimicking Model Weights
par: Huang, Tzu-Heng, et autres
Publié: (2025)
par: Huang, Tzu-Heng, et autres
Publié: (2025)
Capability Ceilings in Autoregressive Language Models: Empirical Evidence from Knowledge-Intensive Tasks
par: Marín, Javier
Publié: (2025)
par: Marín, Javier
Publié: (2025)
Empirical Evaluation of AI-Assisted Software Package Selection: A Knowledge Graph Approach
par: Farshidi, Siamak, et autres
Publié: (2025)
par: Farshidi, Siamak, et autres
Publié: (2025)
Reliable Classification with Conformal Learning and Interval-Type 2 Fuzzy Sets
par: Fumanal-Idocin, Javier, et autres
Publié: (2025)
par: Fumanal-Idocin, Javier, et autres
Publié: (2025)
Implicit Intelligence -- Evaluating Agents on What Users Don't Say
par: Sirdeshmukh, Ved, et autres
Publié: (2026)
par: Sirdeshmukh, Ved, et autres
Publié: (2026)
Dynamic Location Search for Identifying Maximum Weighted Independent Sets in Complex Networks
par: Zhu, Enqiang, et autres
Publié: (2025)
par: Zhu, Enqiang, et autres
Publié: (2025)
Hit-RAG: Learning to Reason with Long Contexts via Preference Alignment
par: Liu, Junming, et autres
Publié: (2026)
par: Liu, Junming, et autres
Publié: (2026)
Improving Coverage in Combined Prediction Sets with Weighted p-values
par: Wong, Gina, et autres
Publié: (2025)
par: Wong, Gina, et autres
Publié: (2025)
IWP: Token Pruning as Implicit Weight Pruning in Large Vision Language Models
par: Lee, Dong-Jae, et autres
Publié: (2026)
par: Lee, Dong-Jae, et autres
Publié: (2026)
Evaluating the World Model Implicit in a Generative Model
par: Vafa, Keyon, et autres
Publié: (2024)
par: Vafa, Keyon, et autres
Publié: (2024)
An Empirical Evaluation of LLM-Based Approaches for Code Vulnerability Detection: RAG, SFT, and Dual-Agent Systems
par: Saju, Md Hasan, et autres
Publié: (2026)
par: Saju, Md Hasan, et autres
Publié: (2026)
Evaluating Large Language Models Using Contrast Sets: An Experimental Approach
par: Sanwal, Manish
Publié: (2024)
par: Sanwal, Manish
Publié: (2024)
Rethinking Transformer-based Multi-document Summarization: An Empirical Investigation
par: Ma, Congbo, et autres
Publié: (2024)
par: Ma, Congbo, et autres
Publié: (2024)
A Metaheuristic Algorithm for Large Maximum Weight Independent Set Problems
par: Dong, Yuanyuan, et autres
Publié: (2022)
par: Dong, Yuanyuan, et autres
Publié: (2022)
ConfHit: Conformal Generative Design with Oracle Free Guarantees
par: Laghuvarapu, Siddhartha, et autres
Publié: (2026)
par: Laghuvarapu, Siddhartha, et autres
Publié: (2026)
Data Diversity as Implicit Regularization: How Does Diversity Shape the Weight Space of Deep Neural Networks?
par: Ba, Yang, et autres
Publié: (2024)
par: Ba, Yang, et autres
Publié: (2024)
An Empirical Examination of the Evaluative AI Framework
par: Kornowicz, Jaroslaw
Publié: (2024)
par: Kornowicz, Jaroslaw
Publié: (2024)
Empirical Evaluation of Progressive Coding for Sparse Autoencoders
par: Peter, Hans, et autres
Publié: (2025)
par: Peter, Hans, et autres
Publié: (2025)
Geometric Analysis of Token Selection in Multi-Head Attention
par: Mudarisov, Timur, et autres
Publié: (2026)
par: Mudarisov, Timur, et autres
Publié: (2026)
Empirical Evaluation of Public HateSpeech Datasets
par: Jaf, Sadar, et autres
Publié: (2024)
par: Jaf, Sadar, et autres
Publié: (2024)
Multi-Task Learning with LLMs for Implicit Sentiment Analysis: Data-level and Task-level Automatic Weight Learning
par: Lai, Wenna, et autres
Publié: (2024)
par: Lai, Wenna, et autres
Publié: (2024)
Bifurcation Models: Learning Set-Valued Solution Maps with Weight-Tied Dynamics
par: Jore, Caleb, et autres
Publié: (2026)
par: Jore, Caleb, et autres
Publié: (2026)
Neural Network-based Information Set Weighting for Playing Reconnaissance Blind Chess
par: Bertram, Timo, et autres
Publié: (2024)
par: Bertram, Timo, et autres
Publié: (2024)
Documents similaires
-
Anytime Cooperative Implicit Hitting Set Solving
par: Rollón, Emma, et autres
Publié: (2025) -
Efficient and Reliable Hitting-Set Computations for the Implicit Hitting Set Approach
par: Ihalainen, Hannes, et autres
Publié: (2025) -
CSPs with Few Alien Constraints
par: Jonsson, Peter, et autres
Publié: (2024) -
Pressure Reveals Character: Behavioural Alignment Evaluation at Depth
par: Petrova, Nora, et autres
Publié: (2026) -
Evaluating LLM Behavior in Hiring: Implicit Weights, Fairness Across Groups, and Alignment with Human Preferences
par: Hoffmann, Morgane, et autres
Publié: (2026)