:: Library Catalog

Cover Image

Saved in:

Bibliographic Details
Main Authors:	Thakkar, Megh, Fournier, Quentin, Riemer, Matthew D, Chen, Pin-Yu, Zouaq, Amal, Das, Payel, Chandar, Sarath
Format:	Preprint
Published:	2024
Subjects:	Computation and Language
Online Access:	https://arxiv.org/abs/2406.04879
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

Combining Domain and Alignment Vectors to Achieve Better Knowledge-Safety Trade-offs in LLMs
by: Thakkar, Megh, et al.
Published: (2024)

LLMs Can't Play Hangman: On the Necessity of a Private Working Memory for Language Agents
by: Baldelli, Davide, et al.
Published: (2026)

Probabilistic Calibration Is a Trainable Capability in Language Models
by: Baldelli, Davide, et al.
Published: (2026)

Too Big to Fool: Resisting Deception in Language Models
by: Samsami, Mohammad Reza, et al.
Published: (2024)

Exploring Quantization for Efficient Pre-Training of Transformer Language Models
by: Chitsaz, Kamran, et al.
Published: (2024)

NeoBERT: A Next-Generation BERT
by: Breton, Lola Le, et al.
Published: (2025)

Ontology-Constrained Generation of Domain-Specific Clinical Summaries
by: Mehenni, Gaya, et al.
Published: (2024)

Revisiting Replay and Gradient Alignment for Continual Pre-Training of Large Language Models
by: Abbes, Istabrak, et al.
Published: (2025)

Fundamental Safety-Capability Trade-offs in Fine-tuning Large Language Models
by: Chen, Pin-Yu, et al.
Published: (2025)

Small Encoders Can Rival Large Decoders in Detecting Groundedness
by: Abbes, Istabrak, et al.
Published: (2025)

What is the Best Process Model Representation? A Comparative Analysis for Process Modeling with Large Language Models
by: Brissard, Alexis, et al.
Published: (2025)

Reducing Hallucinations in Language Model-based SPARQL Query Generation Using Post-Generation Memory Retrieval
by: Sharma, Aditya, et al.
Published: (2025)

FRASE: Structured Representations for Generalizable SPARQL Query Generation
by: Diallo, Papa Abdou Karim Karou, et al.
Published: (2025)

Enhancing Frame Detection with Retrieval Augmented Generation
by: Diallo, Papa Abdou Karim Karou, et al.
Published: (2025)

Faithfulness Measurable Masked Language Models
by: Madsen, Andreas, et al.
Published: (2023)

Are self-explanations from Large Language Models faithful?
by: Madsen, Andreas, et al.
Published: (2024)

CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design
by: Govindarajan, Prashant, et al.
Published: (2025)

CoPeP: Benchmarking Continual Pretraining for Protein Language Models
by: Patil, Darshan, et al.
Published: (2026)

Manifold Metric: A Loss Landscape Approach for Predicting Model Performance
by: Malviya, Pranshu, et al.
Published: (2024)

NeuroFaith: Evaluating LLM Self-Explanation Faithfulness via Internal Representation Alignment
by: Bhan, Milan, et al.
Published: (2025)

SEAL: Safety-enhanced Aligned LLM Fine-tuning via Bilevel Data Selection
by: Shen, Han, et al.
Published: (2024)

A Comprehensive Evaluation of Neural SPARQL Query Generation from Natural Language Questions
by: Diallo, Papa Abdou Karim Karou, et al.
Published: (2023)

NovoMolGen: Rethinking Molecular Language Model Pretraining
by: Chitsaz, Kamran, et al.
Published: (2025)

Effect of Document Packing on the Latent Multi-Hop Reasoning Capabilities of Large Language Models
by: Prato, Gabriele, et al.
Published: (2025)

Towards Practical Tool Usage for Continually Learning LLMs
by: Huang, Jerry, et al.
Published: (2024)

EpMAN: Episodic Memory AttentioN for Generalizing to Longer Contexts
by: Chaudhury, Subhajit, et al.
Published: (2025)

Interpretability Needs a New Paradigm
by: Madsen, Andreas, et al.
Published: (2024)

Why Don't Prompt-Based Fairness Metrics Correlate?
by: Zayed, Abdelrahman, et al.
Published: (2024)

Should We Attend More or Less? Modulating Attention for Fairness
by: Zayed, Abdelrahman, et al.
Published: (2023)

DeSQ: Decomposition-based SPARQL Query Generation
by: Diallo, Papa Abdou Karim Karou, et al.
Published: (2026)

Scopes of Alignment
by: Varshney, Kush R., et al.
Published: (2025)

GeoCoder: Solving Geometry Problems by Generating Modular Code through Vision-Language Models
by: Sharma, Aditya, et al.
Published: (2024)

MedHal: An Evaluation Dataset for Medical Hallucination Detection
by: Mehenni, Gaya, et al.
Published: (2025)

EpiK-Eval: Evaluation for Language Models as Epistemic Models
by: Prato, Gabriele, et al.
Published: (2023)

Do Large Language Models Know How Much They Know?
by: Prato, Gabriele, et al.
Published: (2025)

Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination
by: Huang, Jerry, et al.
Published: (2024)

ChartGemma: Visual Instruction-tuning for Chart Reasoning in the Wild
by: Masry, Ahmed, et al.
Published: (2024)

PMoL: Parameter Efficient MoE for Preference Mixing of LLM Alignment
by: Liu, Dongxu, et al.
Published: (2024)

Exploring Safety-Utility Trade-Offs in Personalized Language Models
by: Vijjini, Anvesh Rao, et al.
Published: (2024)

Generation Constraint Scaling Can Mitigate Hallucination
by: Kollias, Georgios, et al.
Published: (2024)