Gespeichert in:
| Hauptverfasser: | Said, Muna Numan, Zaidi, Aarib, Usman, Rabia, Okon, Sonia, Medepalli, Praneeth, Zhu, Kevin, Sharma, Vasu, O'Brien, Sean |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2025
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2505.01430 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
NovelHopQA: Diagnosing Multi-Hop Reasoning Failures in Long Narrative Contexts
von: Gupta, Abhay, et al.
Veröffentlicht: (2025)
von: Gupta, Abhay, et al.
Veröffentlicht: (2025)
Adaptive Originality Filtering: Rejection Based Prompting and RiddleScore for Culturally Grounded Multilingual Riddle Generation
von: Le, Duy, et al.
Veröffentlicht: (2025)
von: Le, Duy, et al.
Veröffentlicht: (2025)
Distill CLIP (DCLIP): Enhancing Image-Text Retrieval via Cross-Modal Transformer Distillation
von: Csizmadia, Daniel, et al.
Veröffentlicht: (2025)
von: Csizmadia, Daniel, et al.
Veröffentlicht: (2025)
Reasoning Relay: Evaluating Stability and Interchangeability of Large Language Models in Mathematical Reasoning
von: Lu, Leo, et al.
Veröffentlicht: (2025)
von: Lu, Leo, et al.
Veröffentlicht: (2025)
SMAGDi: Socratic Multi Agent Interaction Graph Distillation for Efficient High Accuracy Reasoning
von: Aluru, Aayush, et al.
Veröffentlicht: (2025)
von: Aluru, Aayush, et al.
Veröffentlicht: (2025)
Sarc7: Evaluating Sarcasm Detection and Generation with Seven Types and Emotion-Informed Techniques
von: Xiong, Lang, et al.
Veröffentlicht: (2025)
von: Xiong, Lang, et al.
Veröffentlicht: (2025)
Pause-Tuning for Long-Context Comprehension: A Lightweight Approach to LLM Attention Recalibration
von: Begin, James, et al.
Veröffentlicht: (2025)
von: Begin, James, et al.
Veröffentlicht: (2025)
Pruning for Performance: Efficient Idiom and Metaphor Classification in Low-Resource Konkani Using mBERT
von: Do, Timothy, et al.
Veröffentlicht: (2025)
von: Do, Timothy, et al.
Veröffentlicht: (2025)
Causal Language Control in Multilingual Transformers via Sparse Feature Steering
von: Chou, Cheng-Ting, et al.
Veröffentlicht: (2025)
von: Chou, Cheng-Ting, et al.
Veröffentlicht: (2025)
ERGO: Entropy-guided Resetting for Generation Optimization in Multi-turn Language Models
von: Khalid, Haziq Mohammad, et al.
Veröffentlicht: (2025)
von: Khalid, Haziq Mohammad, et al.
Veröffentlicht: (2025)
Universal Neurons in GPT-2: Emergence, Persistence, and Functional Impact
von: Nandan, Advey, et al.
Veröffentlicht: (2025)
von: Nandan, Advey, et al.
Veröffentlicht: (2025)
From Directions to Cones: Exploring Multidimensional Representations of Propositional Facts in LLMs
von: Yu, Stanley, et al.
Veröffentlicht: (2025)
von: Yu, Stanley, et al.
Veröffentlicht: (2025)
WOLF: Werewolf-based Observations for LLM Deception and Falsehoods
von: Agarwal, Mrinal, et al.
Veröffentlicht: (2025)
von: Agarwal, Mrinal, et al.
Veröffentlicht: (2025)
TRUTH DECAY: Quantifying Multi-Turn Sycophancy in Language Models
von: Liu, Joshua, et al.
Veröffentlicht: (2025)
von: Liu, Joshua, et al.
Veröffentlicht: (2025)
The illusion of academic freedom and the promise of the undercommons
von: Zareen Zaidi, et al.
Veröffentlicht: (2026)
von: Zareen Zaidi, et al.
Veröffentlicht: (2026)
The Geometry of Harmfulness in LLMs through Subconcept Probing
von: Shah, McNair, et al.
Veröffentlicht: (2025)
von: Shah, McNair, et al.
Veröffentlicht: (2025)
From Bias to Balance: Detecting Facial Expression Recognition Biases in Large Multimodal Foundation Models
von: Chhua, Kaylee, et al.
Veröffentlicht: (2024)
von: Chhua, Kaylee, et al.
Veröffentlicht: (2024)
COREVQA: A Crowd Observation and Reasoning Entailment Visual Question Answering Benchmark
von: Chintapatla, Ishant, et al.
Veröffentlicht: (2025)
von: Chintapatla, Ishant, et al.
Veröffentlicht: (2025)
Rosetta-PL: Propositional Logic as a Benchmark for Large Language Model Reasoning
von: Baek, Shaun, et al.
Veröffentlicht: (2025)
von: Baek, Shaun, et al.
Veröffentlicht: (2025)
Advancing Uto-Aztecan Language Technologies: A Case Study on the Endangered Comanche Language
von: C, Jesus Alvarez, et al.
Veröffentlicht: (2025)
von: C, Jesus Alvarez, et al.
Veröffentlicht: (2025)
FAIRE: Assessing Racial and Gender Bias in AI-Driven Resume Evaluations
von: Wen, Athena, et al.
Veröffentlicht: (2025)
von: Wen, Athena, et al.
Veröffentlicht: (2025)
Interpreting the Latent Structure of Operator Precedence in Language Models
von: Yugeswardeenoo, Dharunish, et al.
Veröffentlicht: (2025)
von: Yugeswardeenoo, Dharunish, et al.
Veröffentlicht: (2025)
Question-Analysis Prompting Improves LLM Performance in Reasoning Tasks
von: Yugeswardeenoo, Dharunish, et al.
Veröffentlicht: (2024)
von: Yugeswardeenoo, Dharunish, et al.
Veröffentlicht: (2024)
MALIBU Benchmark: Multi-Agent LLM Implicit Bias Uncovered
von: Mirza, Imran, et al.
Veröffentlicht: (2025)
von: Mirza, Imran, et al.
Veröffentlicht: (2025)
Influence of Rhizophagus irregularis Inoculation on Salt Tolerance in Cucurbita maxima Duch.
von: Okon, Okon Godwin, et al.
Veröffentlicht: (2018)
von: Okon, Okon Godwin, et al.
Veröffentlicht: (2018)
Probing Audio-Generation Capabilities of Text-Based Language Models
von: Anbazhagan, Arjun Prasaath, et al.
Veröffentlicht: (2025)
von: Anbazhagan, Arjun Prasaath, et al.
Veröffentlicht: (2025)
Deconstructing FastText
von: Majumdar, Partha
Veröffentlicht: (2026)
von: Majumdar, Partha
Veröffentlicht: (2026)
Impact of Green Knowledge Sharing on the Organizational Performance of SMEs : The Mediating Role of Green Organizational Culture and Technological Innovation
von: Fernando Almeida, et al.
Veröffentlicht: (2026)
von: Fernando Almeida, et al.
Veröffentlicht: (2026)
Error Reflection Prompting: Can Large Language Models Successfully Understand Errors?
von: Li, Jason, et al.
Veröffentlicht: (2025)
von: Li, Jason, et al.
Veröffentlicht: (2025)
CLEAR: Contrasting Textual Feedback with Experts and Amateurs for Reasoning
von: Rufail, Andrew, et al.
Veröffentlicht: (2025)
von: Rufail, Andrew, et al.
Veröffentlicht: (2025)
Comparison of Radiofrequency Microneedling and Ultrasound Delivery of Plant‐Based Derived Secretory Factor (CFa1) Hair Serum for the Cosmetic Improvement of Androgenetic Alopecia
von: Lauren S. Mohan, et al.
Veröffentlicht: (2026)
von: Lauren S. Mohan, et al.
Veröffentlicht: (2026)
Rewrite-to-Rank: Optimizing Ad Visibility via Retrieval-Aware Text Rewriting
von: Ho, Chloe, et al.
Veröffentlicht: (2025)
von: Ho, Chloe, et al.
Veröffentlicht: (2025)
Flavour Deconstructing the Composite Higgs
von: Covone, Sebastiano, et al.
Veröffentlicht: (2024)
von: Covone, Sebastiano, et al.
Veröffentlicht: (2024)
Vopěnka's Principle, Maximum Deconstructibility, and singly-generated torsion classes
von: Cox, Sean
Veröffentlicht: (2024)
von: Cox, Sean
Veröffentlicht: (2024)
AAVENUE: Detecting LLM Biases on NLU Tasks in AAVE via a Novel Benchmark
von: Gupta, Abhay, et al.
Veröffentlicht: (2024)
von: Gupta, Abhay, et al.
Veröffentlicht: (2024)
Ultrafast Superconducting Qubit Readout with the Quarton Coupler
von: Ye, Yufeng, et al.
Veröffentlicht: (2024)
von: Ye, Yufeng, et al.
Veröffentlicht: (2024)
El problema de la medición en mecánica cuántica
von: E. Okon
Veröffentlicht: (2014)
von: E. Okon
Veröffentlicht: (2014)
Reassessing the strength of a class of Wigner's friend no-go theorems
von: Okon, E.
Veröffentlicht: (2022)
von: Okon, E.
Veröffentlicht: (2022)
Deconstructive Composite Dark Matter Detection
von: Boukhtouchen, Yilda, et al.
Veröffentlicht: (2025)
von: Boukhtouchen, Yilda, et al.
Veröffentlicht: (2025)
Encoding Inequity: Examining Demographic Bias in LLM-Driven Robot Caregiving
von: Korpan, Raj
Veröffentlicht: (2025)
von: Korpan, Raj
Veröffentlicht: (2025)
Ähnliche Einträge
-
NovelHopQA: Diagnosing Multi-Hop Reasoning Failures in Long Narrative Contexts
von: Gupta, Abhay, et al.
Veröffentlicht: (2025) -
Adaptive Originality Filtering: Rejection Based Prompting and RiddleScore for Culturally Grounded Multilingual Riddle Generation
von: Le, Duy, et al.
Veröffentlicht: (2025) -
Distill CLIP (DCLIP): Enhancing Image-Text Retrieval via Cross-Modal Transformer Distillation
von: Csizmadia, Daniel, et al.
Veröffentlicht: (2025) -
Reasoning Relay: Evaluating Stability and Interchangeability of Large Language Models in Mathematical Reasoning
von: Lu, Leo, et al.
Veröffentlicht: (2025) -
SMAGDi: Socratic Multi Agent Interaction Graph Distillation for Efficient High Accuracy Reasoning
von: Aluru, Aayush, et al.
Veröffentlicht: (2025)