Uloženo v:
| Hlavní autoři: | Perez, Natalie, Bhaduri, Sreyoshi, Chadha, Aman |
|---|---|
| Médium: | Preprint |
| Vydáno: |
2026
|
| Témata: | |
| On-line přístup: | https://arxiv.org/abs/2603.04413 |
| Tagy: |
Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
|
Podobné jednotky
Decoding the Diversity: A Review of the Indic AI Research Landscape
Autor: KJ, Sankalp, a další
Vydáno: (2024)
Autor: KJ, Sankalp, a další
Vydáno: (2024)
Parameter Efficient Fine Tuning: A Comprehensive Analysis Across Applications
Autor: Balne, Charith Chandra Sai, a další
Vydáno: (2024)
Autor: Balne, Charith Chandra Sai, a další
Vydáno: (2024)
IndicMMLU-Pro: Benchmarking Indic Large Language Models on Multi-Task Language Understanding
Autor: KJ, Sankalp, a další
Vydáno: (2025)
Autor: KJ, Sankalp, a další
Vydáno: (2025)
Potential and Perils of Large Language Models as Judges of Unstructured Textual Data
Autor: Bedemariam, Rewina, a další
Vydáno: (2025)
Autor: Bedemariam, Rewina, a další
Vydáno: (2025)
Levers of Power in the Field of AI
Autor: Mackenzie, Tammy, a další
Vydáno: (2025)
Autor: Mackenzie, Tammy, a další
Vydáno: (2025)
Human-Readable Adversarial Prompts: An Investigation into LLM Vulnerabilities Using Situational Context
Autor: Das, Nilanjana, a další
Vydáno: (2024)
Autor: Das, Nilanjana, a další
Vydáno: (2024)
Generative Data Augmentation using LLMs improves Distributional Robustness in Question Answering
Autor: Chowdhury, Arijit Ghosh, a další
Vydáno: (2023)
Autor: Chowdhury, Arijit Ghosh, a další
Vydáno: (2023)
Assessing LLM Reliability on Temporally Recent Open-Domain Questions
Autor: Krishnappa, Pushwitha, a další
Vydáno: (2026)
Autor: Krishnappa, Pushwitha, a další
Vydáno: (2026)
Can Large Language Models Infer Causal Relationships from Real-World Text?
Autor: Saklad, Ryan, a další
Vydáno: (2025)
Autor: Saklad, Ryan, a další
Vydáno: (2025)
Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries
Autor: Gero, Zelalem, a další
Vydáno: (2024)
Autor: Gero, Zelalem, a další
Vydáno: (2024)
A Survey of AI-generated Text Forensic Systems: Detection, Attribution, and Characterization
Autor: Kumarage, Tharindu, a další
Vydáno: (2024)
Autor: Kumarage, Tharindu, a další
Vydáno: (2024)
Same Meaning, Different Scores: Lexical and Syntactic Sensitivity in LLM Evaluation
Autor: Kostić, Bogdan, a další
Vydáno: (2026)
Autor: Kostić, Bogdan, a další
Vydáno: (2026)
Are Small Language Models Ready to Compete with Large Language Models for Practical Applications?
Autor: Sinha, Neelabh, a další
Vydáno: (2024)
Autor: Sinha, Neelabh, a další
Vydáno: (2024)
Born With a Silver Spoon? Investigating Socioeconomic Bias in Large Language Models
Autor: Singh, Smriti, a další
Vydáno: (2024)
Autor: Singh, Smriti, a další
Vydáno: (2024)
Mental Health Equity in LLMs: Leveraging Multi-Hop Question Answering to Detect Amplified and Silenced Perspectives
Autor: Haider, Batool, a další
Vydáno: (2025)
Autor: Haider, Batool, a další
Vydáno: (2025)
Meaning Is Not A Metric: Using LLMs to make cultural context legible at scale
Autor: Kommers, Cody, a další
Vydáno: (2025)
Autor: Kommers, Cody, a další
Vydáno: (2025)
A Comprehensive Survey of Accelerated Generation Techniques in Large Language Models
Autor: Khoshnoodi, Mahsa, a další
Vydáno: (2024)
Autor: Khoshnoodi, Mahsa, a další
Vydáno: (2024)
Epistemological Bias As a Means for the Automated Detection of Injustices in Text
Autor: Andrews, Kenya, a další
Vydáno: (2024)
Autor: Andrews, Kenya, a další
Vydáno: (2024)
Sticking to the Mean: Detecting Sticky Tokens in Text Embedding Models
Autor: Chen, Kexin, a další
Vydáno: (2025)
Autor: Chen, Kexin, a další
Vydáno: (2025)
Reconciling Methodological Paradigms: Employing Large Language Models as Novice Qualitative Research Assistants in Talent Management Research
Autor: Bhaduri, Sreyoshi, a další
Vydáno: (2024)
Autor: Bhaduri, Sreyoshi, a další
Vydáno: (2024)
Neural FOXP2 -- Language Specific Neuron Steering for Targeted Language Improvement in LLMs
Autor: Saha, Anusa, a další
Vydáno: (2026)
Autor: Saha, Anusa, a další
Vydáno: (2026)
Multilingual State Space Models for Structured Question Answering in Indic Languages
Autor: Vats, Arpita, a další
Vydáno: (2025)
Autor: Vats, Arpita, a další
Vydáno: (2025)
Evidence-backed Fact Checking using RAG and Few-Shot In-Context Learning with LLMs
Autor: Singhal, Ronit, a další
Vydáno: (2024)
Autor: Singhal, Ronit, a další
Vydáno: (2024)
Guiding Vision-Language Model Selection for Visual Question-Answering Across Tasks, Domains, and Knowledge Types
Autor: Sinha, Neelabh, a další
Vydáno: (2024)
Autor: Sinha, Neelabh, a další
Vydáno: (2024)
When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning
Autor: Sahoo, Subramanyam, a další
Vydáno: (2026)
Autor: Sahoo, Subramanyam, a další
Vydáno: (2026)
SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement
Autor: Sahoo, Subramanyam, a další
Vydáno: (2026)
Autor: Sahoo, Subramanyam, a další
Vydáno: (2026)
Beyond the Mean: Within-Model Reliable Change Detection for LLM Evaluation
Autor: Cacioli, Jon-Paul
Vydáno: (2026)
Autor: Cacioli, Jon-Paul
Vydáno: (2026)
The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness
Autor: Sahoo, Subramanyam, a další
Vydáno: (2026)
Autor: Sahoo, Subramanyam, a další
Vydáno: (2026)
CONSCIENTIA: Can LLM Agents Learn to Strategize? Emergent Deception and Trust in a Multi-Agent NYC Simulation
Autor: Sinha, Aarush, a další
Vydáno: (2026)
Autor: Sinha, Aarush, a další
Vydáno: (2026)
Hierarchical Prompting Taxonomy: A Universal Evaluation Framework for Large Language Models Aligned with Human Cognitive Principles
Autor: Budagam, Devichand, a další
Vydáno: (2024)
Autor: Budagam, Devichand, a další
Vydáno: (2024)
From Phonemes to Meaning: Evaluating Large Language Models on Tamil
Autor: Varsha, Jeyarajalingam, a další
Vydáno: (2025)
Autor: Varsha, Jeyarajalingam, a další
Vydáno: (2025)
Evaluation Metrics for Text Data Augmentation in NLP
Autor: Amadeus, Marcellus, a další
Vydáno: (2024)
Autor: Amadeus, Marcellus, a další
Vydáno: (2024)
Evaluating Metrics for Safety with LLM-as-Judges
Autor: Clegg, Kester, a další
Vydáno: (2025)
Autor: Clegg, Kester, a další
Vydáno: (2025)
ICR: Iterative Clarification and Rewriting for Conversational Search
Autor: Cao, Zhiyu, a další
Vydáno: (2025)
Autor: Cao, Zhiyu, a další
Vydáno: (2025)
PermaFrost-Attack: Stealth Pretraining Seeding(SPS) for planting Logic Landmines During LLM Training
Autor: Kumar, Harsh, a další
Vydáno: (2026)
Autor: Kumar, Harsh, a další
Vydáno: (2026)
Can LLMs Augment Low-Resource Reading Comprehension Datasets? Opportunities and Challenges
Autor: Samuel, Vinay, a další
Vydáno: (2023)
Autor: Samuel, Vinay, a další
Vydáno: (2023)
Beyond LLM-as-a-Judge: Deterministic Metrics for Multilingual Generative Text Evaluation
Autor: Alam, Firoj, a další
Vydáno: (2026)
Autor: Alam, Firoj, a další
Vydáno: (2026)
Exploring the Frontier of Vision-Language Models: A Survey of Current Methodologies and Future Directions
Autor: Ghosh, Akash, a další
Vydáno: (2024)
Autor: Ghosh, Akash, a další
Vydáno: (2024)
Does Reasoning Introduce Bias? A Study of Social Bias Evaluation and Mitigation in LLM Reasoning
Autor: Wu, Xuyang, a další
Vydáno: (2025)
Autor: Wu, Xuyang, a další
Vydáno: (2025)
Is my Meeting Summary Good? Estimating Quality with a Multi-LLM Evaluator
Autor: Kirstein, Frederic, a další
Vydáno: (2024)
Autor: Kirstein, Frederic, a další
Vydáno: (2024)
Podobné jednotky
-
Decoding the Diversity: A Review of the Indic AI Research Landscape
Autor: KJ, Sankalp, a další
Vydáno: (2024) -
Parameter Efficient Fine Tuning: A Comprehensive Analysis Across Applications
Autor: Balne, Charith Chandra Sai, a další
Vydáno: (2024) -
IndicMMLU-Pro: Benchmarking Indic Large Language Models on Multi-Task Language Understanding
Autor: KJ, Sankalp, a další
Vydáno: (2025) -
Potential and Perils of Large Language Models as Judges of Unstructured Textual Data
Autor: Bedemariam, Rewina, a další
Vydáno: (2025) -
Levers of Power in the Field of AI
Autor: Mackenzie, Tammy, a další
Vydáno: (2025)