:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Malyi, Max, Shek, Jonathan, McDonald, Alasdair, Biscaya, Andre
Natura:	Preprint
Pubblicazione:	2025
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2509.06813
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Exploratory Semantic Reliability Analysis of Wind Turbine Maintenance Logs using Large Language Models
di: Malyi, Max, et al.
Pubblicazione: (2025)

A Comparative Study on Large Language Models for Log Parsing
di: Astekin, Merve, et al.
Pubblicazione: (2024)

Analysis and Control of Acoustic Emissions from Marine Energy Converters
di: He, Jiaqin, et al.
Pubblicazione: (2025)

STOP! Benchmarking Large Language Models with Sensitivity Testing on Offensive Progressions
di: Morabito, Robert, et al.
Pubblicazione: (2024)

LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis
di: Cui, Tianyu, et al.
Pubblicazione: (2024)

SafeLLM: Domain-Specific Safety Monitoring for Large Language Models: A Case Study of Offshore Wind Maintenance
di: Walker, Connor, et al.
Pubblicazione: (2024)

Benchmarking the Pedagogical Knowledge of Large Language Models
di: Lelièvre, Maxime, et al.
Pubblicazione: (2025)

Trace-of-Thought Prompting: Investigating Prompt-Based Knowledge Distillation Through Question Decomposition
di: McDonald, Tyler, et al.
Pubblicazione: (2025)

Benchmarking Large Language Models for Calculus Problem-Solving: A Comparative Analysis
di: Moon, In Hak
Pubblicazione: (2025)

Improving Extraction of Clinical Event Contextual Properties from Electronic Health Records: A Comparative Study
di: Agarwal, Shubham, et al.
Pubblicazione: (2024)

Improve Large Language Model Systems with User Logs
di: Wang, Changyue, et al.
Pubblicazione: (2026)

Challenges and opportunities in portraying emotion in generated sign language
di: McDonald, John C., et al.
Pubblicazione: (2025)

Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records
di: Frayling, Erlend, et al.
Pubblicazione: (2024)

AdaptiveLog: An Adaptive Log Analysis Framework with the Collaboration of Large and Small Language Model
di: Ma, Lipeng, et al.
Pubblicazione: (2025)

Strategies for Span Labeling with Large Language Models
di: Semin, Danil, et al.
Pubblicazione: (2026)

Can We Afford The Perfect Prompt? Balancing Cost and Accuracy with the Economical Prompting Index
di: McDonald, Tyler, et al.
Pubblicazione: (2024)

A Comparative Study of Translation Bias and Accuracy in Multilingual Large Language Models for Cross-Language Claim Verification
di: Singhal, Aryan, et al.
Pubblicazione: (2024)

NYT-Connections: A Deceptively Simple Text Classification Task that Stumps System-1 Thinkers
di: Lopez, Angel Yahir Loredo, et al.
Pubblicazione: (2024)

WinoQueer: A Community-in-the-Loop Benchmark for Anti-LGBTQ+ Bias in Large Language Models
di: Felkner, Virginia K., et al.
Pubblicazione: (2023)

Adapting Large Language Models for Parameter-Efficient Log Anomaly Detection
di: Lim, Ying Fu, et al.
Pubblicazione: (2025)

Adapting Large Language Models to Log Analysis with Interpretable Domain Knowledge
di: Ji, Yuhe, et al.
Pubblicazione: (2024)

Mitigating Label Length Bias in Large Language Models
di: Sanz-Guerrero, Mario, et al.
Pubblicazione: (2025)

A Survey on Large Language Model Benchmarks
di: Ni, Shiwen, et al.
Pubblicazione: (2025)

Sparse Rewards Can Self-Train Dialogue Agents
di: Lattimer, Barrett Martin, et al.
Pubblicazione: (2024)

Normative Reasoning in Large Language Models: A Comparative Benchmark from Logical and Modal Perspectives
di: Ozeki, Kentaro, et al.
Pubblicazione: (2025)

A Concept-Based Explainability Framework for Large Multimodal Models
di: Parekh, Jayneel, et al.
Pubblicazione: (2024)

Temporal Fact Conflicts in LLMs: Reproducibility Insights from Unifying DYNAMICQA and MULAN
di: Dey, Ritajit, et al.
Pubblicazione: (2026)

Two Directions for Clinical Data Generation with Large Language Models: Data-to-Label and Label-to-Data
di: Li, Rumeng, et al.
Pubblicazione: (2023)

Interpretable Online Log Analysis Using Large Language Models with Prompt Strategies
di: Liu, Yilun, et al.
Pubblicazione: (2023)

Large Language Models Do Multi-Label Classification Differently
di: Ma, Marcus, et al.
Pubblicazione: (2025)

Large Language Models for Patient Comments Multi-Label Classification
di: Sakai, Hajar, et al.
Pubblicazione: (2024)

BenchmarkCards: Standardized Documentation for Large Language Model Benchmarks
di: Sokol, Anna, et al.
Pubblicazione: (2024)

NSMQ Riddles: A Benchmark of Scientific and Mathematical Riddles for Quizzing Large Language Models
di: Boateng, George, et al.
Pubblicazione: (2026)

Comparative Analysis of Large Language Models in Healthcare
di: Santhosh, Subin, et al.
Pubblicazione: (2026)

When Benchmarks Age: Temporal Misalignment through Large Language Model Factuality Evaluation
di: Jiang, Xunyi, et al.
Pubblicazione: (2025)

Searching for Structure: Investigating Emergent Communication with Large Language Models
di: Kouwenhoven, Tom, et al.
Pubblicazione: (2024)

Progressively Label Enhancement for Large Language Model Alignment
di: Liu, Biao, et al.
Pubblicazione: (2024)

Estonian Native Large Language Model Benchmark
di: Lillepalu, Helena Grete, et al.
Pubblicazione: (2025)

Benchmarking Linguistic Diversity of Large Language Models
di: Guo, Yanzhu, et al.
Pubblicazione: (2024)

Traces of Social Competence in Large Language Models
di: Kouwenhoven, Tom, et al.
Pubblicazione: (2026)