:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Ananthamurugan, Nirupan, Duong, Dat, George, Philip, Gupta, Ankita, Tata, Sandeep, Gunel, Beliz
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language
Accesso online:	https://arxiv.org/abs/2404.15565
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

SUMIE: A Synthetic Benchmark for Incremental Entity Summarization
di: Hwang, Eunjeong, et al.
Pubblicazione: (2024)

STRUM-LLM: Attributed and Structured Contrastive Summarization
di: Gunel, Beliz, et al.
Pubblicazione: (2024)

Enhancing Incremental Summarization with Structured Representations
di: Hwang, EunJeong, et al.
Pubblicazione: (2024)

PRISM: Efficient Long-Range Reasoning With Short-Context LLMs
di: Jayalath, Dulhan, et al.
Pubblicazione: (2024)

Predicting Task Performance with Context-aware Scaling Laws
di: Montgomery, Kyle, et al.
Pubblicazione: (2025)

An Automated Length-Aware Quality Metric for Summarization
di: Foland, Andrew D.
Pubblicazione: (2025)

APPLS: Evaluating Evaluation Metrics for Plain Language Summarization
di: Guo, Yue, et al.
Pubblicazione: (2023)

Calibrating Model-Based Evaluation Metrics for Summarization
di: Liu, Hongye, et al.
Pubblicazione: (2026)

Q-STRUM Debate: Query-Driven Contrastive Summarization for Recommendation Comparison
di: Saad, George-Kirollos, et al.
Pubblicazione: (2025)

MLAN: Language-Based Instruction Tuning Preserves and Transfers Knowledge in Multimodal Language Models
di: Tu, Jianhong, et al.
Pubblicazione: (2024)

What's under the hood: Investigating Automatic Metrics on Meeting Summarization
di: Kirstein, Frederic, et al.
Pubblicazione: (2024)

DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis
di: Patel, Liana, et al.
Pubblicazione: (2025)

Rethinking Scientific Summarization Evaluation: Grounding Explainable Metrics on Facet-aware Benchmark
di: Chen, Xiuying, et al.
Pubblicazione: (2024)

Beyond N-Grams: Rethinking Evaluation Metrics and Strategies for Multilingual Abstractive Summarization
di: Mondshine, Itai, et al.
Pubblicazione: (2025)

Discrete Diffusion Language Model for Efficient Text Summarization
di: Dat, Do Huu, et al.
Pubblicazione: (2024)

Revisiting Metric Reliability for Fine-grained Evaluation of Machine Translation and Summarization in Indian Languages
di: Yari, Amir Hossein, et al.
Pubblicazione: (2025)

ContrastScore: Towards Higher Quality, Less Biased, More Efficient Evaluation Metrics with Contrastive Evaluation
di: Wang, Xiao, et al.
Pubblicazione: (2025)

Faithful Model Evaluation for Model-Based Metrics
di: Goyal, Palash, et al.
Pubblicazione: (2023)

PlainQAFact: Retrieval-augmented Factual Consistency Evaluation Metric for Biomedical Plain Language Summarization
di: You, Zhiwen, et al.
Pubblicazione: (2025)

Enhancing Argument Summarization: Prioritizing Exhaustiveness in Key Point Generation and Introducing an Automatic Coverage Evaluation Metric
di: Khosravani, Mohammad, et al.
Pubblicazione: (2024)

Mitigating the Impact of Reference Quality on Evaluation of Summarization Systems with Reference-Free Metrics
di: Gigant, Théo, et al.
Pubblicazione: (2024)

Iterative Augmentation with Summarization Refinement (IASR) Evaluation for Unstructured Survey data Modeling and Analysis
di: Bhattad, Payal, et al.
Pubblicazione: (2025)

Medical Question Summarization with Entity-driven Contrastive Learning
di: Lu, Wenpeng, et al.
Pubblicazione: (2023)

Evaluating Metrics for Bias in Word Embeddings
di: Schröder, Sarah, et al.
Pubblicazione: (2021)

Medalyze: Lightweight Medical Report Summarization Application Using FLAN-T5-Large
di: Nguyen, Van-Tinh, et al.
Pubblicazione: (2025)

An Analysis on Automated Metrics for Evaluating Japanese-English Chat Translation
di: Rusli, Andre, et al.
Pubblicazione: (2024)

NovAScore: A New Automated Metric for Evaluating Document Level Novelty
di: Ai, Lin, et al.
Pubblicazione: (2024)

Improving Factual Consistency of News Summarization by Contrastive Preference Optimization
di: Feng, Huawen, et al.
Pubblicazione: (2023)

ClozeMath: Improving Mathematical Reasoning in Language Models by Learning to Fill Equations
di: Pham, Quang Hieu, et al.
Pubblicazione: (2025)

A Dataset and Benchmark for Consumer Healthcare Question Summarization
di: Basu, Abhishek, et al.
Pubblicazione: (2025)

BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations
di: Gupta, Deepak, et al.
Pubblicazione: (2026)

SteerEval: Inference-time Interventions Strengthen Multilingual Generalization in Neural Summarization Metrics
di: Casola, Silvia, et al.
Pubblicazione: (2026)

Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
di: Upadhyay, Ritam, et al.
Pubblicazione: (2025)

Legal Document Summarization: Enhancing Judicial Efficiency through Automation Detection
di: Li, Yongjie, et al.
Pubblicazione: (2025)

Stress Testing Factual Consistency Metrics for Long-Document Summarization
di: Mujahid, Zain Muhammad, et al.
Pubblicazione: (2025)

Leveraging LLM For Synchronizing Information Across Multilingual Tables
di: Khincha, Siddharth, et al.
Pubblicazione: (2025)

What do the metrics mean? A critical analysis of the use of Automated Evaluation Metrics in Interpreting
di: Downie, Jonathan, et al.
Pubblicazione: (2026)

CROC: Evaluating and Training T2I Metrics with Pseudo- and Human-Labeled Contrastive Robustness Checks
di: Leiter, Christoph, et al.
Pubblicazione: (2025)

STORYSUMM: Evaluating Faithfulness in Story Summarization
di: Subbiah, Melanie, et al.
Pubblicazione: (2024)

AdvSumm: Adversarial Training for Bias Mitigation in Text Summarization
di: Gupta, Mukur, et al.
Pubblicazione: (2025)