Salvato in:
| Autori principali: | Ananthamurugan, Nirupan, Duong, Dat, George, Philip, Gupta, Ankita, Tata, Sandeep, Gunel, Beliz |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2404.15565 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
SUMIE: A Synthetic Benchmark for Incremental Entity Summarization
di: Hwang, Eunjeong, et al.
Pubblicazione: (2024)
di: Hwang, Eunjeong, et al.
Pubblicazione: (2024)
STRUM-LLM: Attributed and Structured Contrastive Summarization
di: Gunel, Beliz, et al.
Pubblicazione: (2024)
di: Gunel, Beliz, et al.
Pubblicazione: (2024)
Enhancing Incremental Summarization with Structured Representations
di: Hwang, EunJeong, et al.
Pubblicazione: (2024)
di: Hwang, EunJeong, et al.
Pubblicazione: (2024)
PRISM: Efficient Long-Range Reasoning With Short-Context LLMs
di: Jayalath, Dulhan, et al.
Pubblicazione: (2024)
di: Jayalath, Dulhan, et al.
Pubblicazione: (2024)
Predicting Task Performance with Context-aware Scaling Laws
di: Montgomery, Kyle, et al.
Pubblicazione: (2025)
di: Montgomery, Kyle, et al.
Pubblicazione: (2025)
An Automated Length-Aware Quality Metric for Summarization
di: Foland, Andrew D.
Pubblicazione: (2025)
di: Foland, Andrew D.
Pubblicazione: (2025)
APPLS: Evaluating Evaluation Metrics for Plain Language Summarization
di: Guo, Yue, et al.
Pubblicazione: (2023)
di: Guo, Yue, et al.
Pubblicazione: (2023)
Calibrating Model-Based Evaluation Metrics for Summarization
di: Liu, Hongye, et al.
Pubblicazione: (2026)
di: Liu, Hongye, et al.
Pubblicazione: (2026)
Q-STRUM Debate: Query-Driven Contrastive Summarization for Recommendation Comparison
di: Saad, George-Kirollos, et al.
Pubblicazione: (2025)
di: Saad, George-Kirollos, et al.
Pubblicazione: (2025)
MLAN: Language-Based Instruction Tuning Preserves and Transfers Knowledge in Multimodal Language Models
di: Tu, Jianhong, et al.
Pubblicazione: (2024)
di: Tu, Jianhong, et al.
Pubblicazione: (2024)
What's under the hood: Investigating Automatic Metrics on Meeting Summarization
di: Kirstein, Frederic, et al.
Pubblicazione: (2024)
di: Kirstein, Frederic, et al.
Pubblicazione: (2024)
DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis
di: Patel, Liana, et al.
Pubblicazione: (2025)
di: Patel, Liana, et al.
Pubblicazione: (2025)
Rethinking Scientific Summarization Evaluation: Grounding Explainable Metrics on Facet-aware Benchmark
di: Chen, Xiuying, et al.
Pubblicazione: (2024)
di: Chen, Xiuying, et al.
Pubblicazione: (2024)
Beyond N-Grams: Rethinking Evaluation Metrics and Strategies for Multilingual Abstractive Summarization
di: Mondshine, Itai, et al.
Pubblicazione: (2025)
di: Mondshine, Itai, et al.
Pubblicazione: (2025)
Discrete Diffusion Language Model for Efficient Text Summarization
di: Dat, Do Huu, et al.
Pubblicazione: (2024)
di: Dat, Do Huu, et al.
Pubblicazione: (2024)
Revisiting Metric Reliability for Fine-grained Evaluation of Machine Translation and Summarization in Indian Languages
di: Yari, Amir Hossein, et al.
Pubblicazione: (2025)
di: Yari, Amir Hossein, et al.
Pubblicazione: (2025)
ContrastScore: Towards Higher Quality, Less Biased, More Efficient Evaluation Metrics with Contrastive Evaluation
di: Wang, Xiao, et al.
Pubblicazione: (2025)
di: Wang, Xiao, et al.
Pubblicazione: (2025)
Faithful Model Evaluation for Model-Based Metrics
di: Goyal, Palash, et al.
Pubblicazione: (2023)
di: Goyal, Palash, et al.
Pubblicazione: (2023)
PlainQAFact: Retrieval-augmented Factual Consistency Evaluation Metric for Biomedical Plain Language Summarization
di: You, Zhiwen, et al.
Pubblicazione: (2025)
di: You, Zhiwen, et al.
Pubblicazione: (2025)
Enhancing Argument Summarization: Prioritizing Exhaustiveness in Key Point Generation and Introducing an Automatic Coverage Evaluation Metric
di: Khosravani, Mohammad, et al.
Pubblicazione: (2024)
di: Khosravani, Mohammad, et al.
Pubblicazione: (2024)
Mitigating the Impact of Reference Quality on Evaluation of Summarization Systems with Reference-Free Metrics
di: Gigant, Théo, et al.
Pubblicazione: (2024)
di: Gigant, Théo, et al.
Pubblicazione: (2024)
Iterative Augmentation with Summarization Refinement (IASR) Evaluation for Unstructured Survey data Modeling and Analysis
di: Bhattad, Payal, et al.
Pubblicazione: (2025)
di: Bhattad, Payal, et al.
Pubblicazione: (2025)
Medical Question Summarization with Entity-driven Contrastive Learning
di: Lu, Wenpeng, et al.
Pubblicazione: (2023)
di: Lu, Wenpeng, et al.
Pubblicazione: (2023)
Evaluating Metrics for Bias in Word Embeddings
di: Schröder, Sarah, et al.
Pubblicazione: (2021)
di: Schröder, Sarah, et al.
Pubblicazione: (2021)
Medalyze: Lightweight Medical Report Summarization Application Using FLAN-T5-Large
di: Nguyen, Van-Tinh, et al.
Pubblicazione: (2025)
di: Nguyen, Van-Tinh, et al.
Pubblicazione: (2025)
An Analysis on Automated Metrics for Evaluating Japanese-English Chat Translation
di: Rusli, Andre, et al.
Pubblicazione: (2024)
di: Rusli, Andre, et al.
Pubblicazione: (2024)
NovAScore: A New Automated Metric for Evaluating Document Level Novelty
di: Ai, Lin, et al.
Pubblicazione: (2024)
di: Ai, Lin, et al.
Pubblicazione: (2024)
Improving Factual Consistency of News Summarization by Contrastive Preference Optimization
di: Feng, Huawen, et al.
Pubblicazione: (2023)
di: Feng, Huawen, et al.
Pubblicazione: (2023)
ClozeMath: Improving Mathematical Reasoning in Language Models by Learning to Fill Equations
di: Pham, Quang Hieu, et al.
Pubblicazione: (2025)
di: Pham, Quang Hieu, et al.
Pubblicazione: (2025)
A Dataset and Benchmark for Consumer Healthcare Question Summarization
di: Basu, Abhishek, et al.
Pubblicazione: (2025)
di: Basu, Abhishek, et al.
Pubblicazione: (2025)
BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations
di: Gupta, Deepak, et al.
Pubblicazione: (2026)
di: Gupta, Deepak, et al.
Pubblicazione: (2026)
SteerEval: Inference-time Interventions Strengthen Multilingual Generalization in Neural Summarization Metrics
di: Casola, Silvia, et al.
Pubblicazione: (2026)
di: Casola, Silvia, et al.
Pubblicazione: (2026)
Moneyball with LLMs: Analyzing Tabular Summarization in Sports Narratives
di: Upadhyay, Ritam, et al.
Pubblicazione: (2025)
di: Upadhyay, Ritam, et al.
Pubblicazione: (2025)
Legal Document Summarization: Enhancing Judicial Efficiency through Automation Detection
di: Li, Yongjie, et al.
Pubblicazione: (2025)
di: Li, Yongjie, et al.
Pubblicazione: (2025)
Stress Testing Factual Consistency Metrics for Long-Document Summarization
di: Mujahid, Zain Muhammad, et al.
Pubblicazione: (2025)
di: Mujahid, Zain Muhammad, et al.
Pubblicazione: (2025)
Leveraging LLM For Synchronizing Information Across Multilingual Tables
di: Khincha, Siddharth, et al.
Pubblicazione: (2025)
di: Khincha, Siddharth, et al.
Pubblicazione: (2025)
What do the metrics mean? A critical analysis of the use of Automated Evaluation Metrics in Interpreting
di: Downie, Jonathan, et al.
Pubblicazione: (2026)
di: Downie, Jonathan, et al.
Pubblicazione: (2026)
CROC: Evaluating and Training T2I Metrics with Pseudo- and Human-Labeled Contrastive Robustness Checks
di: Leiter, Christoph, et al.
Pubblicazione: (2025)
di: Leiter, Christoph, et al.
Pubblicazione: (2025)
STORYSUMM: Evaluating Faithfulness in Story Summarization
di: Subbiah, Melanie, et al.
Pubblicazione: (2024)
di: Subbiah, Melanie, et al.
Pubblicazione: (2024)
AdvSumm: Adversarial Training for Bias Mitigation in Text Summarization
di: Gupta, Mukur, et al.
Pubblicazione: (2025)
di: Gupta, Mukur, et al.
Pubblicazione: (2025)
Documenti analoghi
-
SUMIE: A Synthetic Benchmark for Incremental Entity Summarization
di: Hwang, Eunjeong, et al.
Pubblicazione: (2024) -
STRUM-LLM: Attributed and Structured Contrastive Summarization
di: Gunel, Beliz, et al.
Pubblicazione: (2024) -
Enhancing Incremental Summarization with Structured Representations
di: Hwang, EunJeong, et al.
Pubblicazione: (2024) -
PRISM: Efficient Long-Range Reasoning With Short-Context LLMs
di: Jayalath, Dulhan, et al.
Pubblicazione: (2024) -
Predicting Task Performance with Context-aware Scaling Laws
di: Montgomery, Kyle, et al.
Pubblicazione: (2025)