Salvato in:
| Autori principali: | Huang, Yu-Shiang, Wang, Chuan-Ju, Chen, Chung-Chi |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2025
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2507.01923 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
FinNuE: Exposing the Risks of Using BERTScore for Numerical Semantic Evaluation in Finance
di: Huang, Yu-Shiang, et al.
Pubblicazione: (2025)
di: Huang, Yu-Shiang, et al.
Pubblicazione: (2025)
Financial Risk Relation Identification through Dual-view Adaptation
di: Chiu, Wei-Ning, et al.
Pubblicazione: (2025)
di: Chiu, Wei-Ning, et al.
Pubblicazione: (2025)
Reliable Decision Support with LLMs: A Framework for Evaluating Consistency in Binary Text Classification Applications
di: Megahed, Fadel M., et al.
Pubblicazione: (2025)
di: Megahed, Fadel M., et al.
Pubblicazione: (2025)
Evaluating Large Language Models as Expert Annotators
di: Tseng, Yu-Min, et al.
Pubblicazione: (2025)
di: Tseng, Yu-Min, et al.
Pubblicazione: (2025)
The Impact and Feasibility of Self-Confidence Shaping for AI-Assisted Decision-Making
di: Takayanagi, Takehiro, et al.
Pubblicazione: (2025)
di: Takayanagi, Takehiro, et al.
Pubblicazione: (2025)
Beyond Turing Test: Can GPT-4 Sway Experts' Decisions?
di: Takayanagi, Takehiro, et al.
Pubblicazione: (2024)
di: Takayanagi, Takehiro, et al.
Pubblicazione: (2024)
GADFA: Generator-Assisted Decision-Focused Approach for Opinion Expressing Timing Identification
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
From Facts to Insights: A Study on the Generation and Evaluation of Analytical Reports for Deciphering Earnings Calls
di: Goldsack, Tomas, et al.
Pubblicazione: (2024)
di: Goldsack, Tomas, et al.
Pubblicazione: (2024)
Distilling Analysis from Generative Models for Investment Decisions
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
AgentEHR: Advancing Autonomous Clinical Decision-Making via Retrospective Summarization
di: Liao, Yusheng, et al.
Pubblicazione: (2026)
di: Liao, Yusheng, et al.
Pubblicazione: (2026)
Text2MDT: Extracting Medical Decision Trees from Medical Texts
di: Zhu, Wei, et al.
Pubblicazione: (2024)
di: Zhu, Wei, et al.
Pubblicazione: (2024)
Decision-Oriented Dialogue for Human-AI Collaboration
di: Lin, Jessy, et al.
Pubblicazione: (2023)
di: Lin, Jessy, et al.
Pubblicazione: (2023)
Modeling Professionalism in Expert Questioning through Linguistic Differentiation
di: D'Agostino, Giulia, et al.
Pubblicazione: (2025)
di: D'Agostino, Giulia, et al.
Pubblicazione: (2025)
RAVEL: Reasoning Agents for Validating and Evaluating LLM Text Synthesis
di: Feng, Andrew Zhuoer, et al.
Pubblicazione: (2026)
di: Feng, Andrew Zhuoer, et al.
Pubblicazione: (2026)
Commitment Checklist: Auditing Author Commitments in Peer Review
di: Chen, Chung-Chi, et al.
Pubblicazione: (2026)
di: Chen, Chung-Chi, et al.
Pubblicazione: (2026)
DEE: Dual-stage Explainable Evaluation Method for Text Generation
di: Zhang, Shenyu, et al.
Pubblicazione: (2024)
di: Zhang, Shenyu, et al.
Pubblicazione: (2024)
FineWeb-zhtw: Scalable Curation of Traditional Chinese Text Data from the Web
di: Lin, Cheng-Wei, et al.
Pubblicazione: (2024)
di: Lin, Cheng-Wei, et al.
Pubblicazione: (2024)
Co-Trained Retriever-Generator Framework for Question Generation in Earnings Calls
di: Juan, Yining, et al.
Pubblicazione: (2024)
di: Juan, Yining, et al.
Pubblicazione: (2024)
Why Expert Alignment Is Hard: Evidence from Subjective Evaluation
di: Lin, Tzu-Mi, et al.
Pubblicazione: (2026)
di: Lin, Tzu-Mi, et al.
Pubblicazione: (2026)
Wizard of Shopping: Target-Oriented E-commerce Dialogue Generation with Decision Tree Branching
di: Li, Xiangci, et al.
Pubblicazione: (2025)
di: Li, Xiangci, et al.
Pubblicazione: (2025)
AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game
di: Chi, Yizhou, et al.
Pubblicazione: (2024)
di: Chi, Yizhou, et al.
Pubblicazione: (2024)
From Legal Text to Executable Decision Models: Evaluating Structured Representations for Legal Decision Model Generation
di: Graus, David
Pubblicazione: (2026)
di: Graus, David
Pubblicazione: (2026)
TextBandit: Evaluating Probabilistic Reasoning in LLMs Through Language-Only Decision Tasks
di: Lim, Jimin, et al.
Pubblicazione: (2025)
di: Lim, Jimin, et al.
Pubblicazione: (2025)
Writing Like the Best: Exemplar-Based Expository Text Generation
di: Liu, Yuxiang, et al.
Pubblicazione: (2025)
di: Liu, Yuxiang, et al.
Pubblicazione: (2025)
Are Expert-Level Language Models Expert-Level Annotators?
di: Tseng, Yu-Min, et al.
Pubblicazione: (2024)
di: Tseng, Yu-Min, et al.
Pubblicazione: (2024)
Diagnosing Model Editing via Knowledge Spectrum
di: Pan, Tsung-Hsuan, et al.
Pubblicazione: (2025)
di: Pan, Tsung-Hsuan, et al.
Pubblicazione: (2025)
Pre-Finetuning with Impact Duration Awareness for Stock Movement Prediction
di: Chiu, Chr-Jr, et al.
Pubblicazione: (2024)
di: Chiu, Chr-Jr, et al.
Pubblicazione: (2024)
"Why" Has the Least Side Effect on Model Editing
di: Pan, Tsung-Hsuan, et al.
Pubblicazione: (2024)
di: Pan, Tsung-Hsuan, et al.
Pubblicazione: (2024)
Refining Financial Consumer Complaints through Multi-Scale Model Interaction
di: Chen, Bo-Wei, et al.
Pubblicazione: (2025)
di: Chen, Bo-Wei, et al.
Pubblicazione: (2025)
Confidence-Driven Multi-Scale Model Selection for Cost-Efficient Inference
di: Chen, Bo-Wei, et al.
Pubblicazione: (2026)
di: Chen, Bo-Wei, et al.
Pubblicazione: (2026)
Paraphrase-Aligned Machine Translation
di: Chang, Ke-Ching, et al.
Pubblicazione: (2024)
di: Chang, Ke-Ching, et al.
Pubblicazione: (2024)
Rehearsing Answers to Probable Questions with Perspective-Taking
di: Shih, Yung-Yu, et al.
Pubblicazione: (2024)
di: Shih, Yung-Yu, et al.
Pubblicazione: (2024)
First Activations Matter: Training-Free Methods for Dynamic Activation in Large Language Models
di: Ma, Chi, et al.
Pubblicazione: (2024)
di: Ma, Chi, et al.
Pubblicazione: (2024)
Enhancing Short-Text Topic Modeling with LLM-Driven Context Expansion and Prefix-Tuned VAEs
di: Akash, Pritom Saha, et al.
Pubblicazione: (2024)
di: Akash, Pritom Saha, et al.
Pubblicazione: (2024)
OOP: Object-Oriented Programming Evaluation Benchmark for Large Language Models
di: Wang, Shuai, et al.
Pubblicazione: (2024)
di: Wang, Shuai, et al.
Pubblicazione: (2024)
Evaluating Large Language Model with Knowledge Oriented Language Specific Simple Question Answering
di: Jiang, Bowen, et al.
Pubblicazione: (2025)
di: Jiang, Bowen, et al.
Pubblicazione: (2025)
Hierarchical Organization Simulacra in the Investment Sector
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
Enhancing Financial Sentiment Analysis with Expert-Designed Hint
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
Safety-Oriented Evaluation of Language Understanding Systems for Air Traffic Control
di: Chang, Yujing, et al.
Pubblicazione: (2026)
di: Chang, Yujing, et al.
Pubblicazione: (2026)
Enhancing Investment Opinion Ranking through Argument-Based Sentiment Analysis
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
di: Chen, Chung-Chi, et al.
Pubblicazione: (2024)
Documenti analoghi
-
FinNuE: Exposing the Risks of Using BERTScore for Numerical Semantic Evaluation in Finance
di: Huang, Yu-Shiang, et al.
Pubblicazione: (2025) -
Financial Risk Relation Identification through Dual-view Adaptation
di: Chiu, Wei-Ning, et al.
Pubblicazione: (2025) -
Reliable Decision Support with LLMs: A Framework for Evaluating Consistency in Binary Text Classification Applications
di: Megahed, Fadel M., et al.
Pubblicazione: (2025) -
Evaluating Large Language Models as Expert Annotators
di: Tseng, Yu-Min, et al.
Pubblicazione: (2025) -
The Impact and Feasibility of Self-Confidence Shaping for AI-Assisted Decision-Making
di: Takayanagi, Takehiro, et al.
Pubblicazione: (2025)