Gespeichert in:
| Hauptverfasser: | Wang, Zhichao, Bi, Bin, Huang, Can, Pentyala, Shiva Kumar, Zhu, Zixu James, Asur, Sitaram, Cheng, Na Claire, Wan, Cheng, Nie, Dong, Hong, Lingzi |
|---|---|
| Format: | Preprint |
| Veröffentlicht: |
2024
|
| Schlagworte: | |
| Online-Zugang: | https://arxiv.org/abs/2408.15339 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Ähnliche Einträge
PAFT: A Parallel Training Paradigm for Effective LLM Fine-Tuning
von: Pentyala, Shiva Kumar, et al.
Veröffentlicht: (2024)
von: Pentyala, Shiva Kumar, et al.
Veröffentlicht: (2024)
Reinforcement Learning for LLM Post-Training: A Survey
von: Wang, Zhichao, et al.
Veröffentlicht: (2024)
von: Wang, Zhichao, et al.
Veröffentlicht: (2024)
Diversity Enhances an LLM's Performance in RAG and Long-context Task
von: Wang, Zhichao, et al.
Veröffentlicht: (2025)
von: Wang, Zhichao, et al.
Veröffentlicht: (2025)
UFT: Unifying Fine-Tuning of SFT and RLHF/DPO/UNA through a Generalized Implicit Reward Function
von: Wang, Zhichao, et al.
Veröffentlicht: (2024)
von: Wang, Zhichao, et al.
Veröffentlicht: (2024)
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models
von: Hsu, Aliyah R., et al.
Veröffentlicht: (2024)
von: Hsu, Aliyah R., et al.
Veröffentlicht: (2024)
Review of Inference-Time Scaling Strategies: Reasoning, Search and RAG
von: Wang, Zhichao, et al.
Veröffentlicht: (2025)
von: Wang, Zhichao, et al.
Veröffentlicht: (2025)
FeedbackLLM: Metadata driven Multi-Agentic Language Agnostic Test Case Generator with Evolving prompt and Coverage Feedback
von: Jasti, Kushal, et al.
Veröffentlicht: (2026)
von: Jasti, Kushal, et al.
Veröffentlicht: (2026)
Mutation invariants of cluster algebras of rank 2
von: Chen, Zhichao, et al.
Veröffentlicht: (2024)
von: Chen, Zhichao, et al.
Veröffentlicht: (2024)
A cluster theory approach from mutation invariants to Diophantine equations
von: Chen, Zhichao, et al.
Veröffentlicht: (2025)
von: Chen, Zhichao, et al.
Veröffentlicht: (2025)
Turning Conversations into Workflows: A Framework to Extract and Evaluate Dialog Workflows for Service AI Agents
von: Choubey, Prafulla Kumar, et al.
Veröffentlicht: (2025)
von: Choubey, Prafulla Kumar, et al.
Veröffentlicht: (2025)
The Importance of Directional Feedback for LLM-based Optimizers
von: Nie, Allen, et al.
Veröffentlicht: (2024)
von: Nie, Allen, et al.
Veröffentlicht: (2024)
CultureLLM: Incorporating Cultural Differences into Large Language Models
von: Li, Cheng, et al.
Veröffentlicht: (2024)
von: Li, Cheng, et al.
Veröffentlicht: (2024)
M5 -- A Diverse Benchmark to Assess the Performance of Large Multimodal Models Across Multilingual and Multicultural Vision-Language Tasks
von: Schneider, Florian, et al.
Veröffentlicht: (2024)
von: Schneider, Florian, et al.
Veröffentlicht: (2024)
A multi-phase-field model for fiber-reinforced composite laminates based on puck failure theory
von: Kumar, Pavan Kumar Asur Vijaya, et al.
Veröffentlicht: (2026)
von: Kumar, Pavan Kumar Asur Vijaya, et al.
Veröffentlicht: (2026)
Toward measuring data literacy for higher education: Developing and validating a data literacy self‐efficacy scale
von: Jeonghyun Kim, et al.
Veröffentlicht: (2024)
von: Jeonghyun Kim, et al.
Veröffentlicht: (2024)
Q-realign: Piggybacking Realignment on Quantization for Safe and Efficient LLM Deployment
von: Tan, Qitao, et al.
Veröffentlicht: (2026)
von: Tan, Qitao, et al.
Veröffentlicht: (2026)
A Unified Framework and Dataset for Assessing Societal Bias in Vision-Language Models
von: Sathe, Ashutosh, et al.
Veröffentlicht: (2024)
von: Sathe, Ashutosh, et al.
Veröffentlicht: (2024)
DxHF: Providing High-Quality Human Feedback for LLM Alignment via Interactive Decomposition
von: Shi, Danqing, et al.
Veröffentlicht: (2025)
von: Shi, Danqing, et al.
Veröffentlicht: (2025)
INT: Instance-Specific Negative Mining for Task-Generic Promptable Segmentation
von: Hu, Jian, et al.
Veröffentlicht: (2025)
von: Hu, Jian, et al.
Veröffentlicht: (2025)
Grounding Video Reasoning in Physical Signals
von: Osmanli, Alibay, et al.
Veröffentlicht: (2026)
von: Osmanli, Alibay, et al.
Veröffentlicht: (2026)
TCMA: Text-Conditioned Multi-granularity Alignment for Drone Cross-Modal Text-Video Retrieval
von: Zhao, Zixu, et al.
Veröffentlicht: (2025)
von: Zhao, Zixu, et al.
Veröffentlicht: (2025)
Fluent but Foreign: Even Regional LLMs Lack Cultural Alignment
von: Agarwal, Dhruv, et al.
Veröffentlicht: (2025)
von: Agarwal, Dhruv, et al.
Veröffentlicht: (2025)
Trace is the Next AutoDiff: Generative Optimization with Rich Feedback, Execution Traces, and LLMs
von: Cheng, Ching-An, et al.
Veröffentlicht: (2024)
von: Cheng, Ching-An, et al.
Veröffentlicht: (2024)
Bayesimax Theory: Selecting Priors by Minimizing Total Information
von: Vangala, Sitaram
Veröffentlicht: (2025)
von: Vangala, Sitaram
Veröffentlicht: (2025)
Unified Mechanical Erosion Model for Multi-phase Mass Flows
von: Pudasaini, Shiva P.
Veröffentlicht: (2022)
von: Pudasaini, Shiva P.
Veröffentlicht: (2022)
Multifeature Fusion for Enhanced Content‐Based Image Retrieval Across Diverse Data Types
von: Punit Soni, et al.
Veröffentlicht: (2025)
von: Punit Soni, et al.
Veröffentlicht: (2025)
"Personal Portfolio Builder Using MERN Stack With AI Integration"
von: Kalva, Ajay Kumar, et al.
Veröffentlicht: (2025)
von: Kalva, Ajay Kumar, et al.
Veröffentlicht: (2025)
Incremental Summarization for Customer Support via Progressive Note-Taking and Agent Feedback
von: Wu, Yisha, et al.
Veröffentlicht: (2025)
von: Wu, Yisha, et al.
Veröffentlicht: (2025)
Unified Emergence of Gauge Symmetries and Quantum Phenomena from Volume-Preserving Dynamics in the Golden-Rhombohedral Vacuum
von: Meucci, Shiva
Veröffentlicht: (2025)
von: Meucci, Shiva
Veröffentlicht: (2025)
Synergistic Effects of Knowledge Distillation and Structured Pruning for Self-Supervised Speech Models
von: C, Shiva Kumar, et al.
Veröffentlicht: (2025)
von: C, Shiva Kumar, et al.
Veröffentlicht: (2025)
Secure Cross-Silo Synthetic Genomic Data Generation
von: Filienko, Daniil, et al.
Veröffentlicht: (2026)
von: Filienko, Daniil, et al.
Veröffentlicht: (2026)
Numerical study of unsteady bioconvective transport of oxytactic microorganisms over a stretching cone
von: Pentyala Srinivasa Rao, et al.
Veröffentlicht: (2025)
von: Pentyala Srinivasa Rao, et al.
Veröffentlicht: (2025)
CaPS: Collaborative and Private Synthetic Data Generation from Distributed Sources
von: Pentyala, Sikha, et al.
Veröffentlicht: (2024)
von: Pentyala, Sikha, et al.
Veröffentlicht: (2024)
Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning
von: Pang, Jinlong, et al.
Veröffentlicht: (2025)
von: Pang, Jinlong, et al.
Veröffentlicht: (2025)
Outcome-Constrained Large Language Models for Countering Hate Speech
von: Hong, Lingzi, et al.
Veröffentlicht: (2024)
von: Hong, Lingzi, et al.
Veröffentlicht: (2024)
Assessing the Human Likeness of AI-Generated Counterspeech
von: Song, Xiaoying, et al.
Veröffentlicht: (2024)
von: Song, Xiaoying, et al.
Veröffentlicht: (2024)
Nostalgia on Twitter: Detection and Analysis of a Large‐Scale Dataset
von: Fiona Victoria Stanley Jothiraj, et al.
Veröffentlicht: (2024)
von: Fiona Victoria Stanley Jothiraj, et al.
Veröffentlicht: (2024)
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment
von: Hu, Xiwei, et al.
Veröffentlicht: (2024)
von: Hu, Xiwei, et al.
Veröffentlicht: (2024)
Uniform volume estimates and maximal functions on generalized Heisenberg-type groups
von: Bi, Cheng, et al.
Veröffentlicht: (2026)
von: Bi, Cheng, et al.
Veröffentlicht: (2026)
Fresnel's Mechanical Legacy Recovered: How Bubble Acoustics Unifies Partial Drag, Velocity Addition, and Atomic Polarization
von: Meucci, Shiva
Veröffentlicht: (2025)
von: Meucci, Shiva
Veröffentlicht: (2025)
Ähnliche Einträge
-
PAFT: A Parallel Training Paradigm for Effective LLM Fine-Tuning
von: Pentyala, Shiva Kumar, et al.
Veröffentlicht: (2024) -
Reinforcement Learning for LLM Post-Training: A Survey
von: Wang, Zhichao, et al.
Veröffentlicht: (2024) -
Diversity Enhances an LLM's Performance in RAG and Long-context Task
von: Wang, Zhichao, et al.
Veröffentlicht: (2025) -
UFT: Unifying Fine-Tuning of SFT and RLHF/DPO/UNA through a Generalized Implicit Reward Function
von: Wang, Zhichao, et al.
Veröffentlicht: (2024) -
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models
von: Hsu, Aliyah R., et al.
Veröffentlicht: (2024)