Enregistré dans:
| Auteurs principaux: | Kuo, Hsun-Yu, Liao, Yin-Hsiang, Chao, Yu-Chieh, Ma, Wei-Yun, Cheng, Pu-Jen |
|---|---|
| Format: | Preprint |
| Publié: |
2024
|
| Sujets: | |
| Accès en ligne: | https://arxiv.org/abs/2410.21526 |
| Tags: |
Ajouter un tag
Pas de tags, Soyez le premier à ajouter un tag!
|
Documents similaires
Not All Options Are Created Equal: Textual Option Weighting for Token-Efficient LLM-Based Knowledge Tracing
par: Kim, JongWoo, et autres
Publié: (2024)
par: Kim, JongWoo, et autres
Publié: (2024)
LLM as Graph Kernel: Rethinking Message Passing on Text-Rich Graphs
par: Zhang, Ying, et autres
Publié: (2026)
par: Zhang, Ying, et autres
Publié: (2026)
Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs
par: Chan, Yung-Chieh, et autres
Publié: (2024)
par: Chan, Yung-Chieh, et autres
Publié: (2024)
Beyond Independent Passages: Adaptive Passage Combination Retrieval for Retrieval Augmented Open-Domain Question Answering
par: Ko, Ting-Wen, et autres
Publié: (2025)
par: Ko, Ting-Wen, et autres
Publié: (2025)
CapsFusion: Rethinking Image-Text Data at Scale
par: Yu, Qiying, et autres
Publié: (2023)
par: Yu, Qiying, et autres
Publié: (2023)
Not All Pretraining are Created Equal: Threshold Tuning and Class Weighting for Imbalanced Polarization Tasks in Low-Resource Settings
par: Oguntade, Abass
Publié: (2026)
par: Oguntade, Abass
Publié: (2026)
Editing the Mind of Giants: An In-Depth Exploration of Pitfalls of Knowledge Editing in Large Language Models
par: Hsueh, Cheng-Hsun, et autres
Publié: (2024)
par: Hsueh, Cheng-Hsun, et autres
Publié: (2024)
Text2Data: Low-Resource Data Generation with Textual Control
par: Wang, Shiyu, et autres
Publié: (2024)
par: Wang, Shiyu, et autres
Publié: (2024)
SynthDST: Synthetic Data is All You Need for Few-Shot Dialog State Tracking
par: Kulkarni, Atharva, et autres
Publié: (2024)
par: Kulkarni, Atharva, et autres
Publié: (2024)
Filter-then-Weight: Online Data Selection and Reweighting for LLM Fine-Tuning
par: Wang, Fangxin, et autres
Publié: (2026)
par: Wang, Fangxin, et autres
Publié: (2026)
HiGen: Hierarchy-Aware Sequence Generation for Hierarchical Text Classification
par: Jain, Vidit, et autres
Publié: (2024)
par: Jain, Vidit, et autres
Publié: (2024)
Rethinking Cross-Subject Data Splitting for Brain-to-Text Decoding
par: Yin, Congchi, et autres
Publié: (2023)
par: Yin, Congchi, et autres
Publié: (2023)
Learning Unsupervised Semantic Document Representation for Fine-grained Aspect-based Sentiment Analysis
par: Fu, Hao-Ming, et autres
Publié: (2024)
par: Fu, Hao-Ming, et autres
Publié: (2024)
Prompt2Fingerprint: Plug-and-Play LLM Fingerprinting via Text-to-Weight Generation
par: Chen, Sixu, et autres
Publié: (2026)
par: Chen, Sixu, et autres
Publié: (2026)
Enhance the Robustness of Text-Centric Multimodal Alignments
par: Yen, Ting-Yu, et autres
Publié: (2024)
par: Yen, Ting-Yu, et autres
Publié: (2024)
The Data-Quality Illusion: Rethinking Classifier-Based Quality Filtering for LLM Pretraining
par: Saada, Thiziri Nait, et autres
Publié: (2025)
par: Saada, Thiziri Nait, et autres
Publié: (2025)
Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection
par: Zeng, Cong, et autres
Publié: (2025)
par: Zeng, Cong, et autres
Publié: (2025)
A Mathematical Theory for Learning Semantic Languages by Abstract Learners
par: Liao, Kuo-Yu, et autres
Publié: (2024)
par: Liao, Kuo-Yu, et autres
Publié: (2024)
Text Detoxification: Data Efficiency, Semantic Preservation and Model Generalization
par: Yu, Jing, et autres
Publié: (2025)
par: Yu, Jing, et autres
Publié: (2025)
vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM
par: Ko, Ching-Yun, et autres
Publié: (2026)
par: Ko, Ching-Yun, et autres
Publié: (2026)
Bayesian WeakS-to-Strong from Text Classification to Generation
par: Cui, Ziyun, et autres
Publié: (2024)
par: Cui, Ziyun, et autres
Publié: (2024)
Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation
par: Yin, Shukang, et autres
Publié: (2024)
par: Yin, Shukang, et autres
Publié: (2024)
Transferable Embedding Inversion Attack: Uncovering Privacy Risks in Text Embeddings without Model Queries
par: Huang, Yu-Hsiang, et autres
Publié: (2024)
par: Huang, Yu-Hsiang, et autres
Publié: (2024)
Rethinking LLM Evaluation: Can We Evaluate LLMs with 200x Less Data?
par: Wang, Shaobo, et autres
Publié: (2025)
par: Wang, Shaobo, et autres
Publié: (2025)
ROSE: A Reward-Oriented Data Selection Framework for LLM Task-Specific Instruction Tuning
par: Wu, Yang, et autres
Publié: (2024)
par: Wu, Yang, et autres
Publié: (2024)
Not All Denoising Steps Are Equal: Model Scheduling for Faster Masked Diffusion Language Models
par: Sedykh, Ivan, et autres
Publié: (2026)
par: Sedykh, Ivan, et autres
Publié: (2026)
Retrieval-augmented Encoders for Extreme Multi-label Text Classification
par: Wang, Yau-Shian, et autres
Publié: (2025)
par: Wang, Yau-Shian, et autres
Publié: (2025)
Not All Languages are Equal: Insights into Multilingual Retrieval-Augmented Generation
par: Wu, Suhang, et autres
Publié: (2024)
par: Wu, Suhang, et autres
Publié: (2024)
LLM-AutoDP: Automatic Data Processing via LLM Agents for Model Fine-tuning
par: Huang, Wei, et autres
Publié: (2026)
par: Huang, Wei, et autres
Publié: (2026)
Program Machine Policy: Addressing Long-Horizon Tasks by Integrating Program Synthesis and State Machines
par: Lin, Yu-An, et autres
Publié: (2023)
par: Lin, Yu-An, et autres
Publié: (2023)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection
par: Jung, Minseok, et autres
Publié: (2025)
par: Jung, Minseok, et autres
Publié: (2025)
EEG2TEXT-CN: An Exploratory Study of Open-Vocabulary Chinese Text-EEG Alignment via Large Language Model and Contrastive Learning on ChineseEEG
par: Lu, Jacky Tai-Yu, et autres
Publié: (2025)
par: Lu, Jacky Tai-Yu, et autres
Publié: (2025)
All Claims Are Equal, but Some Claims Are More Equal Than Others: Importance-Sensitive Factuality Evaluation of LLM Generations
par: Wanner, Miriam, et autres
Publié: (2025)
par: Wanner, Miriam, et autres
Publié: (2025)
Knowledge Distillation in Automated Annotation: Supervised Text Classification with LLM-Generated Training Labels
par: Pangakis, Nicholas, et autres
Publié: (2024)
par: Pangakis, Nicholas, et autres
Publié: (2024)
Breaking the Ceiling of the LLM Community by Treating Token Generation as a Classification for Ensembling
par: Yu, Yao-Ching, et autres
Publié: (2024)
par: Yu, Yao-Ching, et autres
Publié: (2024)
Greedy Information Projection for LLM Data Selection
par: Dong, Victor Ye, et autres
Publié: (2026)
par: Dong, Victor Ye, et autres
Publié: (2026)
Generating Pretraining Tokens from Organic Data for Data-Bound Scaling
par: Yu, Zichun, et autres
Publié: (2026)
par: Yu, Zichun, et autres
Publié: (2026)
DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection
par: Yu, Xiao, et autres
Publié: (2023)
par: Yu, Xiao, et autres
Publié: (2023)
Not All Thoughts are Generated Equal: Efficient LLM Reasoning via Multi-Turn Reinforcement Learning
par: Ning, Yansong, et autres
Publié: (2025)
par: Ning, Yansong, et autres
Publié: (2025)
Using Natural Language Processing to find Indication for Burnout with Text Classification: From Online Data to Real-World Data
par: Kurpicz-Briki, Mascha, et autres
Publié: (2024)
par: Kurpicz-Briki, Mascha, et autres
Publié: (2024)
Documents similaires
-
Not All Options Are Created Equal: Textual Option Weighting for Token-Efficient LLM-Based Knowledge Tracing
par: Kim, JongWoo, et autres
Publié: (2024) -
LLM as Graph Kernel: Rethinking Message Passing on Text-Rich Graphs
par: Zhang, Ying, et autres
Publié: (2026) -
Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs
par: Chan, Yung-Chieh, et autres
Publié: (2024) -
Beyond Independent Passages: Adaptive Passage Combination Retrieval for Retrieval Augmented Open-Domain Question Answering
par: Ko, Ting-Wen, et autres
Publié: (2025) -
CapsFusion: Rethinking Image-Text Data at Scale
par: Yu, Qiying, et autres
Publié: (2023)