:: Library Catalog

Image de couverture de livre

Enregistré dans:

Détails bibliographiques
Auteurs principaux:	Kuo, Hsun-Yu, Liao, Yin-Hsiang, Chao, Yu-Chieh, Ma, Wei-Yun, Cheng, Pu-Jen
Format:	Preprint
Publié:	2024
Sujets:	Machine Learning Computation and Language
Accès en ligne:	https://arxiv.org/abs/2410.21526
Tags:	Ajouter un tag Pas de tags, Soyez le premier à ajouter un tag!

Documents similaires

Not All Options Are Created Equal: Textual Option Weighting for Token-Efficient LLM-Based Knowledge Tracing
par: Kim, JongWoo, et autres
Publié: (2024)

LLM as Graph Kernel: Rethinking Message Passing on Text-Rich Graphs
par: Zhang, Ying, et autres
Publié: (2026)

Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs
par: Chan, Yung-Chieh, et autres
Publié: (2024)

Beyond Independent Passages: Adaptive Passage Combination Retrieval for Retrieval Augmented Open-Domain Question Answering
par: Ko, Ting-Wen, et autres
Publié: (2025)

CapsFusion: Rethinking Image-Text Data at Scale
par: Yu, Qiying, et autres
Publié: (2023)

Not All Pretraining are Created Equal: Threshold Tuning and Class Weighting for Imbalanced Polarization Tasks in Low-Resource Settings
par: Oguntade, Abass
Publié: (2026)

Editing the Mind of Giants: An In-Depth Exploration of Pitfalls of Knowledge Editing in Large Language Models
par: Hsueh, Cheng-Hsun, et autres
Publié: (2024)

Text2Data: Low-Resource Data Generation with Textual Control
par: Wang, Shiyu, et autres
Publié: (2024)

SynthDST: Synthetic Data is All You Need for Few-Shot Dialog State Tracking
par: Kulkarni, Atharva, et autres
Publié: (2024)

Filter-then-Weight: Online Data Selection and Reweighting for LLM Fine-Tuning
par: Wang, Fangxin, et autres
Publié: (2026)

HiGen: Hierarchy-Aware Sequence Generation for Hierarchical Text Classification
par: Jain, Vidit, et autres
Publié: (2024)

Rethinking Cross-Subject Data Splitting for Brain-to-Text Decoding
par: Yin, Congchi, et autres
Publié: (2023)

Learning Unsupervised Semantic Document Representation for Fine-grained Aspect-based Sentiment Analysis
par: Fu, Hao-Ming, et autres
Publié: (2024)

Prompt2Fingerprint: Plug-and-Play LLM Fingerprinting via Text-to-Weight Generation
par: Chen, Sixu, et autres
Publié: (2026)

Enhance the Robustness of Text-Centric Multimodal Alignments
par: Yen, Ting-Yu, et autres
Publié: (2024)

The Data-Quality Illusion: Rethinking Classifier-Based Quality Filtering for LLM Pretraining
par: Saada, Thiziri Nait, et autres
Publié: (2025)

Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection
par: Zeng, Cong, et autres
Publié: (2025)

A Mathematical Theory for Learning Semantic Languages by Abstract Learners
par: Liao, Kuo-Yu, et autres
Publié: (2024)

Text Detoxification: Data Efficiency, Semantic Preservation and Model Generalization
par: Yu, Jing, et autres
Publié: (2025)

vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM
par: Ko, Ching-Yun, et autres
Publié: (2026)

Bayesian WeakS-to-Strong from Text Classification to Generation
par: Cui, Ziyun, et autres
Publié: (2024)

Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation
par: Yin, Shukang, et autres
Publié: (2024)

Transferable Embedding Inversion Attack: Uncovering Privacy Risks in Text Embeddings without Model Queries
par: Huang, Yu-Hsiang, et autres
Publié: (2024)

Rethinking LLM Evaluation: Can We Evaluate LLMs with 200x Less Data?
par: Wang, Shaobo, et autres
Publié: (2025)

ROSE: A Reward-Oriented Data Selection Framework for LLM Task-Specific Instruction Tuning
par: Wu, Yang, et autres
Publié: (2024)

Not All Denoising Steps Are Equal: Model Scheduling for Faster Masked Diffusion Language Models
par: Sedykh, Ivan, et autres
Publié: (2026)

Retrieval-augmented Encoders for Extreme Multi-label Text Classification
par: Wang, Yau-Shian, et autres
Publié: (2025)

Not All Languages are Equal: Insights into Multilingual Retrieval-Augmented Generation
par: Wu, Suhang, et autres
Publié: (2024)

LLM-AutoDP: Automatic Data Processing via LLM Agents for Model Fine-tuning
par: Huang, Wei, et autres
Publié: (2026)

Program Machine Policy: Addressing Long-Horizon Tasks by Integrating Program Synthesis and State Machines
par: Lin, Yu-An, et autres
Publié: (2023)

Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection
par: Jung, Minseok, et autres
Publié: (2025)

EEG2TEXT-CN: An Exploratory Study of Open-Vocabulary Chinese Text-EEG Alignment via Large Language Model and Contrastive Learning on ChineseEEG
par: Lu, Jacky Tai-Yu, et autres
Publié: (2025)

All Claims Are Equal, but Some Claims Are More Equal Than Others: Importance-Sensitive Factuality Evaluation of LLM Generations
par: Wanner, Miriam, et autres
Publié: (2025)

Knowledge Distillation in Automated Annotation: Supervised Text Classification with LLM-Generated Training Labels
par: Pangakis, Nicholas, et autres
Publié: (2024)

Breaking the Ceiling of the LLM Community by Treating Token Generation as a Classification for Ensembling
par: Yu, Yao-Ching, et autres
Publié: (2024)

Greedy Information Projection for LLM Data Selection
par: Dong, Victor Ye, et autres
Publié: (2026)

Generating Pretraining Tokens from Organic Data for Data-Bound Scaling
par: Yu, Zichun, et autres
Publié: (2026)

DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection
par: Yu, Xiao, et autres
Publié: (2023)

Not All Thoughts are Generated Equal: Efficient LLM Reasoning via Multi-Turn Reinforcement Learning
par: Ning, Yansong, et autres
Publié: (2025)

Using Natural Language Processing to find Indication for Burnout with Text Classification: From Online Data to Real-World Data
par: Kurpicz-Briki, Mascha, et autres
Publié: (2024)