Salvato in:
| Autori principali: | Acharya, Anurag, Sharma, Shivam, Cosbey, Robin, Subramanian, Megha, Howland, Scott, Glenski, Maria |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2411.03542 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Exploring Polyglot Harmony: On Multilingual Data Allocation for Large Language Models Pretraining
di: Guo, Ping, et al.
Pubblicazione: (2025)
di: Guo, Ping, et al.
Pubblicazione: (2025)
PharmaGPT: Domain-Specific Large Language Models for Bio-Pharmaceutical and Chemistry
di: Chen, Linqing, et al.
Pubblicazione: (2024)
di: Chen, Linqing, et al.
Pubblicazione: (2024)
CFDLLMBench: A Benchmark Suite for Evaluating Large Language Models in Computational Fluid Dynamics
di: Somasekharan, Nithin, et al.
Pubblicazione: (2025)
di: Somasekharan, Nithin, et al.
Pubblicazione: (2025)
A Cloud-based Multi-Agentic Workflow for Science
di: Acharya, Anurag, et al.
Pubblicazione: (2026)
di: Acharya, Anurag, et al.
Pubblicazione: (2026)
CORE: Comprehensive Ontological Relation Evaluation for Large Language Models
di: Dwivedi, Satyam, et al.
Pubblicazione: (2026)
di: Dwivedi, Satyam, et al.
Pubblicazione: (2026)
Large Language Models as Planning Domain Generators
di: Oswald, James, et al.
Pubblicazione: (2024)
di: Oswald, James, et al.
Pubblicazione: (2024)
Modular Techniques for Synthetic Long-Context Data Generation in Language Model Training and Evaluation
di: Subramanian, Seganrasan, et al.
Pubblicazione: (2025)
di: Subramanian, Seganrasan, et al.
Pubblicazione: (2025)
PustakAI: Curriculum-Aligned and Interactive Textbooks Using Large Language Models
di: Sharma, Shivam, et al.
Pubblicazione: (2025)
di: Sharma, Shivam, et al.
Pubblicazione: (2025)
GeMQuAD : Generating Multilingual Question Answering Datasets from Large Language Models using Few Shot Learning
di: Namboori, Amani, et al.
Pubblicazione: (2024)
di: Namboori, Amani, et al.
Pubblicazione: (2024)
The Tokenization Bottleneck: How Vocabulary Extension Improves Chemistry Representation Learning in Pretrained Language Models
di: Kalamkar, Prathamesh, et al.
Pubblicazione: (2025)
di: Kalamkar, Prathamesh, et al.
Pubblicazione: (2025)
UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models
di: Oh, Sejoon, et al.
Pubblicazione: (2024)
di: Oh, Sejoon, et al.
Pubblicazione: (2024)
Structured Chemistry Reasoning with Large Language Models
di: Ouyang, Siru, et al.
Pubblicazione: (2023)
di: Ouyang, Siru, et al.
Pubblicazione: (2023)
Assessing the Pedagogical Readiness of Large Language Models as AI Tutors in Low-Resource Contexts: A Case Study of Nepal's K-10 Curriculum
di: Acharya, Pratyush, et al.
Pubblicazione: (2026)
di: Acharya, Pratyush, et al.
Pubblicazione: (2026)
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains
di: Labrak, Yanis, et al.
Pubblicazione: (2024)
di: Labrak, Yanis, et al.
Pubblicazione: (2024)
Pretraining Large Language Models with NVFP4
di: NVIDIA, et al.
Pubblicazione: (2025)
di: NVIDIA, et al.
Pubblicazione: (2025)
Lightweight Domain Adaptation of a Large Language Model for Legal Assistance in the Indian Context
di: Gupta, Jatin, et al.
Pubblicazione: (2025)
di: Gupta, Jatin, et al.
Pubblicazione: (2025)
Emergent Abilities of Large Language Models under Continued Pretraining for Language Adaptation
di: Elhady, Ahmed, et al.
Pubblicazione: (2025)
di: Elhady, Ahmed, et al.
Pubblicazione: (2025)
H-Probes: Extracting Hierarchical Structures From Latent Representations of Language Models
di: Dawes, Cutter, et al.
Pubblicazione: (2026)
di: Dawes, Cutter, et al.
Pubblicazione: (2026)
CodePMP: Scalable Preference Model Pretraining for Large Language Model Reasoning
di: Yu, Huimu, et al.
Pubblicazione: (2024)
di: Yu, Huimu, et al.
Pubblicazione: (2024)
Exploring Lightweight Large Language Models for Court View Generation
di: Hou, Zhitian, et al.
Pubblicazione: (2026)
di: Hou, Zhitian, et al.
Pubblicazione: (2026)
The Chameleon Nature of LLMs: Quantifying Multi-Turn Stance Instability in Search-Enabled Language Models
di: Ratnakar, Shivam, et al.
Pubblicazione: (2025)
di: Ratnakar, Shivam, et al.
Pubblicazione: (2025)
Exploring the Potential of Large Language Models to Simulate Personality
di: Molchanova, Maria, et al.
Pubblicazione: (2025)
di: Molchanova, Maria, et al.
Pubblicazione: (2025)
STARLING: Self-supervised Training of Text-based Reinforcement Learning Agent with Large Language Models
di: Basavatia, Shreyas, et al.
Pubblicazione: (2024)
di: Basavatia, Shreyas, et al.
Pubblicazione: (2024)
In-context Pretraining: Language Modeling Beyond Document Boundaries
di: Shi, Weijia, et al.
Pubblicazione: (2023)
di: Shi, Weijia, et al.
Pubblicazione: (2023)
The Benefits of a Concise Chain of Thought on Problem-Solving in Large Language Models
di: Renze, Matthew, et al.
Pubblicazione: (2024)
di: Renze, Matthew, et al.
Pubblicazione: (2024)
Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale
di: Hu, Xiang, et al.
Pubblicazione: (2024)
di: Hu, Xiang, et al.
Pubblicazione: (2024)
Memory Decoder: A Pretrained, Plug-and-Play Memory for Large Language Models
di: Cao, Jiaqi, et al.
Pubblicazione: (2025)
di: Cao, Jiaqi, et al.
Pubblicazione: (2025)
Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model
di: Du, Xinrun, et al.
Pubblicazione: (2024)
di: Du, Xinrun, et al.
Pubblicazione: (2024)
SaudiBERT: A Large Language Model Pretrained on Saudi Dialect Corpora
di: Qarah, Faisal
Pubblicazione: (2024)
di: Qarah, Faisal
Pubblicazione: (2024)
Deciphering the Impact of Pretraining Data on Large Language Models through Machine Unlearning
di: Zhao, Yang, et al.
Pubblicazione: (2024)
di: Zhao, Yang, et al.
Pubblicazione: (2024)
Multilingual Pretraining for Pixel Language Models
di: Kesen, Ilker, et al.
Pubblicazione: (2025)
di: Kesen, Ilker, et al.
Pubblicazione: (2025)
Integrating Chemistry Knowledge in Large Language Models via Prompt Engineering
di: Liu, Hongxuan, et al.
Pubblicazione: (2024)
di: Liu, Hongxuan, et al.
Pubblicazione: (2024)
DISHONEST: Dissecting misInformation Spread using Homogeneous sOcial NEtworks and Semantic Topic classification
di: Stam, Caleb, et al.
Pubblicazione: (2024)
di: Stam, Caleb, et al.
Pubblicazione: (2024)
MASS: Mathematical Data Selection via Skill Graphs for Pretraining Large Language Models
di: Li, Jiazheng, et al.
Pubblicazione: (2025)
di: Li, Jiazheng, et al.
Pubblicazione: (2025)
Accelerating Large Language Model Pretraining via LFR Pedagogy: Learn, Focus, and Review
di: Prakriya, Neha, et al.
Pubblicazione: (2024)
di: Prakriya, Neha, et al.
Pubblicazione: (2024)
Systematic Comparative Analysis of Large Pretrained Language Models on Contextualized Medication Event Extraction
di: Abdul-Quddoos, Tariq, et al.
Pubblicazione: (2025)
di: Abdul-Quddoos, Tariq, et al.
Pubblicazione: (2025)
Factuality Challenges in the Era of Large Language Models
di: Augenstein, Isabelle, et al.
Pubblicazione: (2023)
di: Augenstein, Isabelle, et al.
Pubblicazione: (2023)
From General Reasoning to Domain Expertise: Uncovering the Limits of Generalization in Large Language Models
di: Alsagheer, Dana, et al.
Pubblicazione: (2025)
di: Alsagheer, Dana, et al.
Pubblicazione: (2025)
GradeSQL: Test-Time Inference with Outcome Reward Models for Text-to-SQL Generation from Large Language Models
di: Tritto, Mattia, et al.
Pubblicazione: (2025)
di: Tritto, Mattia, et al.
Pubblicazione: (2025)
Exploring the Benefit of Activation Sparsity in Pre-training
di: Zhang, Zhengyan, et al.
Pubblicazione: (2024)
di: Zhang, Zhengyan, et al.
Pubblicazione: (2024)
Documenti analoghi
-
Exploring Polyglot Harmony: On Multilingual Data Allocation for Large Language Models Pretraining
di: Guo, Ping, et al.
Pubblicazione: (2025) -
PharmaGPT: Domain-Specific Large Language Models for Bio-Pharmaceutical and Chemistry
di: Chen, Linqing, et al.
Pubblicazione: (2024) -
CFDLLMBench: A Benchmark Suite for Evaluating Large Language Models in Computational Fluid Dynamics
di: Somasekharan, Nithin, et al.
Pubblicazione: (2025) -
A Cloud-based Multi-Agentic Workflow for Science
di: Acharya, Anurag, et al.
Pubblicazione: (2026) -
CORE: Comprehensive Ontological Relation Evaluation for Large Language Models
di: Dwivedi, Satyam, et al.
Pubblicazione: (2026)