:: Library Catalog

Copertina

Salvato in:

Dettagli Bibliografici
Autori principali:	Acharya, Anurag, Sharma, Shivam, Cosbey, Robin, Subramanian, Megha, Howland, Scott, Glenski, Maria
Natura:	Preprint
Pubblicazione:	2024
Soggetti:	Computation and Language Artificial Intelligence
Accesso online:	https://arxiv.org/abs/2411.03542
Tags:	Aggiungi Tag Nessun Tag, puoi essere il primo ad aggiungerne!!

Documenti analoghi

Exploring Polyglot Harmony: On Multilingual Data Allocation for Large Language Models Pretraining
di: Guo, Ping, et al.
Pubblicazione: (2025)

PharmaGPT: Domain-Specific Large Language Models for Bio-Pharmaceutical and Chemistry
di: Chen, Linqing, et al.
Pubblicazione: (2024)

CFDLLMBench: A Benchmark Suite for Evaluating Large Language Models in Computational Fluid Dynamics
di: Somasekharan, Nithin, et al.
Pubblicazione: (2025)

A Cloud-based Multi-Agentic Workflow for Science
di: Acharya, Anurag, et al.
Pubblicazione: (2026)

CORE: Comprehensive Ontological Relation Evaluation for Large Language Models
di: Dwivedi, Satyam, et al.
Pubblicazione: (2026)

Large Language Models as Planning Domain Generators
di: Oswald, James, et al.
Pubblicazione: (2024)

Modular Techniques for Synthetic Long-Context Data Generation in Language Model Training and Evaluation
di: Subramanian, Seganrasan, et al.
Pubblicazione: (2025)

PustakAI: Curriculum-Aligned and Interactive Textbooks Using Large Language Models
di: Sharma, Shivam, et al.
Pubblicazione: (2025)

GeMQuAD : Generating Multilingual Question Answering Datasets from Large Language Models using Few Shot Learning
di: Namboori, Amani, et al.
Pubblicazione: (2024)

The Tokenization Bottleneck: How Vocabulary Extension Improves Chemistry Representation Learning in Pretrained Language Models
di: Kalamkar, Prathamesh, et al.
Pubblicazione: (2025)

UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Models
di: Oh, Sejoon, et al.
Pubblicazione: (2024)

Structured Chemistry Reasoning with Large Language Models
di: Ouyang, Siru, et al.
Pubblicazione: (2023)

Assessing the Pedagogical Readiness of Large Language Models as AI Tutors in Low-Resource Contexts: A Case Study of Nepal's K-10 Curriculum
di: Acharya, Pratyush, et al.
Pubblicazione: (2026)

BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains
di: Labrak, Yanis, et al.
Pubblicazione: (2024)

Pretraining Large Language Models with NVFP4
di: NVIDIA, et al.
Pubblicazione: (2025)

Lightweight Domain Adaptation of a Large Language Model for Legal Assistance in the Indian Context
di: Gupta, Jatin, et al.
Pubblicazione: (2025)

Emergent Abilities of Large Language Models under Continued Pretraining for Language Adaptation
di: Elhady, Ahmed, et al.
Pubblicazione: (2025)

H-Probes: Extracting Hierarchical Structures From Latent Representations of Language Models
di: Dawes, Cutter, et al.
Pubblicazione: (2026)

CodePMP: Scalable Preference Model Pretraining for Large Language Model Reasoning
di: Yu, Huimu, et al.
Pubblicazione: (2024)

Exploring Lightweight Large Language Models for Court View Generation
di: Hou, Zhitian, et al.
Pubblicazione: (2026)

The Chameleon Nature of LLMs: Quantifying Multi-Turn Stance Instability in Search-Enabled Language Models
di: Ratnakar, Shivam, et al.
Pubblicazione: (2025)

Exploring the Potential of Large Language Models to Simulate Personality
di: Molchanova, Maria, et al.
Pubblicazione: (2025)

STARLING: Self-supervised Training of Text-based Reinforcement Learning Agent with Large Language Models
di: Basavatia, Shreyas, et al.
Pubblicazione: (2024)

In-context Pretraining: Language Modeling Beyond Document Boundaries
di: Shi, Weijia, et al.
Pubblicazione: (2023)

The Benefits of a Concise Chain of Thought on Problem-Solving in Large Language Models
di: Renze, Matthew, et al.
Pubblicazione: (2024)

Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale
di: Hu, Xiang, et al.
Pubblicazione: (2024)

Memory Decoder: A Pretrained, Plug-and-Play Memory for Large Language Models
di: Cao, Jiaqi, et al.
Pubblicazione: (2025)

Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model
di: Du, Xinrun, et al.
Pubblicazione: (2024)

SaudiBERT: A Large Language Model Pretrained on Saudi Dialect Corpora
di: Qarah, Faisal
Pubblicazione: (2024)

Deciphering the Impact of Pretraining Data on Large Language Models through Machine Unlearning
di: Zhao, Yang, et al.
Pubblicazione: (2024)

Multilingual Pretraining for Pixel Language Models
di: Kesen, Ilker, et al.
Pubblicazione: (2025)

Integrating Chemistry Knowledge in Large Language Models via Prompt Engineering
di: Liu, Hongxuan, et al.
Pubblicazione: (2024)

DISHONEST: Dissecting misInformation Spread using Homogeneous sOcial NEtworks and Semantic Topic classification
di: Stam, Caleb, et al.
Pubblicazione: (2024)

MASS: Mathematical Data Selection via Skill Graphs for Pretraining Large Language Models
di: Li, Jiazheng, et al.
Pubblicazione: (2025)

Accelerating Large Language Model Pretraining via LFR Pedagogy: Learn, Focus, and Review
di: Prakriya, Neha, et al.
Pubblicazione: (2024)

Systematic Comparative Analysis of Large Pretrained Language Models on Contextualized Medication Event Extraction
di: Abdul-Quddoos, Tariq, et al.
Pubblicazione: (2025)

Factuality Challenges in the Era of Large Language Models
di: Augenstein, Isabelle, et al.
Pubblicazione: (2023)

From General Reasoning to Domain Expertise: Uncovering the Limits of Generalization in Large Language Models
di: Alsagheer, Dana, et al.
Pubblicazione: (2025)

GradeSQL: Test-Time Inference with Outcome Reward Models for Text-to-SQL Generation from Large Language Models
di: Tritto, Mattia, et al.
Pubblicazione: (2025)

Exploring the Benefit of Activation Sparsity in Pre-training
di: Zhang, Zhengyan, et al.
Pubblicazione: (2024)