Salta al contenuto
VuFind
  • Entra
    • English
    • Deutsch
    • Español
    • Français
    • Italiano
Avanzata
  • Citazione
  • Invia SMS
  • Invia email
  • Stampa
  • Esporta il record
    • Esporta a RefWorks
    • Esporta a EndNoteWeb
    • Esporta a EndNote
  • Aggiungi alla lista
  • PLink permanente
Copertina

Salvato in:
Dettagli Bibliografici
Autori principali: Dubois, Magda, Zorer, Ekin, Hamin, Maia, Skinner, Joe, Souly, Alexandra, Wynne, Jerome, Coppock, Harry, Sato, Lucas, Kapoor, Sayash, Dev, Sunishchal, Juchems, Keno, Mai, Kimberly, Flesch, Timo, Luettgau, Lennart, Teague, Charles, Patey, Eric, Allaire, JJ, Pacchiardi, Lorenzo, Hernandez-Orallo, Jose, Ududec, Cozmin
Natura: Preprint
Pubblicazione: 2026
Soggetti:
Artificial Intelligence
Computation and Language
Machine Learning
Accesso online:https://arxiv.org/abs/2604.09563
Tags: Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
  • Posseduto
  • Descrizione
  • Sommario
  • Commenti
  • Documenti analoghi
  • MARC21

Accesso online

https://arxiv.org/abs/2604.09563

Documenti analoghi

  • Skewed Score: A statistical framework to assess autograders
    di: Dubois, Magda, et al.
    Pubblicazione: (2025)
  • HiBayES: A Hierarchical Bayesian Modeling Framework for AI Evaluation Statistics
    di: Luettgau, Lennart, et al.
    Pubblicazione: (2025)
  • Ask don't tell: Reducing sycophancy in large language models
    di: Dubois, Magda, et al.
    Pubblicazione: (2026)
  • Log analysis is necessary for credible evaluation of AI agents
    di: Kirgis, Peter, et al.
    Pubblicazione: (2026)
  • Open-World Evaluations for Measuring Frontier AI Capabilities
    di: Kapoor, Sayash, et al.
    Pubblicazione: (2026)

Opzioni di ricerca

  • Ultime ricerche
  • Ricerca avanzata

Cerca

  • Scorri il catalogo
  • Scorri in ordine alfabetico
  • Esplora selezioni
  • Materiali riservati (per i corsi)
  • Nuovi documenti

Serve aiuto?

  • Suggerimenti per la ricerca
  • Chiedi al bibliotecario
  • FAQ