Salvato in:
| Autori principali: | Nehrdich, Sebastian, Allport, David, Sellmer, Sven, Sandhan, Jivnesh, Jagadeeshan, Manoj Balaji, Goyal, Pawan, Kumar, Sujeet, Keutzer, Kurt |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2026
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2601.07314 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
MITRA: A Large-Scale Parallel Corpus and Multilingual Pretrained Language Model for Machine Translation and Semantic Retrieval for Pāli, Sanskrit, Buddhist Chinese, and Tibetan
di: Nehrdich, Sebastian, et al.
Pubblicazione: (2026)
di: Nehrdich, Sebastian, et al.
Pubblicazione: (2026)
Anveshana: A New Benchmark Dataset for Cross-Lingual Information Retrieval On English Queries and Sanskrit Documents
di: Jagadeeshan, Manoj Balaji, et al.
Pubblicazione: (2025)
di: Jagadeeshan, Manoj Balaji, et al.
Pubblicazione: (2025)
Mahānāma: A Unique Testbed for Literary Entity Discovery and Linking
di: Sarkar, Sujoy, et al.
Pubblicazione: (2025)
di: Sarkar, Sujoy, et al.
Pubblicazione: (2025)
Still Not There: Can LLMs Outperform Smaller Task-Specific Seq2Seq Models on the Poetry-to-Prose Conversion Task?
di: Das, Kunal Kingkar, et al.
Pubblicazione: (2025)
di: Das, Kunal Kingkar, et al.
Pubblicazione: (2025)
Vedavani: A Benchmark Corpus for ASR on Vedic Sanskrit Poetry
di: Kumar, Sujeet, et al.
Pubblicazione: (2025)
di: Kumar, Sujeet, et al.
Pubblicazione: (2025)
One Model is All You Need: ByT5-Sanskrit, a Unified Model for Sanskrit NLP Tasks
di: Nehrdich, Sebastian, et al.
Pubblicazione: (2024)
di: Nehrdich, Sebastian, et al.
Pubblicazione: (2024)
PINGALA: Prosody-Aware Decoding for Sanskrit Poetry Generation
di: Jagadeeshan, Manoj Balaji, et al.
Pubblicazione: (2026)
di: Jagadeeshan, Manoj Balaji, et al.
Pubblicazione: (2026)
CSSL: Contrastive Self-Supervised Learning for Dependency Parsing on Relatively Free Word Ordered and Morphologically Rich Low Resource Languages
di: Ray, Pretam, et al.
Pubblicazione: (2024)
di: Ray, Pretam, et al.
Pubblicazione: (2024)
Chandomitra: Towards Generating Structured Sanskrit Poetry from Natural Language Inputs
di: Jagadeeshan, Manoj Balaji, et al.
Pubblicazione: (2025)
di: Jagadeeshan, Manoj Balaji, et al.
Pubblicazione: (2025)
CAPE: Context-Aware Personality Evaluation Framework for Large Language Models
di: Sandhan, Jivnesh, et al.
Pubblicazione: (2025)
di: Sandhan, Jivnesh, et al.
Pubblicazione: (2025)
Persona Jailbreaking in Large Language Models
di: Sandhan, Jivnesh, et al.
Pubblicazione: (2026)
di: Sandhan, Jivnesh, et al.
Pubblicazione: (2026)
Can We Trust LLM Detectors?
di: Sandhan, Jivnesh, et al.
Pubblicazione: (2026)
di: Sandhan, Jivnesh, et al.
Pubblicazione: (2026)
Samasāmayik: A Parallel Dataset for Hindi-Sanskrit Machine Translation
di: Karthika, N J, et al.
Pubblicazione: (2026)
di: Karthika, N J, et al.
Pubblicazione: (2026)
Sāmayik: A Benchmark and Dataset for English-Sanskrit Translation
di: Maheshwari, Ayush, et al.
Pubblicazione: (2023)
di: Maheshwari, Ayush, et al.
Pubblicazione: (2023)
Simple and Effective Input Reformulations for Translation
di: Yu, Brian, et al.
Pubblicazione: (2023)
di: Yu, Brian, et al.
Pubblicazione: (2023)
Breaking Token Into Concepts: Exploring Extreme Compression in Token Representation Via Compositional Shared Semantics
di: R V, Kavin, et al.
Pubblicazione: (2025)
di: R V, Kavin, et al.
Pubblicazione: (2025)
Neural Compound-Word (Sandhi) Generation and Splitting in Sanskrit Language
di: Dave, Sushant, et al.
Pubblicazione: (2020)
di: Dave, Sushant, et al.
Pubblicazione: (2020)
How Robust are the Tabular QA Models for Scientific Tables? A Study using Customized Dataset
di: Ghosh, Akash, et al.
Pubblicazione: (2024)
di: Ghosh, Akash, et al.
Pubblicazione: (2024)
A Benchmark Corpus and Neural Approach for Sanskrit Derivative Nouns Analysis
di: Singh, Arun Kumar, et al.
Pubblicazione: (2020)
di: Singh, Arun Kumar, et al.
Pubblicazione: (2020)
Error-Aware Curriculum Learning for Biomedical Relation Classification
di: Chakraborty, Sinchani, et al.
Pubblicazione: (2025)
di: Chakraborty, Sinchani, et al.
Pubblicazione: (2025)
Intent Detection and Entity Extraction from BioMedical Literature
di: Mullick, Ankan, et al.
Pubblicazione: (2024)
di: Mullick, Ankan, et al.
Pubblicazione: (2024)
Accent Placement Models for Rigvedic Sanskrit Text
di: P, Akhil Rajeev, et al.
Pubblicazione: (2025)
di: P, Akhil Rajeev, et al.
Pubblicazione: (2025)
YesBut: A High-Quality Annotated Multimodal Dataset for evaluating Satire Comprehension capability of Vision-Language Models
di: Nandy, Abhilash, et al.
Pubblicazione: (2024)
di: Nandy, Abhilash, et al.
Pubblicazione: (2024)
Automatic Speech Recognition for Sanskrit with Transfer Learning
di: Sadhukhan, Bidit, et al.
Pubblicazione: (2025)
di: Sadhukhan, Bidit, et al.
Pubblicazione: (2025)
Is Sanskrit the most token-efficient language? A quantitative study using GPT, Gemini, and SentencePiece
di: Kumar, Anshul
Pubblicazione: (2026)
di: Kumar, Anshul
Pubblicazione: (2026)
Transformer-Enabled Diachronic Analysis of Vedic Sanskrit: Neural Methods for Quantifying Types of Language Change
di: Hariharan, Ananth, et al.
Pubblicazione: (2025)
di: Hariharan, Ananth, et al.
Pubblicazione: (2025)
Sanskrit Knowledge-based Systems: Annotation and Computational Tools
di: Terdalkar, Hrishikesh
Pubblicazione: (2024)
di: Terdalkar, Hrishikesh
Pubblicazione: (2024)
Reviving Sanskrit: NEP's Role in India's Heritage
di: Pralay Sankar Adhikari
Pubblicazione: (2025)
di: Pralay Sankar Adhikari
Pubblicazione: (2025)
Data Augmentation for Maltese NLP using Transliterated and Machine Translated Arabic Data
di: Micallef, Kurt, et al.
Pubblicazione: (2025)
di: Micallef, Kurt, et al.
Pubblicazione: (2025)
ILSIC: Corpora for Identifying Indian Legal Statutes from Queries by Laypeople
di: Paul, Shounak, et al.
Pubblicazione: (2026)
di: Paul, Shounak, et al.
Pubblicazione: (2026)
EduVidQA: Generating and Evaluating Long-form Answers to Student Questions based on Lecture Videos
di: Ray, Sourjyadip, et al.
Pubblicazione: (2025)
di: Ray, Sourjyadip, et al.
Pubblicazione: (2025)
Order-Based Pre-training Strategies for Procedural Text Understanding
di: Nandy, Abhilash, et al.
Pubblicazione: (2024)
di: Nandy, Abhilash, et al.
Pubblicazione: (2024)
Text Takes Over: A Study of Modality Bias in Multimodal Intent Detection
di: Mullick, Ankan, et al.
Pubblicazione: (2025)
di: Mullick, Ankan, et al.
Pubblicazione: (2025)
Study of Example Based English to Sanskrit Machine Translation
di: Vimal Mishra
Pubblicazione: (2008)
di: Vimal Mishra
Pubblicazione: (2008)
ERVQA: A Dataset to Benchmark the Readiness of Large Vision Language Models in Hospital Environments
di: Ray, Sourjyadip, et al.
Pubblicazione: (2024)
di: Ray, Sourjyadip, et al.
Pubblicazione: (2024)
Abstractive Text Summarization for Contemporary Sanskrit Prose: Issues and Challenges
di: Sinha, Shagun
Pubblicazione: (2025)
di: Sinha, Shagun
Pubblicazione: (2025)
Characterizing Prompt Compression Methods for Long Context Inference
di: Jha, Siddharth, et al.
Pubblicazione: (2024)
di: Jha, Siddharth, et al.
Pubblicazione: (2024)
Instruct Large Language Models to Drive like Humans
di: Zhang, Ruijun, et al.
Pubblicazione: (2024)
di: Zhang, Ruijun, et al.
Pubblicazione: (2024)
Pragya: An AI-Based Semantic Recommendation System for Sanskrit Subhasitas
di: Raorane, Tanisha, et al.
Pubblicazione: (2026)
di: Raorane, Tanisha, et al.
Pubblicazione: (2026)
Salute the Classic: Revisiting Challenges of Machine Translation in the Age of Large Language Models
di: Pang, Jianhui, et al.
Pubblicazione: (2024)
di: Pang, Jianhui, et al.
Pubblicazione: (2024)
Documenti analoghi
-
MITRA: A Large-Scale Parallel Corpus and Multilingual Pretrained Language Model for Machine Translation and Semantic Retrieval for Pāli, Sanskrit, Buddhist Chinese, and Tibetan
di: Nehrdich, Sebastian, et al.
Pubblicazione: (2026) -
Anveshana: A New Benchmark Dataset for Cross-Lingual Information Retrieval On English Queries and Sanskrit Documents
di: Jagadeeshan, Manoj Balaji, et al.
Pubblicazione: (2025) -
Mahānāma: A Unique Testbed for Literary Entity Discovery and Linking
di: Sarkar, Sujoy, et al.
Pubblicazione: (2025) -
Still Not There: Can LLMs Outperform Smaller Task-Specific Seq2Seq Models on the Poetry-to-Prose Conversion Task?
di: Das, Kunal Kingkar, et al.
Pubblicazione: (2025) -
Vedavani: A Benchmark Corpus for ASR on Vedic Sanskrit Poetry
di: Kumar, Sujeet, et al.
Pubblicazione: (2025)