Salvato in:
| Autori principali: | Bouquillard, Augustin, Jacquemard, Florent |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2402.10247 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
JEPOO: Highly Accurate Joint Estimation of Pitch, Onset and Offset for Music Information Retrieval
di: Wei, Haojie, et al.
Pubblicazione: (2023)
di: Wei, Haojie, et al.
Pubblicazione: (2023)
Evaluating Interval-based Tokenization for Pitch Representation in Symbolic Music Analysis
di: Le, Dinh-Viet-Toan, et al.
Pubblicazione: (2025)
di: Le, Dinh-Viet-Toan, et al.
Pubblicazione: (2025)
Automatic Estimation of Singing Voice Musical Dynamics
di: Narang, Jyoti, et al.
Pubblicazione: (2024)
di: Narang, Jyoti, et al.
Pubblicazione: (2024)
Evaluating High-Resolution Piano Sustain Pedal Depth Estimation with Musically Informed Metrics
di: Zhang, Hanwen, et al.
Pubblicazione: (2025)
di: Zhang, Hanwen, et al.
Pubblicazione: (2025)
Exploring Diverse Sounds: Identifying Outliers in a Music Corpus
di: Cai, Le, et al.
Pubblicazione: (2024)
di: Cai, Le, et al.
Pubblicazione: (2024)
Music Discovery Dialogue Generation Using Human Intent Analysis and Large Language Models
di: Doh, SeungHeon, et al.
Pubblicazione: (2024)
di: Doh, SeungHeon, et al.
Pubblicazione: (2024)
Track Role Prediction of Single-Instrumental Sequences
di: Han, Changheon, et al.
Pubblicazione: (2024)
di: Han, Changheon, et al.
Pubblicazione: (2024)
Personalized Dynamic Music Emotion Recognition with Dual-Scale Attention-Based Meta-Learning
di: Zhang, Dengming, et al.
Pubblicazione: (2024)
di: Zhang, Dengming, et al.
Pubblicazione: (2024)
LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation
di: Salganik, Rebecca, et al.
Pubblicazione: (2024)
di: Salganik, Rebecca, et al.
Pubblicazione: (2024)
Expressivity-aware Music Performance Retrieval using Mid-level Perceptual Features and Emotion Word Embeddings
di: Chowdhury, Shreyan, et al.
Pubblicazione: (2024)
di: Chowdhury, Shreyan, et al.
Pubblicazione: (2024)
DiffATR: Diffusion-based Generative Modeling for Audio-Text Retrieval
di: Xin, Yifei, et al.
Pubblicazione: (2024)
di: Xin, Yifei, et al.
Pubblicazione: (2024)
Language-based Audio Retrieval with Co-Attention Networks
di: Sun, Haoran, et al.
Pubblicazione: (2024)
di: Sun, Haoran, et al.
Pubblicazione: (2024)
Multi-Sample Dynamic Time Warping for Few-Shot Keyword Spotting
di: Wilkinghoff, Kevin, et al.
Pubblicazione: (2024)
di: Wilkinghoff, Kevin, et al.
Pubblicazione: (2024)
Multiscale Matching Driven by Cross-Modal Similarity Consistency for Audio-Text Retrieval
di: Wang, Qian, et al.
Pubblicazione: (2024)
di: Wang, Qian, et al.
Pubblicazione: (2024)
Do Captioning Metrics Reflect Music Semantic Alignment?
di: Lee, Jinwoo, et al.
Pubblicazione: (2024)
di: Lee, Jinwoo, et al.
Pubblicazione: (2024)
A SOUND APPROACH: Using Large Language Models to generate audio descriptions for egocentric text-audio retrieval
di: Oncescu, Andreea-Maria, et al.
Pubblicazione: (2024)
di: Oncescu, Andreea-Maria, et al.
Pubblicazione: (2024)
Towards Computational Analysis of Pansori Singing
di: Park, Sangheon, et al.
Pubblicazione: (2024)
di: Park, Sangheon, et al.
Pubblicazione: (2024)
VoxRAG: A Step Toward Transcription-Free RAG Systems in Spoken Question Answering
di: Rackauckas, Zackary, et al.
Pubblicazione: (2025)
di: Rackauckas, Zackary, et al.
Pubblicazione: (2025)
Exploring GPT's Ability as a Judge in Music Understanding
di: Fang, Kun, et al.
Pubblicazione: (2025)
di: Fang, Kun, et al.
Pubblicazione: (2025)
Bridging the Gap Between Semantic and User Preference Spaces for Multi-modal Music Representation Learning
di: Pan, Xiaofeng, et al.
Pubblicazione: (2025)
di: Pan, Xiaofeng, et al.
Pubblicazione: (2025)
FusID: Modality-Fused Semantic IDs for Generative Music Recommendation
di: Kim, Haven, et al.
Pubblicazione: (2026)
di: Kim, Haven, et al.
Pubblicazione: (2026)
TALKPLAY: Multimodal Music Recommendation with Large Language Models
di: Doh, Seungheon, et al.
Pubblicazione: (2025)
di: Doh, Seungheon, et al.
Pubblicazione: (2025)
Analyzing Musical Characteristics of National Anthems in Relation to Global Indices
di: Hasan, S M Rakib, et al.
Pubblicazione: (2024)
di: Hasan, S M Rakib, et al.
Pubblicazione: (2024)
Uncertainty Estimation in the Real World: A Study on Music Emotion Recognition
di: Watcharasupat, Karn N., et al.
Pubblicazione: (2025)
di: Watcharasupat, Karn N., et al.
Pubblicazione: (2025)
Towards Explainable and Interpretable Musical Difficulty Estimation: A Parameter-efficient Approach
di: Ramoneda, Pedro, et al.
Pubblicazione: (2024)
di: Ramoneda, Pedro, et al.
Pubblicazione: (2024)
High-Resolution Sustain Pedal Depth Estimation from Piano Audio Across Room Acoustics
di: Fang, Kun, et al.
Pubblicazione: (2025)
di: Fang, Kun, et al.
Pubblicazione: (2025)
Diff4Steer: Steerable Diffusion Prior for Generative Music Retrieval with Semantic Guidance
di: Bao, Xuchan, et al.
Pubblicazione: (2024)
di: Bao, Xuchan, et al.
Pubblicazione: (2024)
Enriching Music Descriptions with a Finetuned-LLM and Metadata for Text-to-Music Retrieval
di: Doh, SeungHeon, et al.
Pubblicazione: (2024)
di: Doh, SeungHeon, et al.
Pubblicazione: (2024)
TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling
di: Doh, Seungheon, et al.
Pubblicazione: (2025)
di: Doh, Seungheon, et al.
Pubblicazione: (2025)
Streaming Piano Transcription Based on Consistent Onset and Offset Decoding with Sustain Pedal Detection
di: Wei, Weixing, et al.
Pubblicazione: (2025)
di: Wei, Weixing, et al.
Pubblicazione: (2025)
On the Effect of Data-Augmentation on Local Embedding Properties in the Contrastive Learning of Music Audio Representations
di: McCallum, Matthew C., et al.
Pubblicazione: (2024)
di: McCallum, Matthew C., et al.
Pubblicazione: (2024)
Analyzing and reducing the synthetic-to-real transfer gap in Music Information Retrieval: the task of automatic drum transcription
di: Zehren, Mickaël, et al.
Pubblicazione: (2024)
di: Zehren, Mickaël, et al.
Pubblicazione: (2024)
Transforming LLMs into Cross-modal and Cross-lingual Retrieval Systems
di: Gomez, Frank Palma, et al.
Pubblicazione: (2024)
di: Gomez, Frank Palma, et al.
Pubblicazione: (2024)
Music Foundation Model as Generic Booster for Music Downstream Tasks
di: Liao, WeiHsiang, et al.
Pubblicazione: (2024)
di: Liao, WeiHsiang, et al.
Pubblicazione: (2024)
SECP: A Speech Enhancement-Based Curation Pipeline For Scalable Acquisition Of Clean Speech
di: Sabra, Adam, et al.
Pubblicazione: (2024)
di: Sabra, Adam, et al.
Pubblicazione: (2024)
Latent Diffusion Bridges for Unsupervised Musical Audio Timbre Transfer
di: Mancusi, Michele, et al.
Pubblicazione: (2024)
di: Mancusi, Michele, et al.
Pubblicazione: (2024)
CLASP: Contrastive Language-Speech Pretraining for Multilingual Multimodal Information Retrieval
di: Abootorabi, Mohammad Mahdi, et al.
Pubblicazione: (2024)
di: Abootorabi, Mohammad Mahdi, et al.
Pubblicazione: (2024)
A Novel Audio Representation for Music Genre Identification in MIR
di: Kamuni, Navin, et al.
Pubblicazione: (2024)
di: Kamuni, Navin, et al.
Pubblicazione: (2024)
Distance Sampling-based Paraphraser Leveraging ChatGPT for Text Data Manipulation
di: Oh, Yoori, et al.
Pubblicazione: (2024)
di: Oh, Yoori, et al.
Pubblicazione: (2024)
SoundSignature: What Type of Music Do You Like?
di: Carone, Brandon James, et al.
Pubblicazione: (2024)
di: Carone, Brandon James, et al.
Pubblicazione: (2024)
Documenti analoghi
-
JEPOO: Highly Accurate Joint Estimation of Pitch, Onset and Offset for Music Information Retrieval
di: Wei, Haojie, et al.
Pubblicazione: (2023) -
Evaluating Interval-based Tokenization for Pitch Representation in Symbolic Music Analysis
di: Le, Dinh-Viet-Toan, et al.
Pubblicazione: (2025) -
Automatic Estimation of Singing Voice Musical Dynamics
di: Narang, Jyoti, et al.
Pubblicazione: (2024) -
Evaluating High-Resolution Piano Sustain Pedal Depth Estimation with Musically Informed Metrics
di: Zhang, Hanwen, et al.
Pubblicazione: (2025) -
Exploring Diverse Sounds: Identifying Outliers in a Music Corpus
di: Cai, Le, et al.
Pubblicazione: (2024)