Publications HAL du projet ANR. ML3RI

2024

Journal articles

titre
A Multimodal Dynamical Variational Autoencoder for Audiovisual Speech Representation Learning
auteur
Samir Sadok, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda, Renaud Séguier
article
Neural Networks, 2024, 172, pp.106120. ⟨10.1016/j.neunet.2024.106120⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04132316/file/1-s2.0-S0893608024000340-main.pdf BibTex
titre
Mixture of Dynamical Variational Autoencoders for Multi-Source Trajectory Modeling and Separation
auteur
Xiaoyu Lin, Laurent Girin, Xavier Alameda-Pineda
article
Transactions on Machine Learning Research Journal, 2024, pp.1-19
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03584014/file/2202.09315.pdf BibTex

Theses

titre
Deep latent-variable generative models for multimedia processing
auteur
Xiaoyu Lin
article
Machine Learning [cs.LG]. Université Grenoble Alpes [2020-..], 2024. English. ⟨NNT : 2024GRALM027⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-04957490/file/LIN_2024_archivage.pdf BibTex

2023

Journal articles

titre
Variational Meta Reinforcement Learning for Social Robotics
auteur
Anand Ballou, Xavier Alameda-Pineda, Chris Reinke
article
Applied Intelligence, 2023, 53, pp.27249-27268. ⟨10.1007/s10489-023-04691-5⟩
Accès au bibtex
https://arxiv.org/pdf/2206.03211 BibTex
titre
Continual Attentive Fusion for Incremental Learning in Semantic Segmentation
auteur
Guanglei Yang, Enrico Fini, Dan Xu, Paolo Rota, Mingli Ding, Hao Tang, Xavier Alameda-Pineda, Elisa Ricci
article
IEEE Transactions on Multimedia, 2023, 25, pp.3841-3854. ⟨10.1109/TMM.2022.3167555⟩
Accès au bibtex
https://arxiv.org/pdf/2202.00432 BibTex
titre
Successor Feature Representations
auteur
Chris Reinke, Xavier Alameda-Pineda
article
Transactions on Machine Learning Research Journal, 2023, pp.1-35
Accès au bibtex
https://arxiv.org/pdf/2110.15701 BibTex
titre
Learning and controlling the source-filter representation of speech with a variational autoencoder
auteur
Samir Sadok, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda, Renaud Séguier
article
Speech Communication, 2023, 148, pp.53-65. ⟨10.1016/j.specom.2023.02.005⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03650569/file/sadok2023learning.pdf BibTex
titre
Uncertainty-aware Contrastive Distillation for Incremental Semantic Segmentation
auteur
Guanglei Yang, Enrico Fini, Dan Xu, Paolo Rota, Mingli Ding, Moin Nabi, Xavier Alameda-Pineda, Elisa Ricci
article
IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45 (2), pp.2567-2581. ⟨10.1109/TPAMI.2022.3163806⟩
Accès au bibtex
https://arxiv.org/pdf/2203.14098 BibTex

Conference papers

titre
Unsupervised speech enhancement with deep dynamical generative speech and noise models
auteur
Xiaoyu Lin, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda
article
Interspeech 2023 - 24th Annual Conference of the International Speech Communication Association, ISCA, Aug 2023, Dublin, Ireland. pp.1-5
Accès au bibtex
https://arxiv.org/pdf/2306.07820 BibTex
titre
Semi-supervised learning made simple with self-supervised clustering
auteur
Enrico Fini, Pietro Astolfi, Karteek Alahari, Xavier Alameda-Pineda, Julien Mairal, Moin Nabi, Elisa Ricci
article
CVPR 2023 – IEEE/CVF Conference on Computer Vision and Pattern Recognition, Jun 2023, Vancouver, Canada. pp.1-11
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04073630/file/fini23.pdf BibTex