Publications HAL du projet ANR. ML3RI

2024

Journal articles

titre
A Multimodal Dynamical Variational Autoencoder for Audiovisual Speech Representation Learning
auteur
Samir Sadok, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda, Renaud Séguier
article
Neural Networks, 2024, 172, pp.106120. ⟨10.1016/j.neunet.2024.106120⟩
Accès au bibtex
https://arxiv.org/pdf/2305.03582 BibTex
titre
Mixture of Dynamical Variational Autoencoders for Multi-Source Trajectory Modeling and Separation
auteur
Xiaoyu Lin, Laurent Girin, Xavier Alameda-Pineda
article
Transactions on Machine Learning Research Journal, 2024, pp.1-19
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03584014/file/2202.09315.pdf BibTex

2023

Journal articles

titre
Continual Attentive Fusion for Incremental Learning in Semantic Segmentation
auteur
Guanglei Yang, Enrico Fini, Dan Xu, Paolo Rota, Mingli Ding, Hao Tang, Xavier Alameda-Pineda, Elisa Ricci
article
IEEE Transactions on Multimedia, 2023, 25, pp.3841-3854. ⟨10.1109/TMM.2022.3167555⟩
Accès au bibtex
https://arxiv.org/pdf/2202.00432 BibTex
titre
Variational Meta Reinforcement Learning for Social Robotics
auteur
Anand Ballou, Xavier Alameda-Pineda, Chris Reinke
article
Applied Intelligence, 2023, pp.1-16. ⟨10.1007/s10489-023-04691-5⟩
Accès au bibtex
https://arxiv.org/pdf/2206.03211 BibTex
titre
Successor Feature Representations
auteur
Chris Reinke, Xavier Alameda-Pineda
article
Transactions on Machine Learning Research Journal, 2023, pp.1-35
Accès au bibtex
https://arxiv.org/pdf/2110.15701 BibTex
titre
Learning and controlling the source-filter representation of speech with a variational autoencoder
auteur
Samir Sadok, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda, Renaud Séguier
article
Speech Communication, 2023, 148, pp.53-65. ⟨10.1016/j.specom.2023.02.005⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03650569/file/sadok2023learning.pdf BibTex

Conference papers

titre
Unsupervised speech enhancement with deep dynamical generative speech and noise models
auteur
Xiaoyu Lin, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda
article
Interspeech 2023 - 24th Annual Conference of the International Speech Communication Association, ISCA, Aug 2023, Dublin, Ireland. pp.1-5
Accès au bibtex
https://arxiv.org/pdf/2306.07820 BibTex
titre
Semi-supervised learning made simple with self-supervised clustering
auteur
Enrico Fini, Pietro Astolfi, Karteek Alahari, Xavier Alameda-Pineda, Julien Mairal, Moin Nabi, Elisa Ricci
article
CVPR 2023 – IEEE/CVF Conference on Computer Vision and Pattern Recognition, Jun 2023, Vancouver, Canada. pp.1-11
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04073630/file/fini23.pdf BibTex
titre
Speech Modeling with a Hierarchical Transformer Dynamical VAE
auteur
Xiaoyu Lin, Xiaoyu Bie, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda
article
ICASSP 2023 - IEEE International Conference on Acoustics, Speech and Signal Processing, Jun 2023, Rhodes, Greece. pp.1-5, ⟨10.1109/ICASSP49357.2023.10096751⟩
Accès au bibtex
https://arxiv.org/pdf/2303.09404 BibTex

Preprints, Working Papers, ...

titre
Univariate Radial Basis Function Layers: Brain-inspired Deep Neural Layers for Low-Dimensional Inputs
auteur
Basavasagar Patil, Xavier Alameda-Pineda, Chris Reinke
article
2023
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04342724/file/2311.16148.pdf BibTex