Les postdoctorants soutenus

Les lauréats 2017

ElMokhtar Ezzahdi ALAYA (MODAL'X, Université de Nanterre, Responsable scientifique: Olga Klopp )
Cécile CARRERE (LJLL, UPMC, Responsable scientifique : Jean Clairambault)
Lenaïc CHIZAT (Inria Paris, équipe SIERRA, Responsable scientifique : Francis Bach)
Dena KAZERANI (ENPC, Inria Paris, équipe MATHERIALS, Responsable scientifique : Sébastien Boyaval)
Pauline Tan (CMLA, Ecole Polytechnique, Responsable scientifique : Mila Nikolova)

Les lauréats 2017

El Mokhtar Essahdi ALAYA (MODAL'X, Université de Nanterre, Responsable scientifique: Olga Klopp )
Projet de recherche : "Completing low-rank matrices has attracted significant attention in machine learning and data mining due to its range of applications such as recommender systems, collaborative filtering, etc. These problems can be phrased as learning an unknown parameter (here a matrix) with very high dimensionality (big data) based on very few observations. The basic principle of matrix completion consists in recovering all the entries of an unknown data matrix, based on partial (and potentially noisy) observations of its entries. A popular example for completion problem is the ``Netflix'' problem, where the rows correspond to viewers and the columns to movies, each entry being the user's rating in 1, ..., 5 of movie. There are about 480K viewers and 18K movies, hence 8.6 billion (8.6 x 10^9) potential entries. However, the rating data are very sparse. Specifically, there exists a subset of users/items where the rating data is entirely missing. This is commonly known as the ``cold-start'' problem. More precisely, on average each viewer rates about 200 movies, so only 1.2% or 10^8 entries are observed. The task is to predict the ratings that viewers would give to movies they have not rated yet. In some practical situations, data is often obtained from a "collection of matrices", i.e., from multiple domains rather a single one. For example, in e-commerce, we can access the user's preferences in different domains and/or additional information such as demographics, social network. In recommendation, user can rate items like movies, books, music. In this context, information from multiple domains can be viewed as a collection of matrices coupled through the common set of users/items. This shared structure among the matrices can be useful to get better predictions. Classical matrix completion have focused on recovering an unknown real-valued low-rank matrix from a random sample of its entries. However, in many real-word problems, the collected outcomes are of mixed types. This includes, for example, continuous measurements and highly quantized observations when the measurements can take only a limited number of values. We thus introduce the "collective matrix completion" problem, where we assume that the observations are parametrized by a collection of sources (domains). In this collection each component, called a view, is matrix-valued data whose rows correspond to a common set of users, and columns represent entities from the respective sources. In the case of multi-domain recommendation, the collective matrix corresponds to rating matrices on different types of items such as "users & movies", "users & books, "users & games", etc. We aim to provide theoretical guarantees and develop efficient algorithms for the collective matrix completion problem."

Cécile CARRERE (LJLL, UPMC, Responsable scientifique : Jean Clairambault)
Projet de recherche : "Nous cherchons à comprendre avec des modèles mathématiques comment une tumeur peut présenter une résistance aux traitements chimiothérapiques. Pour cela, nous nous appuyons sur l'idée du bet hedging, ou stratégie de minimisation des coûts. Soumis à un traitement périodique, les cellules cancéreuses expriment après quelques générations des traits résistants. Nous souhaitons minimiser au cours d'un traitement la taille d'une tumeur, tout en limitant l'apparition de cellules entièrement résistantes. Ce travail sera effectué par la construction et l'analyse de modèles intégro-différentiels, et par optimisation de forme à la fois sur la répartition des phénotypes dans la population, et sur le protocole de traitement à choisir."

Lenaïc CHIZAT (Inria Paris, équipe SIERRA, Responsable scientifique : Francis Bach)
Projet de recherche : "Les métriques de transport optimal permettent une quantification robuste de la dissimilarité entre deux mesures de probabilité. Elles forment, de ce point de vue, un outil idéal dans les contextes, fréquents en apprentissage statistique, où les divergences plus explicites (telles que Kullback-Leibler) sont dégénérées. Cependant, des difficultés d'ordre théorique et computationel limitent leur diffusion dans ce domaine. Nous proposons de lever certaines de ces difficultés en poursuivant trois objectifs liés : (i) estimation de la distance de transport optimal entre mesures empiriques dans les cadres pertinents pour l'apprentissage statistique, (ii) approximation optimale (pour les métriques de transport) de densités par des mesures discrètes à l'aide de processus déterministes, et (iii) méthode de résolution numérique effective du transport optimal entre mesures diffuses."

Dena KAZERANI (ENPC, Inria Paris, équipe MATHERIALS, Responsable scientifique : Sébastien Boyaval)
Projet de recherche : "Le but de ce projet est de proposer une nouvelle modélisation mathématique de processus physiques induisant érosion et sédimentation (de particules solides non-cohésives : sable, graviers) dans les cours d'eau. On s'intéresse en particulier à la modélisation précise des processus mécaniques qui sont couplés à des échanges de matière entre une rivière et son lit, lors du rééquilibrage dynamique des efforts entre le cours d'eau et son lit, après un déséquilibre forcé (crue, chasse de réservoir). La compréhension actuelle des mécanismes physiques en jeu dans l'érosion d'un lit de rivière est en effet très réduite, essentiellement empirique, alors que d'importants progrès semblent possibles, en particulier grâce à des théories récentes en mécaniques des suspensions granulaires denses. La nouvelle modélisation recherchée vise à décrire des phénomènes de transport solide macroscopiques, à l'échelle d'une section de rivière utile aux ingénieurs hydrauliciens."

Pauline Tan (CMLA, Ecole Polytechnique, Responsable scientifique : Mila Nikolova)
Projet de recherche : "Le projet de recherche proposé concerne le traitement des images en interférométrie. Il s'agit d'une technique d'imagerie non conventionnelle utilisée par l'Onera pour collecter des informations sur les zones photographiées par son système aéroporté Sieleters. Le traitement et l'analyse des données constituenta un enjeu important pour exploiter cette technologie. Or, la nature de ces données nécessite de développer des méthodes ad hoc. Au cours de ces trois dernières années, l'Onera a expérimenté, dans des méthodes variationnelles, un modèle de formation d'images qui a donné des résultats encourageants. Ces méthodes m'ont conduit à développer, en collaboration avec Mila Nikolova, une nouvelle méthode d'optimisation non convexe qui, contrairement aux méthodes existantes, tire parti de la structure partiellement convexe des problèmes considérés. Cette démarche, en plus de faciliter l'analyse de la convergence du schéma proposé, présente également l'avantage de conduire à un algorithme dont les itérations sont plus simples à calculer et qui est applicable à une classe de problèmes plus larges que ceux concernés par les méthodes existantes. Les applications à l'Onera mais également dans les problèmes d'estimation conjointe en traitement d'images et en statistiques sont donc nombreuses. L'étude théorique de cet algorithme constitue donc un enjeu important, de même que son application pratique, notamment dans le traitement des images de Sieleters. Ces deux aspects sont au coeur du projet de recherche proposé."