Federated learning
Abstract
Dans le Machine Learning traditionnel, les données sont déplacées des appareils Edge/IoT (« clients ») vers des machines puissantes (« serveurs ») pour la phase d'apprentissage, soulevant des problèmes de confidentialité car les données sensibles collectées à la frange du réseau représentent souvent des actions ou des propriétés des utilisateurs.
Google a introduit l'« apprentissage fédéré » en 2016 comme une solution, en transmettant des mises à jour du modèle au lieu des données brutes. Même si cela ne résout pas entièrement les problèmes de confidentialité en raison d'attaques possibles sur les mises à jour du modèle (par exemple Inversions de Modèle), il s'agit d'une première étape cruciale. L'apprentissage fédéré a également introduit la distribution du processus d'apprentissage sur toutes les machines participantes au lieu de le centraliser sur un serveur puissant.
Les appareils Edge et IoT peuvent être hétérogènes en termes de matériel et de logiciel, et ont moins de puissance de calcul que les serveurs ou même les ordinateurs personnels. Ils fonctionnent souvent sur piles et doivent donc économiser l'énergie. Cela a conduit à la renaissance du "TinyML", qui vise à construire des modèles ML aussi efficaces que possible, en utilisant des techniques telles que la quantification, l'élagage, la distillation ou LoRA.