Apprentissage machine pour l'accès dynamique au spectre : de la théorie au prototypage sur signaux radio réels - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Apprentissage machine pour l'accès dynamique au spectre : de la théorie au prototypage sur signaux radio réels

Résumé

Nous présentons les résultats de la mise en oeuvre pratique de techniques d'apprentissage par renforcement (algorithme UCB - Upper Confidence Bound) sur des signaux radio réels, dans un scénario d'accès opportuniste au spectre (OSA - Opportunistic Spectrum Access). Nous avons identifié ces algorithmes il y a 7 ans dans le domaine de l'apprentissage machine (initialement conçus pour gagner aux machines à sous - Multi-Armed Bandit ou MAB), puis nous avons confronté de manière théorique leur robustesse aux imperfections rencontrées dans le cas de communications radio, ce qui a validé leur potentiel. Enfin nous montrons que les résultats de leur mise en oeuvre sur des signaux réels confirment leur capacité à faire apprendre à un terminal secondaire quelles opportunités spectrales il doit saisir, en d'autres termes de prédire quelles sont les bandes qui ont la plus grande probabilité d'être libre. Cette approche peut être utilisée dans un contexte futuriste de radio intelligente (cognitive radio) et plus particulièrement d'accès opportuniste au spectre généralisé à de multiples bandes de fréquence afin de répondre à la pénurie de spectre actuelle, mais aussi dans un le contexte actuel des bandes non licenciées. Les expérimentations montrent même une convergence étonnamment rapide alors que l'approche théorique n'offrait que des garanties de convergence asymptotique. Ainsi en quelques instants (de l'ordre de quelques secondes) un équipement secondaire ayant de telles capacités peut découvrir et exploiter les instants où des canaux sont laissés vacants par des utilisateurs primaires ayant un comportement temporel et fréquentiel dynamique. Description de la démo : Le démonstrateur est composé de 2 plates-formes USRP, chacune associée à un PC portable. Une plate-forme génère le traffic radio d'utilisateurs primaires communicants aléatoirement en temps et en fréquence sur 8 canaux. Ceci est conçu sous GNU Radio Companion. L'autre plate-forme est un utilisateur secondaire dont seuls un capteur de détection d'énergie et l'algorithme d'apprentissage sont implantés (pas la partie communication avec un interlocuteur secondaire). On observe en temps réel les progrès de l'apprentissage de l'utilisateur secondaire et le taux d'opportunités qu'il découvre et qui surpasse quasi immédiatement d'un facteur 2 celui d'un utilisateur non doté de facultés d'apprentissage. Très rapidement ce taux d'opportunités devient égal à celui du meilleur des 8 canaux, c'est-à-dire celui qui a la plus faible probabilité d'être occupé par un utilisateur primaire. On montre en outre que le coût de calcul de l'apprentissage est quasiment nul, environ de 1% celui du détecteur d'énergie qui permet de détecter qu'une bande est libre ou occupée. L'apprentissage par UCB pourrait être utilisé après n'importe quel autre moyen de détection (détecteur de cyclostationnarités, etc.)
Fichier principal
Vignette du fichier
CentraleSupelec_DGA-MI_3juin2015.pdf (2.62 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01167405 , version 1 (24-06-2015)

Identifiants

  • HAL Id : hal-01167405 , version 1

Citer

Christophe Moy. Apprentissage machine pour l'accès dynamique au spectre : de la théorie au prototypage sur signaux radio réels. Journée DGA-MI "Applications radio sur plate-forme SDR", Jun 2015, Bruz, France. ⟨hal-01167405⟩
92 Consultations
56 Téléchargements

Partager

Gmail Facebook X LinkedIn More