Algoritmo Baseado em Aprendizado por Reforço e Modelo Markoviano para Alocação de Recursos em um Sistema Internet das Coisas Cognitivo
Matheus Matos Vasconcelos, Alisson Cardoso, Flávio Vieira

DOI: 10.14209/SBRT.2020.1570661613
Evento: XXXVIII Simpósio Brasileiro de Telecomunicações e Processamento de Sinais (SBrT2020)
Keywords: Aprendizado por Reforço Cadeia de Markov Internet das Coisas (IdC) Escalonamento
Abstract
Este artigo propõe a utilização de um algoritmo de aprendizado por reforço para controlar a transmissão de pacotes de múltiplos dispositivos em um sistema de comunicação sem fio baseado no conceito de Internet das Coisas (IdC) Cognitivo. A abordagem proposta consiste em adotar uma cadeia de Markov para modelar os estados do sistema de comunicação e suas transições, fornecendo os parâmetros necessários para determinar ações para o sistema através de um algoritmo Q-Learning. O artigo também apresenta uma avaliação do desempenho do algoritmo desenvolvido em comparação aos de alguns algoritmos de escalonamento em termos de vários parâmetros, tais como: função de utilidade, vazão, ocupação do buffer, taxa de perda de pacotes, etc.

Download