Índice:
2025 Autor: John Day | [email protected]. Última modificação: 2025-01-13 06:58
O que eu fiz?
● Um bot que pode ser treinado para andar (seguir em frente) em superfícies diferentes. O bot descreve uma criatura simples com 4 pernas "sem joelhos" que está lutando para se mover para frente. Ele sabe que pode orientar cada uma das pernas de apenas 3 maneiras possíveis. Agora, ele precisa descobrir as melhores etapas possíveis para se manter em movimento. Uma vez que seu movimento também depende do atrito com a superfície, acreditamos que para cada superfície diferente que ela caminhar, haverá um conjunto diferente (não necessariamente exclusivo, mas provavelmente semelhante) de etapas para maximizar seu esforço de avançar.
Para que isso é usado?
● É melhor usado para visualizar os padrões de caminhada de um AI ROBOT.
Etapa 1: o diagrama de fluxo
Aqui está uma análise de todo o projeto. Em linhas gerais o projeto é em 2 partes eletrônicas com estrutura mecânica do robô e a outra é o algoritmo rodando no pc e o código rodando no arduino.
Etapa 2: PRINCIPAIS COMPONENTES ENVOLVIDOS:
Eletrônicos
Arduino UNO (!)
Sensor ultrasônico
Servo Motors
Módulo bluetooth
Codificação
IDE Arduino
Teraterm
Notebook Jupyter
Algoritmo de aprendizagem Q
Etapa 3: MÓDULO V1:
Aprendizagem por Reforço: Usando RNA (Rede Neural Artificial) planejamos treinar nosso robô e descobrimos dois métodos possíveis.
Restrições: Cada perna (servo motor) é restringida para assumir apenas 3 posições possíveis 60, 90 e 120 graus. Premissas: Consideramos que o movimento do robô constituirá 4 estados (um estado é uma determinada orientação de todos os quatro servos), ou seja, haverá 4 estados diferentes do robô que consideraremos como 4 etapas, respectivamente, dando-nos um ciclo de movimento, em qual o bot se moverá um pouco à frente. Este ciclo será repetido ad infinitum para manter o robô em movimento.
Mas o único problema era o número de iterações a serem avaliadas - Temos 3 orientações possíveis para cada motor e existem 4 motores diferentes, tornando 3 ^ 4 = 81 estados nos quais o robô pode existir em uma única etapa ou estado. Temos que dar 4 passos diferentes para completar um movimento complexo, o que significa 81 ^ 4 = 43, 046, 721 combinações possíveis a serem verificadas quanto à eficiência máxima para um ciclo de movimento. Suponha que leve 5 segundos para treinar um único estado - levaria 6,8250 anos para concluir o treinamento!
Etapa 4: MÓDULO V2:
Algoritmo Q-learning
Um algoritmo de aprendizado de reforço inicial desenvolvido para treinar coisas que têm estado finito e encontrar os caminhos mais curtos. fonte:
Matemática do Algoritmo: Existem 81 estados possíveis para cada etapa em que o bot pode estar, nomeamos esses estados como números de 1 a 81 e agora o que queremos saber é o valor de transição, significando a mudança na posição do robô (distância movida) enquanto se move de um estado aleatório s1 para algum outro estado s2 (s1, s2 desses 81 estados). Podemos vê-lo como uma matriz com 81 linhas e 81 colunas onde um elemento da matriz será igual ao valor da distância que ele se moveu correspondente ao seu número de linha e coluna. Esses valores podem ser positivos ou negativos dependendo da ação do robô na palavra real. Agora encontraremos um circuito fechado de estados onde a distância que percorre é sempre positiva. Estaremos avaliando os valores da matriz 81x81 que são 81 ^ 2 = 6561, agora se levarmos 5 segundos para armazenar esses valores na matriz, então leve 9,1125 horas apenas para fazer uma matriz inteira e, em seguida, um ciclo de etapas para maximizar a eficiência da movimentação pode ser facilmente descoberto.
Etapa 5: PROBLEMAS ENVOLVIDOS -
- Para alguns estados, o movimento do bot era muito irregular e estava afetando o valor do sensor de ultrassom, o bot se inclinava e pegava distância de uma parede distante.
- O problema de desconectar do laptop e reiniciar o arduino estava fazendo com que ele treinasse a partir do valor 0 era muito irritante.
- Assistir o robô treinar por 5h contínuas foi muito exaustivo.
Etapa 6: MÓDULO A1 e A2:
- Parte mecânica inclui a placa do chassi com quatro servos fixados nela. Usamos palitos de sorvete para fazer as pernas.
- Nossa tarefa principal - manter o controle da distância do bot de sua posição inicial.
- Nossa primeira abordagem foi usar o sensor giroscópio e usar a aceleração do bot conforme ele se move para extrair sua velocidade e, posteriormente, sua posição.
- Problema - acabou sendo muito complicado de implementar! Alternativa - Restringimos o movimento do bot a apenas uma dimensão e usamos um sensor ultrassônico para medir a distância de uma parede bem à frente.
- O módulo HC05-Bluetooth foi usado durante o período de treinamento para transmitir a taxa de transição de distância entre duas etapas para o PC e lá os dados foram armazenados em uma matriz.
Etapa 7: Link para vídeos:
Passos de bebê:
Foto de treinamento:
Quase em linha reta:
Vídeo do robô dançando:
Vídeo final0: