13.07.2015 Views

Progettazione e realizzazione di una base robotica bilanciante su ...

Progettazione e realizzazione di una base robotica bilanciante su ...

Progettazione e realizzazione di una base robotica bilanciante su ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

10 Capitolo 2. Stato dell’artenella <strong>realizzazione</strong> del robot, progettare un sistema <strong>di</strong> controllo dei motoriche sia in grado <strong>di</strong> inseguire con alta precisione un setpoint in coppia, perrispettare le con<strong>di</strong>zioni simulate.Sulla <strong>base</strong> delle tipologie <strong>di</strong> controllo classiche sono state sviluppati ancheforme <strong>di</strong> controllo ibride, ad esempio sfruttando la logica fuzzy per lataratura dei parametri <strong>di</strong> un controllore PID[11], oppure introducendo dellereti neurali per stimare i comportamenti non lineari del sistema[12].Il problema del bilanciamento <strong>di</strong> un pendolo inverso è stato approfon<strong>di</strong>tamentestu<strong>di</strong>ato anche nel campo dell’appren<strong>di</strong>mento automatico. Oltreai già citati A.G. Barto e R.S. Sutton, che hanno utilizzato proprio questoproblema per valutare l’efficacia delle tecniche da loro presentate, molti altriricercatori hanno avuto <strong>su</strong>ccesso nel mantenere in equilibrio <strong>una</strong> strutturaa pendolo inverso utilizzando soluzioni completamente <strong>di</strong>fferenti rispetto aquelle mostrate fino ad ora.Sono stati presentati stu<strong>di</strong> in cui <strong>una</strong> rete neurale viene dapprima utilizzataper prevedere il comportamento <strong>di</strong>namico del sistema, senza basarsi <strong>su</strong> unmodello, e quin<strong>di</strong> espansa al fine <strong>di</strong> imparare <strong>una</strong> strategia <strong>di</strong> controllo ingrado <strong>di</strong> far seguire alle variabili <strong>di</strong> stato delle traiettorie predefinite[13].Altri approcci model-free sono stati proposti sfruttando il para<strong>di</strong>gma dell’appren<strong>di</strong>mentoper rinforzo[14], in cui l’algoritmo <strong>di</strong> controllo viene addestratoosservando <strong>una</strong> serie <strong>di</strong> dati raccolti mentre il robot esegue azioni completamenteca<strong>su</strong>ali. Sulla <strong>base</strong> dello spazio visitato, l’algoritmo riesce ad apprenderela <strong>di</strong>namica del moto in relazione all’azione compiuta e a generalizzarela conoscenza acquisita per estenderla anche a stati mai visitati, ricavandoun modello del sistema. Viene quin<strong>di</strong> stimata <strong>una</strong> politica <strong>di</strong> controllo ingrado <strong>di</strong> mantenere l’equilibrio del robot ed inseguire un determinato setpoint.Questa tecnica ha mostrato ottimi ri<strong>su</strong>ltati al simulatore, rendendointeressante <strong>una</strong> <strong>su</strong>a applicazione ad un robot reale.In questo lavoro <strong>di</strong> tesi ci si propone <strong>di</strong> realizzare <strong>una</strong> piattaforma mobile<strong>bilanciante</strong> <strong>di</strong> <strong>di</strong>mensioni tali da rendere possibile il movimento in ambientidomestici e l’interazione con l’uomo, in grado <strong>di</strong> trasportare eventuali<strong>di</strong>spositivi accessori e capace <strong>di</strong> seguire un profilo <strong>di</strong> velocità. Dopo averprogettato e realizzato l’hardware, ci si concentrerà <strong>su</strong>lla strategia <strong>di</strong> controllo,analizzando sia gli approcci classici, quali controllori PID e LQR,sia tecniche innovative basate <strong>su</strong>ll’appren<strong>di</strong>mento per rinforzo, che hannomostrato ri<strong>su</strong>ltati promettenti nell’ambiente simulato.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!