Punti di forza e di debolezza dei modelli di apprendimento per rinforzo: un'applicazione all'orientamento spaziale nei pulcini

Questo articolo ha due obiettivi. Il primo è discutere i punti di forza e di debolezza dei modelli di apprendimento per rinforzo (Sutton e Barto, 1998), ed in particolare del modello attore-critico, per lo studio del comportamento animale. Il secondo è mostrare tali punti di forza "in azione" riassumendo i principali risultati ottenuti con una specifica applicazione del modello attore-critico alla modellizzazione di alcuni comportamenti di navigazione spaziale osservati nei pulcini (per maggiori dettagli si veda Mannella e Baldassarre, in stampa). Il primo obiettivo è particolarmente importante in quanto, nonostante le notevoli potenzialità dei modelli di apprendimento per rinforzo, la comunità di vita artificiale tende ad usare poco questi modelli, ad esempio rispetto ai modelli basati sugli algoritmi genetici, l'apprendimento supervisionato e l'apprendimento non supervisionato (si veda ad esempio il tipo di modelli utilizzati nell'ultimo Workshop Italiano di Vita Artificiale, Baldassarre et al., 2005, e nell'ultima conferenza internazionale di Artificial Life, Pollak et al., 2004). Dapprima l'articolo presenterà gli esperimenti sui pulcini reali riprodotti e studiati con il modello qui presentato e le interpretazioni teoriche dei risultati fornite dagli autori degli stessi (sez. 2). Poi illustrerà il modello (sez. 3) ed i risultati ottenuti con esso (sez. 4). In seguito elencherà i punti di forza dei modelli di apprendimento per rinforzo, tra cui la notevole plausibilità biologica della versione attore-critico (sez. 5). Infine presenterà un'analisi delle debolezze di tali modelli e delle ragioni tecniche e storiche della loro scarsa diffusione nella comunità di vita artificiale (sez. 6).

Publication type: 
Articolo
Author or Creator: 
Mannella Francesco
Baldassarre Gianluca
Publisher: 
Società Editrice il Mulino, Bologna , Italia
Source: 
Sistemi intelligenti (Testo stamp.) 18 (2006): 75–84.
info:cnr-pdr/source/autori:Mannella Francesco, Baldassarre Gianluca/titolo:Punti di forza e di debolezza dei modelli di apprendimento per rinforzo: un'applicazione all'orientamento spaziale nei pulcini/doi:/rivista:Sistemi intelligenti (Testo stamp.)/anno
Date: 
2006
Resource Identifier: 
http://www.cnr.it/prodotto/i/353510
Language: 
Ita
ISTC Author: 
Francesco Mannella's picture
Real name: