Punti di forza e di debolezza dei modelli di apprendimento per rinforzo: un'applicazione all'orientamento spaziale nei pulcini | Istituto di Scienze e Tecnologie della Cognizione

Questo articolo ha due obiettivi. Il primo è discutere i punti di forza e di debolezza dei modelli di apprendimento per rinforzo (Sutton e Barto, 1998), ed in particolare del modello attore-critico, per lo studio del comportamento animale. Il secondo è mostrare tali punti di forza "in azione" riassumendo i principali risultati ottenuti con una specifica applicazione del modello attore-critico alla modellizzazione di alcuni comportamenti di navigazione spaziale osservati nei pulcini (per maggiori dettagli si veda Mannella e Baldassarre, in stampa). Il primo obiettivo è particolarmente importante in quanto, nonostante le notevoli potenzialità dei modelli di apprendimento per rinforzo, la comunità di vita artificiale tende ad usare poco questi modelli, ad esempio rispetto ai modelli basati sugli algoritmi genetici, l'apprendimento supervisionato e l'apprendimento non supervisionato (si veda ad esempio il tipo di modelli utilizzati nell'ultimo Workshop Italiano di Vita Artificiale, Baldassarre et al., 2005, e nell'ultima conferenza internazionale di Artificial Life, Pollak et al., 2004). Dapprima l'articolo presenterà gli esperimenti sui pulcini reali riprodotti e studiati con il modello qui presentato e le interpretazioni teoriche dei risultati fornite dagli autori degli stessi (sez. 2). Poi illustrerà il modello (sez. 3) ed i risultati ottenuti con esso (sez. 4). In seguito elencherà i punti di forza dei modelli di apprendimento per rinforzo, tra cui la notevole plausibilità biologica della versione attore-critico (sez. 5). Infine presenterà un'analisi delle debolezze di tali modelli e delle ragioni tecniche e storiche della loro scarsa diffusione nella comunità di vita artificiale (sez. 6).

Publication type:

Articolo

Author or Creator:

Mannella Francesco

Baldassarre Gianluca

Publisher:

Società Editrice il Mulino, Bologna , Italia

Source:

Sistemi intelligenti (Testo stamp.) 18 (2006): 75–84.

info:cnr-pdr/source/autori:Mannella Francesco, Baldassarre Gianluca/titolo:Punti di forza e di debolezza dei modelli di apprendimento per rinforzo: un'applicazione all'orientamento spaziale nei pulcini/doi:/rivista:Sistemi intelligenti (Testo stamp.)/anno

Date:

2006

Resource Identifier:

http://www.cnr.it/prodotto/i/353510

Language:

Ita

ISTC Author:

Real name:

Gianluca Baldassarre

Real name:

Francesco Mannella