Aprenentatge automàtic
De Viquipèdia
L'Aprenentatge automàtic és un camp de la intel·ligència artificial que està dedicat al disseny, anàlisi i desenvolupament d'algoritmes i tècniques que permeten que les màquines evolucionin.
L'aprenentatge automàtic està relacionat amb altres camps. Té un cert solapament amb l'estadística. En particular, té solapament amb els mètodes de construcció de models, o l'aprenentatge estadístic. També hi ha punts de contacte amb la informàtica teòrica. Això és degut a la complexitat computacional dels problemes. La majoria són de la classe NP-hard.
L'aprenentatge s'ha aplicat en molts camps diferents. Podem destacar les aplicacions dedicades al processament del llenguatge natural, als algorismes de cerca, la diagnòsi mèdica, la bioinformàtica, la detecció de fraus i la classificació.
Taula de continguts |
[edita] Tipus d'algorismes
Els algorismes d'aprenentatge automàtic es classifiquen d'acord amb allò que s'espera que el programa aprengui. Els tipus d'algorismes més comuns són els d'aprenentatge supervisat, no supervisat i per reforçament. Són descrits a continuació.
- Aprenentatge supervisat. — L'algorisme genera una funció que relaciona cada entrada amb la sortida desitjada. En el cas de problemes de classificació tenim que el sistema ha d'aprendre una funció (aproximar la conducta de la funció) a partir d'uns exemples que s'expressen en termes de l'aplicació d'un vector
a un conjunt de classes. Les xarxes neuronals (supervisades) i els arbres de decisió són exemples d'algorismes d'aprenentatge supervisat. - Aprenentatge no supervisat — L'algorisme disposa d'un conjunt d'exemples, però no de la classe que els hi correspon. Això és, que els exemples no estan etiquetats com passa en el cas anterior. Els algorismes de categorització (en anglès, clustering) són un exemple d'aquests tipus d'aprenentatge.
- Aprenentatge per reforçament — Un cop realitzada l'acció que pren el sistema s'obté un retorn per part de l'entorn (una gratificació o una penalització segons si l'acció ha estat exitosa o no). Aquest retorn es fa servir per guiar l'algorisme d'aprenentatge.
[edita] Bibliografia
- Bishop, C. M. (1995). Neural Networks for Pattern Recognition, Oxford University Press. ISBN 0198538642
- Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0471056693
- Antoine Cornuéjols, Laurent Miclet, Yves Kodratoff (2002) Apprentissage Artificiel: Concepts et algorithmes, Eyrolles, ISBN 2-212-11020-0
- Huang T.-M., Kecman V., Kopriva I. (2006), Kernel Based Algorithms for Mining Huge Data Sets, Supervised, Semi-supervised, and Unsupervised Learning, Springer-Verlag, Berlin, Heidelberg, 260 pp. 96 illus., Hardcover, ISBN 3-540-31681-7[1]
- KECMAN Vojislav (2001), LEARNING AND SOFT COMPUTING, Support Vector Machines, Neural Networks and Fuzzy Logic Models, The MIT Press, Cambridge, MA, 608 pp., 268 illus., ISBN 0-262-11255-8[2]
- MacKay, D. J. C. (2003). Information Theory, Inference, and Learning Algorithms, Cambridge University Press. ISBN 0521642981
- Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN 0070428077
- Sholom Weiss and Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5
[edita] Alguns temes d'aprenentatge automàtic
- xarxa neuronal
- arbre de decisió
- veí més proper
- màquina de vectors de suport
[edita] Vegeu també
- WEKA Entorn de programari open-source sobre aprenentatge automàtic

