Naslov (srp)

Redukcija dimenzionalnosti podataka u klasifikacionim problemima veštačke inteligencije

Autor

Novaković, Jasmina Đ., 1965-

Doprinosi

Veljović, Alempije, 1951- (ths, code: 06976)
Micić, Živadin, 1955- (oth, code: 06987)
Milanović, Dragan. (oth)
Radenković, Božidar, 1958- (oth, code: 01723)
Milošević, Danijela, 1967- (oth, code: 06997)

Opis (srp)

Središnji problem mašinskog učenja je identifikovanje reprezentativnog seta podataka na osnovu koga će se konstruisati klasifikacioni model za svaki pojedinačni zadatak. U ovoj doktorskoj disertaciji istražujemo problem redukcije dimenzionalnosti podataka u klasifikacionim problemima veštačke inteligencije korišćenjem različitih metoda za selekciju i ekstrakciju atributa. Metode selekcije atributa obuhvataju: metode filtriranja, metode prethodnog učenja i ugrađene metode. Osnovna hipoteza je da je moguće znatno poboljšati performanse sistema za induktivno učenje pravila u problemima klasifikacije, primenom različitih metoda i tehnika redukcije dimenzionalnosti podataka. Evaluacija svakog atributa u setu podataka vrši se na osnovu predloženog generičkog modela za selekciju i vrednovanje svakog pojedinačnog atributa. U radu, biće predložen veliki broj algoritama koji se koriste u redukciji dimenzionalnosti podataka i biće izvršena njihova evaluacija na veštačkim i prirodnim skupovima podataka. Za potrebe klasifikacije koristi se veliki broj algoritama: k-najbliži susedi, Bajesovi klasifikatori, stabla odlučivanja, veštačke neuronske mreže i potporni vektori. Eksperimentalni rezultati pokazuju da se ovim metodama mogu brzo identifikovati nevažni, redundantni atributi, kao i šum u podacima ako on postoji; kao i oni atributi koji su značajni za izučavanu pojavu. U radu se istražuje uticaj redukcije dimenzionalnosti podataka na izgradnju modela, što je naročito značajno kada imamo veliki broj atributa i veliki broj instanci, što je čest slučaj posebno u bioinformatici, analizi dokumenata, slika i glasa. U radu, biće razmatran uticaj metoda za selekciju i ekstrakciju atributa na rad svakog pojedinačnog algoritma za klasifikaciju, bez obzira da li on već ima ugrađene metode za predselekciju atributa. Ako algoritam već ima ugrađenu predselekciju atributa, biće istražena dobit od nezavisne predselekcije atributa.

Opis (srp)

Beleška o autoru.Univerzitet u Kragujevcu, Fakultet tehničkih nauka u Čačku, 2013, doktor tehničkih nauka. Umnoženo za odbranu.Bibliografija: listovi 207-213. Rezime ; Abstract. datum odbrane: 10.10.2013. null

Opis (eng)

The central problem of machine learning is to identify a representative set of data to construct a classification model for each individual task. In this doctoral dissertation, we investigate the problem of dimensionality reduction of data in the classification problems of artificial intelligence using different methods for selecting and extracting attributes. Methods of selection attributes include: filter, wrappers and embedded methods. The basic hypothesis is that it is possible to significantly improve the performance of the system for inductive learning of rules for classification problems, using different methods and techniques for data dimensionality reduction. The evaluation of each attribute in the data set is based on the proposed generic model for the selection and evaluation of each attribute. This paper will be proposed a number of algorithms that are used in reducing the dimensionality of the data and their evaluation will be performed on artificial and natural data sets. For the purposes of classification is used a large number of algorithms: k-nearest neighbors, Bayesian classifiers, decision trees, artificial neural networks and support vector machine. The experimental results show that these methods can quickly identify irrelevant or redundant attributes, as well as noise in the data, if it exists; also those attributes that are important for the studied problem. This paper will examines the impact of dimensionality reduction of data to build the model, which is especially important when we have a large number of attributes and a large number of instances, which is often the case, especially in bioinformatics, analysis of documents, images and voice. In this paper, the impact of methods for selection and extraction of the attributes will be considered for each algorithm for classification, regardless of whether they already have a built-in method for preselection of attributes. If the algorithm already has a built-in method for preselection of attributes, will be investigated the influence of an independent selection of attributes.

Jezik

srpski

Datum

2013

Licenca

Creative Commons licenca
Ovo delo je licencirano pod uslovima licence
Creative Commons CC BY-NC 2.0 AT - Creative Commons Autorstvo - Nekomercijalno 2.0 Austria License.

CC BY-NC 2.0 AT

http://creativecommons.org/licenses/by-nc/2.0/at/

Identifikatori