DUK

Dažnai užduodami klausimai

Kas yra DAMIS?

DAMIS (duomenų analizės įrankis) – tai atvira mokslo infrastruktūra, skirta duomenų analizei atlikti. Įrankio paskirtis – sudaryti galimybę atlikti pagrindinius duomenų analizės tyrimus (grupavimą, klasifikavimą ir kt.); vizualios analizės priemonėmis tirti daugiamačių duomenų projekcijas į plokštumą, duomenų grupavimąsi, duomenų panašumus, atskirų daugiamačių duomenų požymių įtaką ir tarpusavio priklausomybes; stebėti bei apdoroti vizualizacijos ar našiųjų skaičiavimų aplinkoje gautus tyrimų rezultatus.

Kokie duomenų analizės metodai yra prieinami DAMIS įrankyje?

DAMIS įrankyje šiuo metu yra prieinami šie duomenų analizės metodai:
  • Pagrindinių komponenčių analizės (PCA) algoritmas.
  • Daugiamačių skalių grupei (MDS) priklausantis klasikinis SMACOF algoritmas.
  • SMACOF algoritmo Zeidelio modifikacija (SMACOF (MDS)).
  • Diagonalinis mažoravimo algoritmas (DMA).
  • Santykinės daugiamatės skalės (Relative MDS).
  • Dirbtiniais neuroniniais tinklais ir daugiamatėmis skalėmis grindžiamas SAMANN algoritmas.
  • Saviorganizuojančiais neuroniniais tinklais (SOM) grindžiamas algoritmas.
  • MDS ir SOM junginys (SOM-MDS).
  • Daugiasluoksnis perceptronas (MLP) grindžiamas klaidos sklidimo atgal taisykle.
  • Atsitiktinių miškų (RDF) klasifikatorius
  • K-vidurkių (K-means) algoritmas.

Kaip eksperimente panaudoti prieš tai įkeltą duomenų failą?

Eksperimento metu norint panaudoti prieš tai įkeltą duomenų failą prie eksperimento darbų sekos reikia prijungti komponentę  "Pasirinkti įkeltą failą".

Kokiais formatais turi būti pateikiami sistemai duomenis?

DAMIS įrankiui duomenys gali būti pateikiami šiais formatais: arff, tab, txt, csv, XML, xls, zip. Taip pat naudotojas turi galimybę redaguoti arba ištrinti jau įkeltus failus. Pasirinkus failų valdymo skiltį yra rodomas jau įkeltų duomenų failų sąrašas, kuriame pateiktas kiekvieno saugomo failo pavadinimas ir dydis. Failų sąrašą galima rūšiuoti pagal duomenų failų pavadinimus, įkėlimo datą. Įkeltus ir gautus rezultatų failus po darbų sekų įvykdymo naudotojas gali atsiųsti į savo kompiuterį arba patalpinti MIDAS archyve šiais formatai: arff, zip, tab, csv, xls, xlsx.

Kodėl darbui su DAMIS įrankiu geriau pasirinkti ARFF formato failą ir kaip geriau aprašyti duomenis?

Norint išvengti klaidų ir kitų nepatogumų, patartina pasirinkti ARFF formato failą. ARFF (Attribute-Relation File Format) failas – ASCII tekstinis failas, kuriame objektai, sudarantys konkrečią analizuojamų objektų aibę, yra apibūdinami bendrais požymiais. ARFF failas sudarytas iš dviejų dalių: antraštė ir duomenys.

ARFF failo antraštę sudaro: informacija apie duomenų aibės pavadinimą (@RELATION), požymių sąrašas (@ATTRIBUTE) ir jų tipai (NUMERIC (real arba integer), STRING, DATA, <galimų_reikšmių_aibė>):

   @RELATION iris

   @ATTRIBUTE sepallength  NUMERIC
   @ATTRIBUTE sepalwidth   NUMERIC
   @ATTRIBUTE petallength  NUMERIC
   @ATTRIBUTE petalwidth   NUMERIC
   @ATTRIBUTE class        {Iris-setosa,Iris-versicolor,Iris-virginica}

ARFF failo duomenys aprašomi, kaip pavaizduota pavyzdyje:

   @DATA
   5.1,3.5,1.4,0.2,Iris-setosa
   4.9,3.0,1.4,0.2,Iris-setosa
   4.7,3.2,1.3,0.2,Iris-setosa
   4.6,3.1,1.5,0.2,Iris-setosa
   5.0,3.6,1.4,0.2,Iris-setosa

Trūkstamos reikmės keičiamos klaustuko ženklu "?":

   @DATA
   ?,3.5,?,0.2,Iris-setosa

Kaip peržiūrėti eksperimentų rezultatus?

Norint peržiūrėti gautus eksperimentų rezultatus, į eksperimento užduočių seką reikia įkelti vieną iš trijų komponenčių:  

  • „Techninė informacija“ – tai komponentė, skirta techninei informacijai peržiūrėti: skaičiavimo laikui, gautos paklaidos ir kt.
  • „Matricinis vaizdavimas“ – tai komponentė, kurios pagalba naudotojas galės peržiūrėti duomenis ar algoritmų rezultatus matricos (lentelės) pavidalu, kai ši komponentė bus sujungta su failo įkėlimo ar algoritmo komponente.
  • „Grafinis vaizdavimas“ – tai komponentė, kurios pagalba naudotojas galės peržiūrėti rezultatų grafiką, sujungus su vykdyto algoritmo komponente ir spragtelėjus ją du kartus. Atsidariusiame grafike naudotojas galės matyti grafiką.

Naudotojas rezultatų peržiūros komponentes galės naudoti tik tuomet, kai bus apskaičiuoti eksperimento rezultatai.

Komponentės „Grafinis vaizdavimas“ ir „Matricinis vaizdavimas“ turi galimybę atsiųsti rezultatus.

Kaip atlikti eksperimentą?

Norint atlikti eksperimentą su norima duomenų aibe, reikia sukurti norimą darbų seką ir ją įvykdyti. Tam reikia nutempti į eksperimento planavimo darbalaukį norimas komponentes, užpildyti reikiamų valdymo parametrų reikšmes, sujungti reikiamas komponentes ir paspausti mygtuką „vykdyti“. Tuomet atidaromas eksperimento vykdymo parametrų užpildymo langas. Užpildžius reikiamus laukus ir paspaudus mygtuką „Patvirtinti“, vyksta sekos patikrinimas: tikrinami kiekvienos komponentės įvesti valdymo parametrai ir kiekvienos komponentės sujungimas. Jei sekoje rastos klaidos, rodomas klaidos pranešimas prie nesujungtos komponentės arba pažymima raudonai ta komponentė, kurioje neteisingai įvesti valdymo parametrai. Priešingu atveju, jei komponentės sujungtos teisingai ir valdymo parametrai užpildyti tinkamai, tuomet eksperimentų istorijoje atsiranda naujas eksperimentas, kurio statusas „Vykdomas“.

Kaip sužinoti ar jau suformuoti eksperimento rezultatai?

Eksperimento planavimo lange sukūrus norimą darbų seką ir paspaudus mygtuką „Vykdyti“, eksperimentų istorijoje atsiranda naujas eksperimentas su nauju pavadinimu ir statusu „Vykdomas“. Kai eksperimentas įgauna statusą „Įvykdytas“, eksperimentų rezultatai bus prieinami peržiūrai.

Ar naudojantis DAMIS įrankiu galima analizuoti duomenų failą, kuriame yra praleistų reikšmių?

Jeigu duomenų failas turi praleistų reikšmių, tai norint jį analizuoti dimensijos mažinimo, klasifikavimo arba grupavimo metodais, duomenys turi būti išvalyti, prie duomenų įkėlimo komponentės prijungus  komponentę „Valymas“.

Pamiršau prisijungimo slaptažodį. Ką man daryti?

Pamiršus slaptažodį jį galima atstatyti. Prisijungimo lange paspauskite nuorodą „Pamiršau slaptažodį“, įveskite el. pašto adresą, kuriuo registravotės, ir sekite tolimesnius nurodymus.

Sėkmingai įvykdžius eksperimentą, noriu sužinoti algoritmo veikimo laiką. Kaip tai padaryti?

DAMIS yra realizuota galimybė peržiūrėti duomenų analizės algoritmo veikimo technines charakteristikas: veikimo laiką, gautą paklaidą ir kitas charakteristikas. Norint pamatyti šią informaciją prie duomenų analizės komponentės reikia prijungti komponentę „Techninė informacija“, esančią rezultatų peržiūros dalyje.