Nội dung text EXAMEN INTELIGENTA ARTIFICIALA.pdf
1 © 2023, Stelian Brad. Toate drepturile rezervate. Acest material, inclusiv, dar nu limitat la text, grafice, imagini și orice alt conținut aferent, este proprietatea exclusivă a lui Stelian Brad. Prin accesarea, vizualizarea, citirea sau utilizarea oricărei părți a acestui material, vă exprimați în mod explicit acordul că sunteți legat de acești termeni și condiții. Nicio componentă a acestui material nu poate fi copiată, reprodusă, republicată, încărcată, postată, transmisă, distribuită sau diseminată în niciun fel, nici prin intermediul oricărui mijloc electronic, mecanic, fotocopiere, înregistrare sau orice alt sistem de stocare și recuperare a informațiilor, fără permisiunea explicită, în scris, a titularului drepturilor de autor. Aceasta interdicție se aplică în egală măsură pentru utilizarea de capturi de ecran, copierea textului în orice formă sau pe orice platformă. De asemenea, nu este permisă traducerea, adaptarea sau transformarea acestui material sub orice formă, fără consimțământul scris al titularului drepturilor de autor. Acest material este protejat de Legea drepturilor de autor din România și de convențiile internaționale privind drepturile de autor. Orice încălcare a drepturilor de autor, inclusiv diseminarea neautorizată a materialelor, este ilegală și va duce la proceduri legale pentru recuperarea daunelor și pentru pedepsirea vinovatului. Ignorarea acestor termeni și condiții nu vă exonerează de responsabilitate. Utilizarea neautorizată a acestui material poate constitui o încălcare a legilor privind drepturile de autor, mărcile comerciale și alte legi aplicabile. Utilizatorii care încalcă aceste termeni pot fi supuși unor sancțiuni civile și penale, inclusiv, dar nu limitat la daune compensatorii, daune exemplare și cheltuieli de judecată. EXAMEN INTELIGENȚĂ ARTIFICIALĂ [VERSIUNEA 1] Durata examenului este stabilită la 4 ore. În urma unei analize a fezabilității, s-a constatat că este posibil să finalizați examenul în acest interval de timp, cu condiția să ajustați nivelul de cunoștințe la dificultatea aleasă. Înainte de a selecta nivelul de dificultate, vă recomandăm să examinați cu atenție lista de subiecte. Aveți la dispoziție 10 minute pentru a face acest lucru, după care examenul va începe și timpul va fi cronometrat. Subiecte pentru nota 5 1. Presupunând că Instagram este o rețea neuronală, cu 10 influenceri în stratul de intrare, 6 trolli de serviciu în stratul ascuns și 2 utilizatori manipulați în stratul de ieșire: • Ce au în comun influencerii, trollii de serviciu, și utilizatori manipulați din perspectiva unei rețele neuronale de tip MLP? • Ce rol joacă influencerii și trolii din perspectiva unei rețele neuronale de tip MLP? • Câte dimensiuni trebuie să aibă datele de intrare în rețea ca să facă sens prezența celor 10 influenceri? • Este admis să existe mai mulți trolli decât influenceri pentru ca rețeaua MLP să opereze corect? • De la câți trolli vin intrări pentru fiecare utilizatori manipulat? • Câți influenceri îi determină pe fiecare troll de serviciu să scrie fake news-uri, să provoace, să creeze discordie prin comentarii nefondate și provocatoare pentru a-i manipula pe uilizatorii care preferă să judece alții în locul lor? • Fiind 2 utilizatori manipulați, ce tip de problemă rezolvă Instagram-ul nostru: de clasificare binară ("Like-oholicii" [0], "Criticii perpetui" [1]), de clusterizare ("Lemmingii Digitali" și "Vizionarii FOMO (Fear of Missing Out)" sau de regresie ("Indexul de Obsesie Selfie" și "Echilibrul de Detoxifiere Digitală”)? • Stratul de intrare, unde se alfă plasați influencerii, au în structură funcții de activare? Dacă da, de ce tip? • Ce funcție de activare ar avea mai mult sens pentru trollii de serviciu ca să fim siguri că o postare care trece prin filtrul lor devine virală? Aici viralul se referă la un nivel ridicat de acuratețe a rețelei noastre.
2 • Mai are sens să avem funcții de activare pe stratul de ieșire unde se află utilizatori manipulați sau și așa aceștia nu sunt în stare să judece cu capul lor? Dacă totuși ar fi nevoie de o funcție de activare, trebuie să fie una puternic neliniară sau una slab transformativă? Argumentați. 2. Dacă am dori să determinăm care este stilul vestimentar dominant într-un grup de studenți, cum ar putea ajuta algoritmul K-NN? Oferiți un exemplu scurt, folosind cod Python. Se va considera următoarea listă de stiluri vestimentare (legătura cu realitatea este pur întâmplătoare, deși a fost nevoie de o documentare serioasă pe rețelele de socializare folosind tehnici de “scraping” ): ["Veteranii de blugi", "Purtătorii pereni de tricouri", "Couturierii de campus", "Hipsterii try-hard", "Nostalgicii nehotărâți", "Minimaliștii monotoni", "Eclipticii excentrici", "Sportivii de canapea", "Camuflații confuzi", "Enigmaticii vestimentari", "Încapsulații Wardrobe", “Decadenții de branduri", "Pseudo-sportivii", "Metafizicienii modei", "Rolled out of bed", "Istoricii vestimentari”, "Rebelii de Rock- n-Roll", "Manga-Meșterii", "Grupeștii Grunge", "Hipsterii Histérici", "Pasionații Punk", "Goticii Gargantua", "Discipolii de K-Pop", "Electronicii Eclipsați", "Indie Incognito", "Slackerii Spațioși", "Căpățânarii cu Glugă", "Skaterii Săritori", "Mysticii de Mall", "Sirenele de Supermarket", "Clubul Căciularilor”, "Squad-ul Șlapi și Șosete", "Fanaticii Felinelor", "Cavalerii de Curea”, "Fashionistii de Sezon”, "Cameleonii de Garderobă", “Zoomerii cu Pijamale de Lux", "Girafii cu Pantaloni Turbo”] 3. Dacă am dori să antrenăm un model de inteligență artificială să diferențieze între meme-urile ironice și cele serioase, ce tip de învățare ar fi mai potrivit? Dați câte un exemplu pentru fiecare. 4. Dacă ai avea un buget limitat pentru a-ți cumpăra hainele la modă, cum ai descrie 'funcția de cost' a deciziei tale? Dar în cazul unui model de inteligență artificială? 5. Presupunând că nivelul de energie pe parcursul unei zile este o funcție pe care vrei să o minimizezi, ce ar însemna 'gradientul în descendență' în acest context? Dar în cazul unui model de inteligență artificială? 6. Dacă te pregătești pentru un examen, cum ar arăta overfitting și underfitting în studiul tău? Dar în cazul unui model de inteligență artificială? Subiecte pentru nota 6 1. Ce este o "caracteristică" în contextul învățării automate? Dați un exemplu de caracteristică într-un set de date de imagini și un exemplu de caracteristică într-un set de date text. 2. Ce este un "perceptron"? Cum se aseamănă un perceptron cu un neuron într-o rețea neuronală? 3. "Descrieți și ilustrați cu un exemplu detaliat cum un neuron artificial în rețelele neuronale profunde procesează datele de intrare prin utilizarea funcției de activare și a bias-ului. În exemplul dvs., vă rugăm să evidențiați următoarele aspecte: • Cum se combină intrările ponderate și bias-ul pentru a forma intrarea în funcția de activare? • Cum transformă funcția de activare intrarea într-o ieșire care poate fi transmisă către următorul strat în rețea? • De ce este necesară o funcție de activare și care este rolul său în procesarea semnalelor într-un neuron artificial? • Ce sens are utilizarea bias-ului și cum contribuie acesta la capacitatea de generalizare și la flexibilitatea modelului? 4. În contextul rețelelor neuronale convoluționale (CNNs), convoluția este o componentă esențială. Explicați în detaliu procesul de convoluție și cum acesta contribuie la operarea eficientă a unei CNN. În explicația dvs., includeți următoarele puncte: • Descrierea matematică a unei operații de convoluție și modul în care aceasta este aplicată în CNN. • Importanța filtrelor/kernels în operația de convoluție și cum contribuie ele la extragerea caracteristicilor imaginii. • Explicați cum se realizează partajarea parametrilor în operațiile de convoluție și care sunt avantajele acestui lucru. • De ce convoluția este atât de importantă pentru rețelele neuronale convoluționale? Cum ajută la abordarea anumitor probleme sau provocări în procesarea imaginilor? • Oferiți un exemplu practic în care o CNN care utilizează convoluția ar oferi un avantaj semnificativ față de o rețea neuronală complet conectată.
3 5. În contextul învățării supervizate: • Ce este un set de date de antrenament și cum este utilizat acesta în procesul de învățare? • Ce este un set de date de testare și ce rol joacă acesta în evaluarea modelului? • Care este diferența între eroarea de antrenare și eroarea de validare? 6. Dându-se o rețea neuronală cu următoarea configurație: • Stratul de intrare: 10 neuroni • Primul strat ascuns: 6 neuroni • Al doilea strat ascuns: 4 neuroni • Stratul de ieșire: 2 neuroni o Cum se modifică forma tensorului pe măsură ce trece prin fiecare strat? o Ce funcție de activare ați alege pentru straturile ascunse și de ce? o Ce funcție de pierdere (de cost) ați alege dacă aceasta ar fi o problemă de clasificare binară? 7. Descrieți modul în care funcționează algoritmul de regresie logistică. Care este diferența principală între regresia logistică și regresia liniară? 8. Ce este regularizarea în contextul învățării automate și de ce este aceasta utilă? Descrieți diferențele între regularizarea L1 și L2. ALTERNATIVĂ LA PROBLEMA 6 Ghiță 'Sultanul Streaming-ului' Rădulescu, conducătorul popularului serviciu de streaming TV 'Telenovela este viața mea', se află în fața unei provocări fascinante. Se pare că abonații săi sunt nebuni după telenovelele turcești, iar dorința lor de noi seriale nu pare să aibă sfârșit. Pentru a face față acestei cereri crescute, Ghiță ‘Telenovelistul’, 'Sultanul Streaming-ului'și “Mare Dramaturg” Rădulescu ... “fără număr”, dorește să dezvolte un sistem de AI care să recomande telenovele turcești în funcție de preferințele abonaților. Astfel, își dorește să transforme serviciul său de streaming într-un paradis al telenovelelor, personalizat pentru fiecare abonat în parte. • Operațiunea "Sultanul Recomandărilor": Ai fost angajat ca expert AI în echipa lui Ghiță. Prima ta misiune este să descrii planul tău pentru a construi "Sultanul Recomandărilor", un sistem de AI care va recomanda telenovele turcești abonaților. Ce tipuri de date ai nevoie pentru acest lucru? Cum ai modela problema? Povestește despre aventura ta în construirea acestui sistem de recomandare. • Misiunea "Sursa Popularității": Ghiță vrea să meargă și mai departe. El dorește să prezică care telenovele vor deveni populare chiar înainte de a fi lansate pe platforma sa. Cum ai folosi AI pentru a recunoaște și a clasifica diferite telenovele turcești pe baza popularității lor? Ce date ai nevoie și cum ai modela această problemă? Cum ai folosi aceste informații pentru a-ți îmbunătăți sistemul "Sultanul Recomandărilor"? • Cucerirea noii ere a telenovelelor: Finalmente, Ghiță are o idee incredibilă - să folosească inteligența artificială pentru a propune noi telenovele pentru producție, în funcție de preferințele utilizatorilor săi. Care sunt datele necesare pentru această sarcină și cum ar trebui modelată această problemă? • Acum, presupuneți că AI-ul vostru este capabil să recomande un nou serial turcesc pentru producție. Să presupunem că AI-ul a identificat o preferință pentru dramele istorice cu un accent pe poveștile de dragoste. Ținând cont de succesul "Suleiman Magnificul", AI-ul sugerează producerea unui serial care să exploreze viața și epoca lui Mehmed al II-lea, cunoscut și ca Mehmed Cuceritorul, un alt sultan important al Imperiului Otoman. Ce tipuri de date ar fi trebuit să monitorizeze și să analizeze AI-ul pentru a face această recomandare? Odată ce AI-ul a făcut această recomandare, care ar fi un nume potrivit pentru această telenovelă turcească recomandată de AI și cum se aliniază acest nume cu datele analizate? Justificați alegerea voastră. ALTERNATIVĂ LA PROBLEMA 7 Asistentul virtual Shenanigoat a fost creat pentru a-i ajuta pe tineri să-și dezvolte abilitățile, să învețe lucruri noi și să se distreze în același timp. Cu toate acestea, Shenanigoat a observat o tendință îngrijorătoare