Ce sunt modelele de fundație și cum pot ajuta ele la implementarea AI la scară?
Publicat: 2023-03-29În timp ce organizațiile de pe tot globul au început de mult timp într-o sifonie de investiții în inteligența artificială, numărul proiectelor de inteligență artificială care trec de la prototipuri la producție fluctuează în continuare la aproximativ 53%.
Experții cred că acest lucru se întâmplă adesea din cauza lipsei de abilități tehnologice, resurse umane și instrumente pentru a scala AI proof of concepts (PoC) izolate în alte cazuri de utilizare. Și, bineînțeles, costul probabil ridicat al instruirii diferențiază modelele AI pentru diferite sarcini.
Modelele de bază – adică modele mari de învățare automată care au fost instruite pentru a utiliza volume mari de date neetichetate sub îndrumarea unor consultanți calificați în AI – pot fi răspunsul final la problemele descurajante ale scalabilității și costurilor AI.
Compania dvs. ar putea folosi astfel de modele ca punct de plecare pentru a îmbunătăți sau automatiza diverse sarcini, de la conversia documentelor pe hârtie în fișiere text editabile până la descoperirea sentimentelor clienților în recenziile rețelelor sociale. Și ați putea să vă bazați pe excelența AI de acolo, adaptând modele de bază pentru sarcinile și cazurile de utilizare viitoare.
Ce sunt modelele de fundație și cum ar putea ajuta compania dvs. să exceleze la AI?
Dacă nu ați trăit sub o stâncă, ați auzit despre ChatGPT de la OpenAI. Acest program de model de limbaj a absorbit volume uriașe de text conversațional utilizând învățarea supravegheată și, la etapa de reglare fină, abordările de învățare prin întărire din feedback uman (RLHF).
Această soluție AI generativă poate analiza datele de intrare în raport cu 175 de miliarde de parametri și poate înțelege profund limbajul scris. De asemenea, poate răspunde la întrebări, poate rezuma și traduce text, poate produce articole pe un anumit subiect și poate scrie cod, printre alte sarcini. Tot ce ai nevoie este să oferi ChatGPT solicitările potrivite.
Produsul revoluționar OpenAI este doar un exemplu de modele de bază care pot transforma dezvoltarea de aplicații AI așa cum o cunoaștem.
Modelele de fundație perturbă dezvoltarea AI așa cum o cunoaștem. În loc să antrenați mai multe modele pentru cazuri de utilizare separate, acum puteți utiliza o soluție AI pregătită în prealabil pentru a îmbunătăți sau automatiza complet sarcinile din mai multe departamente și funcții de muncă.
Cu modele de bază AI precum ChatGPT, companiile nu mai trebuie să antreneze algoritmi de la zero pentru fiecare sarcină pe care doresc să o îmbunătățească sau să o automatizeze. În schimb, trebuie doar să selectați un model de fond de ten care se potrivește cel mai bine cazului dvs. de utilizare - și să-i reglați performanța pentru un obiectiv specific pe care doriți să-l atingeți.
Modelele de fundație sunt perfecte pentru industriile în care datele de instruire pot fi prea greu sau costisitoare de achiziționat. Aceste industrii includ asistența medicală, știința vieții, biotehnologia și producția, pentru a numi câteva.
Ce tipuri de modele Foundation AI există?
Mai multe tipuri de modele AI de bază sunt utilizate în mod obișnuit în aplicațiile de afaceri.
- Modelele de învățare semi-supravegheate sunt antrenate pe un set de date care conține un amestec de date etichetate și neetichetate. Scopul este de a folosi datele etichetate pentru a îmbunătăți performanța unui model pe datele neetichetate. Experții AI apelează la învățarea semi-supravegheată atunci când datele de instruire sunt dificil de obținut sau ar costa o companie un braț și un picior. Acest lucru, de exemplu, se poate întâmpla în medii medicale în care sunt adoptate diverse reglementări IT de asistență medicală. Câteva exemple obișnuite de modele semi-supravegheate includ algoritmi de clasificare a conținutului web și documente text pre-antrenate.
- Modelele de învățare nesupravegheate sunt complet antrenate pe seturi de date neetichetate. Ei descoperă tipare în datele de antrenament sau le structurează singuri. Astfel de modele, printre altele, pot segmenta informațiile în clustere pe baza parametrilor pe care i-au descoperit într-un set de date de antrenament. Inginerii de învățare automată (ML) apelează la codificatoare automate, K-Means, clustering ierarhic și alte tehnici pentru a crea soluții de învățare automată nesupravegheate și pentru a le îmbunătăți acuratețea.
- Modelele de învățare prin întărire interacționează cu mediul lor fără pregătire specifică. Atunci când se obțin un rezultat dorit, adică se realizează o predicție pe care dezvoltatorii și-au sperat – modelele sunt recompensate. Dimpotrivă, modelele de învățare prin întărire sunt penalizate atunci când fac presupuneri greșite. Abordarea permite algoritmilor AI să ia decizii mai complexe decât omologii lor supravegheați și semi-supravegheați. Un exemplu de învățare prin întărire în acțiune ar fi vehiculele autonome sau programele AI pentru jocuri, cum ar fi AlphaGo.
- Modelele AI generative produc date noi similare cu datele pe care au fost instruiți. Aceste date pot include text, imagini, clipuri audio și videoclipuri. Soluția ChatGPT menționată în secțiunea anterioară aparține acestei categorii de modele de fundație AI. Alte exemple de IA generativă includ instrumentul DALL-E 2, care creează imagini pe baza descrierilor scrise în limbaj natural, și platforma video Synthesia.io, care utilizează intrări bazate pe text pentru a produce conținut video.
- Modelele de transfer de învățare pot rezolva alte sarcini decât pentru care au fost instruite. De exemplu, inginerii de viziune computerizată pot folosi algoritmi de clasificare a imaginilor pre-antrenați pentru detectarea obiectelor. De asemenea, poate valorifica soluțiile NLP existente pentru sarcini mai mari de cunoștințe, cum ar fi analiza sentimentului clienților. Unele soluții populare de învățare automată pre-antrenate includ OpenCV, o bibliotecă de viziune computerizată care conține modele robuste pentru clasificarea obiectelor și detectarea imaginilor și ofertele de bibliotecă Hugging Face Transformers, cum ar fi transformatorul generativ pre-antrenat (GPT) - adică un model de limbaj bogat al cărui al treilea generație (GPT-3) alimentează serviciul ChatGPT.
- Modelele de meta-învățare, spre deosebire de echivalentele lor orientate spre sarcini, învață literalmente să învețe. În loc să consume date pentru a rezolva o problemă specifică, astfel de modele dezvoltă strategii generale de rezolvare a problemelor. În acest fel, soluțiile de meta-învățare se pot adapta cu ușurință la noile provocări în timp ce își folosesc resursele, cum ar fi memoria și puterea de calcul, mai eficient. Experții ML recurg la meta-învățare atunci când datele de instruire sunt limitate sau o companie nu are planuri definitive cu privire la implementarea AI în afaceri. TensorFlow, PyTorch și alte biblioteci și cadre de învățare automată open-source oferă instrumente care permit dezvoltatorilor să exploreze tehnicile de meta-învățare. În cele din urmă, furnizorii de cloud computing, cum ar fi Google, ajută experții ML și începătorii să antreneze modele personalizate de învățare automată folosind AutoML.
În funcție de aplicația specifică și de tipul de date pe care le aveți, un model de fundație poate fi mai potrivit decât altul. Compania dvs. este liberă să aleagă între o soluție open-source, care necesită câteva modificări, sau un produs terță parte gata de utilizat, cu condiția să vă îndeplinească obiectivele de afaceri.
Top 3 motive pentru a folosi modelele AI ale fundației pentru următorul tău proiect
În comparație cu modelele de învățare automată de sine stătătoare, orientate spre sarcini, modelele de bază ajută la crearea de soluții AI fiabile mai rapid și mai ieftin, cu mai puține date implicate și o ajustare minimă. Și asta ca să nu mai vorbim de faptul că, fiind instruiți pe mai multe date decât ar putea obține vreodată o singură organizație, modelele de fundație arată o precizie ridicată încă din prima zi.

Mai jos veți găsi o listă a avantajelor modelelor AI de bază.
- Modelele de fundație vă vor ajuta să implementați AI mai rapid, mai ieftin și cu mai puține resurse implicate. Crearea și implementarea unei soluții AI necesită timp și resurse considerabile. Pentru fiecare aplicație nouă, aveți nevoie de un set separat de date bine etichetat. Și dacă nu îl aveți, veți avea nevoie de o echipă de experți în date pentru a găsi, curăța și eticheta informațiile respective. Potrivit Dakshi Agrawal, CTO al IBM AI, modelele de bază ajută la reducerea cerințelor de etichetare a datelor de 10-200 de ori, în funcție de un caz de utilizare dat, ceea ce se traduce în economii semnificative de costuri. În ceea ce privește afacerile, ar trebui să luați în considerare și creșterea cheltuielilor cu cloud computing. Google, de exemplu, a cheltuit milioane pentru a achiziționa DeepMind. Și, în timp ce proiectul tău AI nu poate fi pe jumătate la fel de ambițios, ai putea cheltui cu ușurință 300.000 USD doar în costurile serverului cloud pentru a-ți pune în funcțiune aplicația AI. Un alt motiv pentru a utiliza modele de bază, cum ar fi soluțiile AI generative, este oportunitatea de a prototipa rapid și a testa diferite concepte fără a investi masiv în cercetare și dezvoltare.
- Puteți reutiliza modele AI de bază pentru a crea diferite aplicații. După cum sugerează și numele lor, modelele de fundație AI pot servi drept bază pentru mai multe aplicații AI. Gândește-te la conducerea unei mașini. Odată ce ai permisul de conducere, nu trebuie să promovezi examenul de fiecare dată când cumperi un alt vehicul. În mod similar, puteți utiliza o cantitate mai mică de date etichetate pentru a antrena un model de bază de uz general care rezumă texte pentru a procesa conținut specific domeniului. Și modelele de fundație posedă și capacități de „apariție”, ceea ce înseamnă că un model, odată antrenat, poate fie să învețe să rezolve probleme pe care nu ar fi trebuit să le abordeze, fie să obțină informații neașteptate din datele de instruire.
- Modelele fundației AI ajută la atingerea obiectivelor de sustenabilitate ale companiei dvs. Antrenarea unui model mare de învățare automată poate avea aceeași amprentă asupra mediului ca și conducerea a cinci mașini de-a lungul vieții. O amprentă atât de mare de carbon este în contrast puternic cu faptul că 66% dintre întreprinderi își măresc eficiența utilizării energiei, în timp ce 49% dintre alte întreprinderi dezvoltă noi servicii și produse ecologice. Cu modelele AI de bază, puteți antrena algoritmi inteligenți mai rapid și puteți utiliza resursele de calcul cu înțelepciune - nu în ultimul rând datorită arhitecturii acestor modele care profită de paralelismul hardware, ceea ce vă permite să executați mai multe sarcini simultan.
Considerate „viitorul AI”, modelele de bază scad pragul de acces la AI și ar putea pune capăt ciclului eșuat de demonstrare a conceptului AI, ajutând companiile să scaleze modele în alte cazuri de utilizare și la nivel de companie.
Dar cu fiecare oportunitate vine o provocare.
Lucruri de luat în considerare atunci când utilizați modele de fundație
Singurul dezavantaj flagrant al modelelor AI de bază este dificultatea de a explica unele dintre operațiunile lor.
Modelele mari de fundație pot folosi atât de multe date de antrenament și au atât de multe straturi profunde încât uneori este greu de determinat cum algoritmii ajung la concluziile lor.
Natura cutie neagră a modelelor de fundație lasă o ușă în spate și pentru infractorii cibernetici. Hackerii pot lansa atacuri de otrăvire a datelor și pot introduce prejudecăți ale AI, exacerbând și mai mult problemele etice ale AI.
Companiile de tehnologie ar trebui să-și unească forțele cu guvernele pentru a crea o infrastructură pentru proiectele publice de IA, pentru a evita controversele legate de utilizarea modelelor de fundație AI. Furnizorii de AI ar trebui să dezvăluie, de asemenea, ce seturi de date folosesc și cum își antrenează modelele.
După cum Percy Liang, facultate și profesor de informatică Stanford HAI, a opinat în timpul recentului său interviu cu Venture Beat, „Suntem foarte mult în primele zile, așa că normele profesionale pentru IA sunt subdezvoltate. Prin urmare, este imperativ ca noi, ca comunitate, să acționăm acum pentru a ne asigura că această tehnologie este dezvoltată și implementată într-un mod responsabil din punct de vedere etic și social.”
De ce este nevoie pentru a începe să utilizați modele de fundație în organizația dvs
Fiind o persoană care a petrecut ultimii zece ani ajutând companiile să implementeze sisteme AI, echipa Itrex este martoră la o schimbare în AI.
Sistemele care execută sarcini specifice într-un singur domeniu fac loc unei IA ample care învață în general și funcționează în diferite industrii și cazuri de utilizare. Modelele de bază, instruite pe seturi de date mari, neetichetate și reglate fin pentru diverse aplicații, conduc această transformare.
Dacă compania dvs. este pregătită să depășească concurenții și să obțină mai rapid rentabilitatea investiției de la sistemele dvs. AI, iată o strategie la nivel înalt pentru implementarea modelelor de bază.
- Colectați și preprocesați datele dvs. Primul pas implică colectarea și preprocesarea datelor pe care le vei furniza unui model AI de bază. Calitatea și diversitatea acestor date sunt esențiale pentru a ne asigura că modelul ajustat este precis și robust.
- Alege un model de fundație. Multe modele de fond de ten AI pregătite în prealabil sunt disponibile pe piață. Unele soluții populare includ BERT, GPT și ResNet, printre altele. Este important să alegeți modelul de fundație potrivit în funcție de sarcina pe care doriți să o rezolvați și de tipul de date pe care le aveți.
- Modificați modelul în conformitate cu obiectivele dvs. de afaceri. Odată ce modelul de fundație și datele sunt gata, puteți ajusta parametrii modelului la sarcina dvs. specifică. O modalitate de a atinge acest obiectiv este transferul de învățare, în care folosiți greutățile pre-antrenate ale modelului de fundație ca punct de plecare și le ajustați pe baza datelor dvs. de antrenament.
- Evaluați modelul. După reglare fină, este esențial să determinați dacă modelul funcționează bine și dacă este necesară o ajustare suplimentară. Pentru a evalua performanța modelului de bază, puteți utiliza valori standard, cum ar fi acuratețea, precizia, reamintirea și scorul F1.
- Implementează-ți soluția AI. Odată ce ești mulțumit de performanța modelului tău fin reglat, îl poți implementa într-un mediu de producție. Mai multe opțiuni pentru implementarea modelelor AI includ platforme bazate pe cloud, servere on-premise sau dispozitive edge.
Este important să ne amintim că implementarea modelelor de fundație AI necesită expertiză tehnică și acces la hardware și software specializat. Prin urmare, poate fi util să vă asociați cu un furnizor specializat de AI sau să vă consultați cu o echipă de experți în IA pentru a vă asigura că procesul se desfășoară în mod eficient.
Trimite-ne o linie pentru a discuta nevoile tale de AI! Vom evalua gradul de pregătire pentru AI a companiei dvs., vă vom audita datele și le vom pregăti pentru analiza algoritmică și vom alege modelul de bază potrivit pentru a începe cu inteligența artificială!
Acest articol a fost publicat inițial pe site-ul Itrex.
