Od EPFL-a novi multimodalni model za fleksibilniji AI

Može učiti iz teksta, slika, videa i zvuka i, zahvaljujući modularnosti, proizvodi bilo koji broj ili kombinaciju predviđanja

Mašinsko učenje: novi multimodalni model za fleksibilniji AI iz EPFL-a
Od EPFL-a novi multimodalni model za fleksibilniji AI (Foto: Brian Penny/Pixabay)

Bilo da govorimo o OpenAI ili ChatGPT, velikoj većini chatbotova generativna vještačka inteligencija zasnivaju se na tzv Model velikog jezika (LLM), modeli duboko učenje u velikoj mjeri obučeni da daju odgovore na pitanja koja im se postavljaju učenjem informacija kroz velike količine teksta.

Poslednja granicaGenerativni AI su multimodalni modeli, koji kombinuju razumijevanje jezika i slike, video i audio kako bi ponudili još naprednije iskustvo i uslugu.

Njihovo stvaranje, međutim, predstavlja nekoliko izazova, posebno ako je namjera da se izgrade multimodalni modeli u malom obimu: česti prisustvo podataka koji nedostaju zbog nedostupnosti informacija, gotovo uvijek zbog djelomične dostupnosti resursa.

Ukratko, rizik je da model uči na osnovu nedostatka, te da su proračuni i predviđanja iskrivljena. I tu je EPFL počeo sa svojim novim projektom.

Sa Tehničkog univerziteta u Lozani i Cirihu koalicija za zelenu energiju
U 3D tehnološkoj rukavici koja će virtualnu stvarnost učiniti opipljivom

machine Learning
Kampus Federalne politehnike u Lozani (Foto: Facebook/EFPL)

MultiModN, modularni multimodalni model rođen u Lozani

Istraživači Federalna politehnika u Lozani (EPFL), jedan od najboljih univerziteta na svijetu u smislu inženjerstva i informacionih tehnologija, zapravo su se razvili MultiModN, jedinstveni modularni multimodalni model nedavno predstavljen na NeurIPS2023.

Istraživači iz laboratorija Machine Learning for Education (ML4ED) i Machine Learning and Optimization (MLO) na EPFL-ovoj školi za računarske nauke i komunikacije odlučili su da razviju i testiraju upravo suprotno od velikih, ali razmišljaju u manjem obimu.

Predvođeni učiteljem Mary-Anne Hartley, direktor Laboratorije za globalne inteligentne zdravstvene tehnologije koji je zajednički domaćin na MLO i Yale School of Medicine, i prof. Tanja Käser, direktor ML4ED, tim je kreirao multimodalni model koji može učiti iz teksta, slika, videa i zvukova, ali koji se, za razliku od postojećih, sastoji od promjenjiv broj manjih modula, autonoman i specifičan za ulaz.

Potonje se može odabrati na osnovu dostupnih informacija, a zatim ih spojiti u niz bilo kojeg broja, kombinacije ili vrste unosa. Stoga može proizvesti bilo koji broj ili kombinaciju predviđanja.

"Procijenili smo MultiModN u deset stvarnih aktivnosti, uključujući podršku za medicinsku dijagnozu, predviđanje akademskog učinka i vremensku prognozu,” je objasnio Vinitra Swamy, doktorand na ML4ED i MLO i prvi koautor projekta.

“Kroz ove eksperimente, vjerujemo da je MultiModN prvi pristup multimodalnom modeliranju koji se intrinzično može interpretirati i otporan na nedostajuće podatke.".

EPFL-ov "recept" za moćnije kvantne računare
Od umjetne inteligencije, odlučujućeg poticaja do kriptovaluta?

machine Learning
Škola računarskih nauka i komunikacija EPFL (Foto: Facebook/EPFL IC)

Prvi slučaj upotrebe: kliničke odluke za medicinsko osoblje

Prvi slučaj upotrebe MultiModN-a će biti sistem podrške za kliničke odluke za medicinsko osoblje u okruženjima sa ograničenim resursima.

U zdravstvenom sektoru, zapravo, klinički podaci često nedostaju, možda zbog ograničenih resursa (pacijent ne može priuštiti određeni test) ili, obrnuto, zbog obilja resursa i informacija. MultiModN je u stanju da uči iz ovih podataka iz stvarnog sveta bez apsorbovanja njihovih takozvanih predrasuda, i da prilagodi predviđanja bilo kojoj kombinaciji ili broju ulaza.

"Nedostajući podaci su zaštitni znak u kontekstu ograničenih resursa, a kako modeli uče ove obrasce koji nedostaju, oni mogu kodirati greške u svojim predviđanjima.” podvukao je Mary-Anne Hartley.

“Potreba za fleksibilnošću suočena s nepredvidivo dostupnim resursima je ono što je inspirisalo MultiModN".

U vrhunskom događaju uticaj AI i mašinskog učenja na usluge
Svi razlozi rastućeg uticaja AI u digitalnoj umetnosti

machine Learning
Laboratorija za analizu (Foto: Michal Jarmoluk/Pixabay)

Iz laboratorije u stvarni život: u toku je ispitivanje upale pluća i tuberkuloze

Publikacija je, međutim, samo prvi korak ka implementaciji i testiranju na terenu. Profesor Hartley je radio sa kolegama u Univerzitetskoj bolnici u Lozani (CHUV) i Inselspitalu, Univerzitetskoj bolnici u Bernu, na provođenju kliničke studije fokusiran je na dijagnosticiranje upale pluća i tuberkuloze u okruženjima s ograničenim resursima i u procesu je regrutovanja hiljada pacijenata Južna Afrika, Tanzanija, Namibija e Benin.

Istraživačke grupe su poduzele opsežnu inicijativu za obuku, podučavanje više od 100 lekara da sistematski prikuplja multimodalne podatke, uključujući ultrazvučne slike i video zapise, tako da se MultiModN može obučiti da bude osetljiv na stvarne podatke iz regiona sa niskim resursima.

“Prikupljamo upravo onu vrstu složenih multimodalnih podataka za koje je MultiModN dizajniran da rukuje”, rekao je doktor Noémie Boillat-Blanco, specijalista za infektivne bolesti u CHUV.

“Uzbuđeni smo što vidimo model koji to može cijeniti složenost resursa koji nedostaju u našim kontekstima i sistematski nedostatak rutinskih kliničkih procjena", dodao je doktor Kristina Keitel Inselspitala, univerzitetske bolnice u glavnom gradu Švicarske.

Sigurnost AI? Izjava Bletchley Parka je ključna
Axel Springer-OpenAI osovina za AI u službi novinarstva

EPFL-ova inovacija je dizajnirana da poboljša kliničko donošenje odluka pružanjem pristupa specijalizovanom medicinskom znanju (Foto: Irwan/Unsplash)

Mašinsko učenje u službi javnog dobra

Razvoj i obuka MultiModN-a predstavlja nastavak napora EPFL-a da prilagodi alate za strojno učenje stvarnosti i za javno dobro, a dolazi ubrzo nakon pokretanja Meditron, model umjetne inteligencije posebno dizajniran za medicinski sektor.

Meditron takođe spada u kategoriju velikih jezičkih modela (LLM), ali je za razliku od generalističkih modela, koji služe širokom spektru zadataka, fokusiran na medicinsko polje, i kompaktniji je u smislu veličine, ali jednako efikasan.

Meditronov cilj je da demokratizovati pristup medicinskim informacijama visokog kvaliteta, što pomaže u donošenju kliničkih odluka.

Istraživači EPFL-a razvili su dvije verzije sa 7 milijardi i 70 milijardi parametara, a modeli su obučeni na odabranim, visokokvalitetnim izvorima medicinskih podataka, uključujući recenziranu naučnu literaturu i različite kliničke smjernice, osiguravajući široku i tačnu bazu znanja.

I Meditron, predstavljen u novembru 2023., i MultiModN stoga su u skladu s misijom EPFL-ovog novog AI centra, koji se fokusira na to kako odgovorna i efikasna umjetna inteligencija može promovirati tehnološke inovacije za dobrobit svih sektora društva.

Revolucionarni senzori koji mogu uštedjeti milione baterija
AI: Rat koji će uskoro izbiti neće biti onakav kakav očekujemo...

Mašinsko učenje: novi multimodalni model za fleksibilniji AI iz EPFL-a
Eksterijer EPFL kampusa sa logom Savezne politehnike u Lozani (Foto: Facebook/EFPL IC)