IPB

Машинско учење у служби физике честица

02. јула 2021.

Тим истраживача из ЦЕРН-а ,Гугла и Института за физику у Београду објавио је у јуну 2021. године у часопису Nature Machine Intelligence рад у ком представља нову технику машинског учења која би могла да унапреди детектовање судара честица у Великом сударачу хадрона. Један од аутора рада је др Владимир Лончар из Института за физику у Београду који је последњих година ангажован у ЦЕРН-у где се као информатичар бави истраживањем и развојем напредних система за машинско учење.

Др Лончар је члан ЦЕРН-овог тима који се конкретно бави применом машинског учења на системима за окидање Великог сударача хадрона. „Ови системи су сачињени од специфичног хардвера који називамо FPGA (field-programmable gate arrays) и чији је задатак да на основу података са детектора брзо одлучи да ли да сачува неки догађај за даље процесирање или да га занемари“, објашњава др Лончар и додаје да се више од 99 одсто догађаја занемарује.

Како се у саопштењу на званичном сајту ЦЕРН-а наводи, машинско учење је нашло већ многе примене у физици честица, а нова техника коју су аутори рада развили омогућиће примену дубоких неуронских мрежа на системима за окидање веома рано у процесу одабира догађаја за даљу анализу. Главни изазов приликом развоја Система за окидање је брзина протон-протон судара која је толико велика (до милијарду судара у секунди) да је неопходно препознати потенцијално занимљив догађај и донети одлуку да ли да се сними за свега неколико микросекунди. Према речима др Лончара нов метод ће омогућити да постојеће ручно подешаване алгоритме заменимо оптимизованим неуронским мрежама и тиме побољшамо систем одлучивања. „То ће смањити број занимљивих догађаја који нам промакну што нам омогућава нова истраживања и боље разумевање од чега је сачињен универзум“, каже др Лончар.

LHC тунел, фото: ЦЕРН

Аутори рада у апстракту наводе да у потрази за бољим решењима истраживање у области машинског и дубоког учења води ка све сложенијим моделима, али да величину модела и његову рачунску комплексност ипак треба некако ограничити ако желимо да ове методе применимо у системима са ограниченим рачунарским способностима. Једна од техника за ограничавање величине модела којом су се истраживачи бавили је квантизација, односно коришћење мањег броја бита за представљање података у моделу. Међутим, неопрезно смањење броја бита углавном доводи и до пада перформанси модела, односно грешака у одлукама које модел доноси. Зато нов метод поједностављује развој квантизованих модела уз минималан губитак перформанси. „Циљ је да кроз аутоматизован процес дођемо до најбоље шеме квантизације за дати модел олакшавајући тиме посао особи која га развија“, појашњава др Лончар.

Слика уз рада чији је коаутор др Владимир Лончар на насловној страни часописа Nature Machine Intelligence

Истраживачи из ЦЕРН-а желе да развију ефикасне моделе који би на што бољи начин искористили специфичности хардвера на ком се извршавају, конкретно на FPGA уређајима који се користе у систему за окидање. Како би ови системи одлуку донели у ограниченом временском периоду, неопходно је смањити количину рачунских операција модела. „Развили смо платформу која омогућава ефикасно извршавање модела на FPGA хардверу, али пошто се модели развијају на конвенционалним рачунарима, приликом њиховог превођења на FPGA они су губили прецизност или су захтевали превише рачунских операција“, каже др Лончар и додаје да је било потребно развити алат који би омогућио развој модела унапред оптимизованих за овај хардвер. Управо то је један од разлога за удруживање са тимом из компаније Гугл.

Метод који је развио истраживачки тим у ком је др Владимир Лончар могао би да нађе своје примене и ван решавања конкретног проблема једног експеримента у ЦЕРН-у. Пре свега, могао би да се користи у другим експериментима у физици високих енергија, али и да се примени у индустрији, па истраживачи већ разговарају са партнерима из аутомобилске индустрије о примени ове технологије. Др Лончар каже: „Развијене технике и алате можемо применити у свим окружењима где је потребно обрадити податке што пре на хардверу са ограниченим рачунарским капацитетом, попут аутомобила или мобилних телефона. Ове уређаје можемо учинити аутономнијим или паметнијим, елиминишући притом потребу за сталном везом са интернетом“.