Didelių kalbų modelių pritaikymas specializuotoms sritims išlieka sudėtingas, ypač srityse, kurioms reikalingi erdviniai samprotavimai ir struktūrizuotas problemų sprendimas, net jei jie specializuojasi sudėtinguose samprotavimuose. Puslaidininkių išdėstymo dizainas yra puikus pavyzdys, kai AI įrankiai turi interpretuoti geometrinius apribojimus ir užtikrinti tikslų komponentų išdėstymą. Tyrėjai kuria pažangias AI architektūras, kad padidintų LLMS sugebėjimą efektyviai apdoroti ir pritaikyti konkrečias sritis.
Pagrindinis bendrosios paskirties LLM apribojimas yra jų nesugebėjimas teorinių žinių paversti praktiniais sprendimais. Nors šie modeliai gali tiksliai apibrėžti technines koncepcijas, jie dažnai žlunga, kai sprendžiant realaus pasaulio užduotis, kurioms reikalingi erdviniai samprotavimai ir struktūrizuota logika. Puslaidininkių išdėstymo dizaine AI turi peržengti žinias apie tekstinius žinias, kad būtų užtikrintas tikslus VIA, metalo sluoksnių ir grandinės komponentų išdėstymas. Be tikslių geometrinių ryšių, išdėstymo projektai gali nepavykti dėl netinkamo suderinimo ar neteisingo tarpo. Dabartiniams modeliams dažnai reikia kelių žmogaus pataisos raundų, todėl jų diegimas yra neveiksmingas.
Buvo sukurti keli metodai, siekiant pagerinti LLMS pritaikomumą domenui būdingoms programoms. Tinkamumas apima LLM mokymą su konkrečiai domeno duomenimis, tačiau šis procesas reikalauja daug laiko ir reikalauja reikšmingų skaičiavimo išteklių. Gauna Aktualią kartą (RAG) gaunamos išorinės žinios, kuriomis vadovaujasi LLM išėjimai, tačiau ji nevisiškai sprendžia iššūkius, susijusius su struktūrizuotu problemų sprendimu. Kontekstinis mokymasis padeda nukreipti LLM samprotavimus, pateikiant konkrečiai užduoties pavyzdžius, tačiau jis neišvengia erdvinių samprotavimų apribojimų. Šie metodai siūlo laipsniškus patobulinimus, tačiau nepateikia išsamų sprendimo programoms, kurioms reikia geometrinės logikos.
„IBM TJ Watson“ tyrimų centro ir MIT-IBM Watson AI laboratorijos tyrėjai pristatė „Saliamon“-neuro įkvėptą LLM samprotavimų tinklą, kad padidintų domeno specifinį pritaikomumą. Saliamonas, skirtingai nuo įprastų metodų, naudoja daugiaagenčių samprotavimo sistemą, kuri dinamiškai apdoroja erdvinius apribojimus ir geometrinius ryšius. Framework integruoja minties vertinimo mechanizmus, siekiant pakartotinai patobulinti išvestis, pagerindamas problemų sprendimo tikslumą. „Saliamon“ pasinaudoja greitu inžinerijos metodais, kad būtų nukreipti LLM sukurti sprendimai, leisdami jam prisitaikyti prie puslaidininkių išdėstymo užduočių su minimaliu perkvalifikavimu.
Saliamono architektūrą įkvepia neuromokslas ir apima laisvosios energijos principą, kuris optimizuoja samprotavimus, sumažindama tikėtinų ir stebimų rezultatų neatitikimus. Sistemą sudaro trys pirminiai komponentai: minties generatoriai, minties vertintojai ir vairavimo posistemis. Minties generatoriai naudoja įvairias LLM, kad sukurtų kelis samprotavimo būdus, užtikrindami platų sprendimų spektrą sudėtingoms užduotims. Minties vertintojas įvertina šiuos rezultatus, pasirinkdamas logiškiausią ir struktūrizuotą požiūrį. Vairavimo posistemis leidžia tyrėjams dinamiškai modifikuoti tikslus, įgalinant tikslesnį domeno adaptaciją. Skirtingai nuo patobulinimo, ši architektūra nereikalauja nuolatinio perkvalifikavimo, todėl ji bus efektyvesnė specializuotoms programoms.
Tyrėjai atliko eksperimentus su 25 puslaidininkių išdėstymo užduotimis, kad įvertintų Saliamono efektyvumą. Sistema buvo palyginta su penkiomis pradinėmis LLM, įskaitant GPT-4O, Claude-3,5-Sonnet ir LLAMA-3 modelius. Kiekviena užduotis įvertino modelių gebėjimą generuoti geometrines struktūras išlaikant erdvinį tikslumą. Saliamonas pademonstravo pagerėjimą mažinant vykdymo laiko klaidas ir mastelio keitimo netikslumus. Sistemoje buvo geresnės erdvinio samprotavimo galimybės, pagerinant įdarbinimo tikslumą ir sumažinant klaidas sukurtuose dizainuose. Saliamono egzemplioriai taip pat atitiko arba viršijo O1-PreView veikimą keliose bandymų kategorijose, o Claude pagrindu sukurtas Saliamonas stipriai atliko tam tikras sudėtingas užduotis.
Pagrindinis Saliamono pranašumas yra jo sugebėjimas ištaisyti loginius neatitikimus ir aritmetines klaidas geometriniuose dizainuose. Minties vertintojas nuolat tobulina sukurtus išdėstymus analizuodamas ankstesnes iteracijas, sušvelnindamas įprastas haliucinacijos problemas tradicinėmis LLM. Sistema veiksmingai sumažina klaidingą aiškinimą ir padidina AI sukurtų dizainų patikimumą. Saliamonas sinchronizuoja samprotavimus keliose LLM, kai pateikiami dviprasmiškos išdėstymo specifikacijos, užtikrinant nuoseklų ir tikslų išėjimą. Įtraukus hierarchinius vertinimo mechanizmus, sistema žymiai pagerina AI pagrįstą projektavimo tikslumą.
Šis tyrimas pabrėžia, kad svarbu sustiprinti LLM samprotavimo galimybes, o ne padidinti modelio dydį. Saliamonas siūlo struktūrizuotą ir efektyvų metodą, kaip pritaikyti AI konkrečiai sričiai specifiniam problemų sprendimui, ypač puslaidininkių išdėstymo projektavimui. Būsimi tyrimai sutelks į tai, kaip išplėsti sistemą kitoms inžinerijos programas, tobulinti multimodalinius samprotavimo galimybes ir įvesti iteracinius mokymosi mechanizmus, siekiant pagerinti PG sprendimų priėmimą. Saliamono įvedimas yra didelė pažanga įgyvendinant AI pagrįstus įrankius tikslesnius, adaptyvesnius ir veiksmingesnius realaus pasaulio pramonės iššūkiams.
Patikrinkite popierius. Visas šio tyrimo kreditas skirtas šio projekto tyrėjams. Taip pat nedvejodami sekite mus „Twitter“ Ir nepamirškite prisijungti prie mūsų 75K+ ml subreddit.
🚨 Rekomenduojama atvirojo kodo AI platforma: „„ Intellagent “yra atvirojo kodo daugialypės terpės sistema, skirta įvertinti sudėtingą pokalbio AI sistemą“ (Paaukštintas)

Nikhil yra „MarkTechPost“ stažuotės konsultantas. Jis siekia integruoto dvigubo laipsnio medžiagų Indijos technologijos institute, Kharagpur mieste. „Nikhil“ yra AI/ML entuziastas, kuris visada tiria programas tokiose srityse kaip biomedžiagos ir biomedicinos mokslas. Turėdamas tvirtą medžiagos mokslo patirtį, jis tyrinėja naujus pasiekimus ir sukuria galimybes prisidėti.
✅ (rekomenduojama) Prisijunkite prie mūsų telegramos kanalo