Pastaraisiais metais AI pastebėjo greitą NLP pažangą, tačiau daugelis esamų modelių vis dar stengiasi subalansuoti intuityvius atsakymus su giliais, struktūruotais samprotavimais. Nors tradiciniai AI pokalbių modeliai yra įgudę pokalbio sklandumo, dažnai nesugeba patenkinti, kai susiduria su sudėtingomis loginėmis užklausomis, reikalaujančiomis žingsnis po žingsnio analizės. Kita vertus, modeliai, optimizuoti samprotavimams, linkę prarasti galimybę įsitraukti į sklandžią, natūralią sąveiką. Ši spraga metė iššūkį kūrėjams, tyrėjams ir įmonėms, ieškančioms AI sklandžiai pereinant nuo skirtingų pažinimo stilių.
„Deephermes 3“ peržiūra („Deephermes-3-Llama-3-8B-PREView“) yra naujausia „Nous Research“ LLM serijos iteracija. Kaip vienas iš pirmųjų modelių, integruojančių abu samprotavimus pagrįstus ilgos grandinės minties apdorojimą ir įprastus LLM atsako mechanizmus, „Deephermes 3“ žymi reikšmingą AI modelio rafinuotumo žingsnį. Ši modelio peržiūros versija patikslina AI anotaciją, sprendimų galimybes ir funkcijų skambėjimą, siūlydama sudėtingesnį, lankstesnį AI įrankį tyrėjams, kūrėjams ir įmonėms.
Pagrindinė „Deephermes 3“ savybė yra jos sugebėjimas perjungti intuityvius ir gilius samprotavimus, leidžiančius vartotojams pritaikyti, kaip modelis apdoroja ir teikia informaciją. Modelis yra jo pirmtako „Hermes 3“ atnaujinimas, kuris atnešė agentų galimybes, turtingesnį vaidmenų dialogą, padidino daugialypį pokalbio gylį ir sustiprino darną ilgesniame kontekste. Bendras „Hermes“ serijos tikslas visada buvo tai, kad AI išvestis atitiktų vartotojo ketinimus, taip suteikiant galutiniam vartotojui reikšmingai kontroliuoti atsako generavimą. Ši versija yra nukrypimas nuo ankstesnių modelių, kurių dvigubo apdorojimo režimas leidžia jai atlikti įprastus pokalbio atsakymus ir palaikyti sudėtingus samprotavimus. Sistemos raginimas gali sukelti gilaus samprotavimo funkciją, leidžiančią išplėsti loginį apdorojimą, kad pagerintų atsako tikslumą.
„Deephermes 3“ buvo griežtai palyginamos, kad patvirtintų savo samprotavimo galimybes. Naudodamas „Hugning Face Open-R1“ vertinimo rinkinį, modelis parodė žymiai pagerintą našumą, palyginti su standartiniais instrukcijų suderintais modeliais. Priežiūros režimo „ON“ etalonai atskleidė pastebimą sudėtingo problemų sprendimo padidėjimą, ypač atliekant matematinių samprotavimo užduotis, palyginti su modeliais, kurie neįtraukia gilių mąstymo mechanizmų. Palyginti su „Meta“ LLAMA-3.1-8B, „Deephermes 3“ modelyje buvo rodomi konkurencingi ar pranašesni rezultatai keliose bandymų kategorijose, parodant kontekstinės darnos, daugiapakopių argumentų ir pokalbio atminties išlaikymo pagerėjimą.
„Deephermes 3“ priėmė „Llam-Chat“ formatą, skirtą sistemos raginimams-struktūrizuotam metodui, kuris padidina jo sugebėjimą apdoroti daugialypius pokalbius ir konteksto pagrįstus atsakymus. Sistemos raginimai įveda naujas vartotojų įsitraukimo galimybes, leidžiančias asmenims vadovauti modelio stilistiniams pasirinkimams, vaidmens priskyrimui ir interaktyvioms taisyklėms. Esant patobulintam giluminio samprotavimo režimui, modelis gali valdyti ilgos grandinės logiką, kuri tęsiasi tūkstančiams žetonų. Šis režimas užtikrina didesnį atsakymo tikslumą atliekant užduotis, reikalaujančias išsamaus kontekstinio supratimo, pavyzdžiui, sudėtingų programavimo užklausos, matematinis problemų sprendimas ir išsamus analitinis pagrindimas.
Modelį galima diegti naudojant „Hugning Face Transformerių“ biblioteką, kuri leidžia kūrėjams pritaikyti įvairių užduočių įgyvendinimus. Dėl lanksčios API integracijos „Deephermes 3“ gali būti naudojama įmonių sistemose, „ChatBot“ programose ir tyrimų sistemose, kuriose reikia apdoroti struktūrizuotas ir nestruktūruotas užklausas. Be to, modelis turi patobulintą funkcijų skambėjimo funkciją, palengvinančią efektyvų JSON struktūruotų išėjimų apdorojimą. Ši funkcija daro ją idealia struktūrizuotoms duomenų gavimo programoms, tokioms kaip automatizuotos finansinės atskaitomybės, klientų aptarnavimo automatizavimas ir realaus laiko AI pagrįstos sprendimų priėmimo sistemos.
Apibendrinant galima pasakyti, kad ši versija sujungia intuityvius tradicinių, į žmogų panašių reakcijų reagavimo mechanizmus ir išplėstinę kognityvinių samprotavimų grandinę, taip pagerinant reakcijos tikslumą ir bendrą modelio veiksmingumą. Augant autonominiam funkcionalumui, vaidinant vaidmenis, daugialypį dialogą ir funkcinį kvietimą, „Deephermes 3“ atitinka bendrą serijos, orientuotos į vartotoją, valdymą ir naršymą. Nors jis yra ankstyva versija su pradinėmis samprotavimo galimybėmis, ji žada užduotis, kurios įgyja objektyvių samprotavimų. Vartotojai gali suaktyvinti jo giliai mąstantį režimą naudodamiesi specialia sistemos raginimu, kuris sukelia modelį, kad prieš reaguodamas būtų galima išspręsti išsamius samprotavimus.
Patikrinkite „HuggingFace“ modelis. Visas šio tyrimo kreditas skirtas šio projekto tyrėjams. Taip pat nedvejodami sekite mus „Twitter“ Ir nepamirškite prisijungti prie mūsų 75K+ ml subreddit.
🚨 Rekomenduojama atvirojo kodo AI platforma: „„ Intellagent “yra atvirojo kodo daugialypės terpės sistema, skirta įvertinti sudėtingą pokalbio AI sistemą“ (Paaukštintas)
„MarktechPost“ ir „IIT Madras“ dvigubo laipsnio studentė konsultacinė Sana Hassan aistringai taiko technologijas ir AI, kad galėtų spręsti realaus pasaulio iššūkius. Turėdamas didelį susidomėjimą išspręsti praktines problemas, jis pateikia naują perspektyvą AI ir realaus gyvenimo sprendimų sankryžai.
✅ (rekomenduojama) Prisijunkite prie mūsų telegramos kanalo