Matematiniai samprotavimai išlieka viena sudėtingiausių iššūkių AI. Nors AI pažengė į NLP ir modelio atpažinimą, jos sugebėjimas išspręsti sudėtingas matematines problemas, susijusias su žmogaus panašia logika ir samprotavimais, vis dar atsilieka. Daugelis AI modelių kovoja su struktūrizuotu problemų sprendimu, simboliniu samprotavimu ir gilių matematinių sąvokų ryšių supratimu. Norint pašalinti šią spragą, reikia aukštos kokybės, struktūrizuotų duomenų rinkinių, leidžiančių AI mokytis iš ekspertų matematinių samprotavimų ir pagerinti problemų sprendimo tikslumą.
Pripažindamas aukščiau pateiktus poreikius, „Project-Numina“ išleido „Numinamath 1.5“-antrąją savo pažengusio AI mokymo duomenų rinkinio „Numinamath“ versiją, pritaikytą specialiai matematiniams samprotavimams. „Numinamath 1.5“ remiasi savo pirmtakais, siūlydama maždaug 900 000 varžybų lygio matematinių problemų, kuriose yra kurta kolekcija. Šios problemos yra struktūrizuotos naudojant minties grandinės (COT) metodiką, užtikrinant, kad AI modeliai laikytųsi loginio žingsnis po žingsnio samprotavimo proceso, kad būtų galima gauti sprendimus. Duomenų rinkinys sukelia Kinijos vidurinės mokyklos matematikos, JAV matematikos konkursų ir tarptautinių olimpiadų problemas, užtikrinančias plataus spektro sunkumų lygių spektrą efektyviai mokyti AI sistemas.
Pagrindinė „Numinamath 1.5“ naujovė yra praturtintų problemų metaduomenys, įskaitant:
- Galutiniai atsakymai į žodžių problemas.
- Matematiniai domenai apima algebrą, geometriją, skaičių teoriją ir skaičiavimą.
- Problemų tipai suskirstyti į klausimus su atsakymų variantais (MCQ), įrodymais pagrįstos problemos ir žodžių problemos.
Dėl šių patobulinimų „Numinamath 1.5“ tampa labiau struktūruotu ir patikrinamu šaltiniu AI mokymui. Jie leidžia geriau apibendrinti ir samprotauti sprendžiant nematytus matematinius iššūkius.
Projektas-Numina pasirinko rankinio patvirtinimo metodą problemoms, gautoms iš „Olympiad“ duomenų rinkinių, kad būtų užtikrintas duomenų rinkinio tikslumas ir patikimumas. Ankstesnė „Numinamath“ versija susidūrė su analizės klausimais dėl automatinių ištraukimo būdų, kurie kartais klaidingai interpretavo problemines struktūras. Atsakydamas „Numbinamath 1.5“ dabar naudoja oficialius šaltinius iš Nacionalinės „Olympiad“ svetainių, užtikrinant, kad kiekviena problema ir sprendimas būtų tiksliai perrašytas ir suformatuotas.
Naujausiame duomenų rinkinyje yra rankiniu būdu kuruojamos problemos kritinėse matematinėse srityse, tokiose kaip:
- Kinijos matematikos konkursai (CN_CONTEST)
- Nelygybės ir skaičių teorija, patikrinta ekspertų matematikų
Šis dėmesys sutelktas į kuruojamus ir patikrintus duomenis užtikrina, kad PG modeliai mokosi iš autentiškų, aukštos kokybės šaltinių.
Kitas didelis „Numinamath 1.5“ patobulinimas yra sintetinių duomenų rinkinių, tokių kaip sintetinis_amc, pašalinimas. Nors ankstesnėse iteracijose buvo įtrauktos sintetinės problemos, siekiant išplėsti duomenų rinkinių įvairovę, abliacijos tyrimai nustatė, kad sintetiniai duomenys šiek tiek trukdė PG efektyvumui įvedant problemos struktūros neatitikimus. Dėl to „Numinamath 1.5“ pašalina sintetines problemas, užtikrinant, kad AI modeliai susijungtų tik su realaus pasaulio, konkurencijos lygio matematika, o ne dirbtinai sugeneruotu turiniu.
„Numinamath 1.5“ kelia problemų iš kelių šaltinių, užtikrinant įvairius matematinius iššūkius. Į duomenų rinkinį sudaro:
- „Olympiad“ problemos: patikrintos Nacionalinės ir tarptautinės matematikos olimpiadų problemos.
- AOPS forumo duomenys: gaunami iš matematikos diskusijų forumų, kuriuose yra bendro ir konkurencijos stiliaus problemų derinys.
- AMC ir AIME problemos: Amerikos matematikos konkursų (AMC) ir Amerikos kvietimo matematikos egzamino (AIME) klausimai.
- Kinijos K-12 matematika: didelis Kinijos vidurinės mokyklos programų problemų pogrupis, suteikiantis tvirtą pagrindą algebroje ir geometrijoje.
Apibendrinant galima pasakyti, kad „Numinamath 1.5“ pateikia 896,215 patikrintas varžybų lygio matematikos problemas iš „Olympiads“, nacionalinių konkursų ir akademinių forumų. Struktūriniai metaduomenys, įskaitant problemos tipą, klausimų formatą ir patikrintus sprendimus, užtikrina tikslų kategorizavimą ir analizę. Duomenų rinkinys pašalina sintetines problemas, daugiausia dėmesio skiriant rankiniu būdu kuruojamais, aukštos kokybės duomenimis. Tai yra gyvybiškai svarbus tyrimų ir AI mokymo šaltinis, apimantis 268 000+ K-12 problemas, 73 000 iš forumų ir elitinių varžybų rinkinių.
Patikrinkite duomenų rinkinys. Visas šio tyrimo kreditas skirtas šio projekto tyrėjams. Be to, nepamirškite sekti mūsų „Twitter“ ir prisijunkite prie mūsų „Telegram“ kanalas ir „LinkedIn GrOUP. Nepamirškite prisijungti prie mūsų 75K+ ml subreddit.
🚨 Rekomenduojama atvirojo kodo AI platforma: „„ Intellagent “yra atvirojo kodo daugialypės terpės sistema, skirta įvertinti sudėtingą pokalbio AI sistemą“ (Paaukštintas)
Nikhil yra „MarkTechPost“ stažuotės konsultantas. Jis siekia integruoto dvigubo laipsnio medžiagų Indijos technologijos institute, Kharagpur mieste. „Nikhil“ yra AI/ML entuziastas, kuris visada tiria programas tokiose srityse kaip biomedžiagos ir biomedicinos mokslas. Turėdamas tvirtą medžiagos mokslo patirtį, jis tyrinėja naujus pasiekimus ir sukuria galimybes prisidėti.
✅ (rekomenduojama) Prisijunkite prie mūsų telegramos kanalo