AI naudojimo švietime istorija
Nuorodų lentelė
Santrauka ir įvadas
AI naudojimo švietime istorija
Mokslinių tyrimų metodologija
Literatūros apžvalga
Santrauka
Išvados ir literatūros sąrašas
2. AI naudojimo švietime istorija
AI naudojimo švietime istorija siekia septintąjį dešimtmetį, kai buvo sukurtos ankstyvos išmaniosios mokymo sistemos. Šios sistemos buvo sukurtos siekiant teikti asmeninius mokymus studentams, pritaikytus jų individualiems poreikiams ir mokymosi stiliams. Tačiau prieš gilindamiesi į generatyvinio AI naudojimo švietime raidą, turime suprasti generatyvaus AI modelių istoriją ir raidą.
2.1. Generatyvių dirbtinio intelekto modelių istorija ir evoliucija
Generatyvinio dirbtinio intelekto (AI) modeliai, ypač kalbos modeliai (LLM), bėgant metams padarė didelę pažangą, pakeisdami natūralios kalbos apdorojimo kraštovaizdį ir daugybę kitų kūrybinių užduočių (Susarla ir kt., 2023). Šiame skyriuje gilinamės į šių modelių istorines šaknis ir evoliucinę trajektoriją, išryškiname pagrindinius jų raidos etapus.
• Ankstyvosios kalbos modeliavimo dienos: LLM kūrimo istorija prasidėjo šeštajame ir septintajame dešimtmečiuose, kai atsirado statistinis natūralios kalbos apdorojimas (NLP). Iš pradžių kalbos modeliai daugiausia naudojo statistines metodikas tam tikro žodžio ar žodžių sekos tikimybei įvertinti kalbiniame kontekste. N gramai ir n žodžių sekos šiuo laikotarpiu buvo pagrindiniai metodai (Russell ir Norvig, 2010).
• Nuo N gramų iki Word įterpimų: Esminis poslinkis nuo n-gramų modelių prie žodžių įterpimo prasidėjo 2000-ųjų viduryje, kai 2013 m. (Mikolov ir kt., 2013) pristatė „Word2Vec“ algoritmą. Šis naujoviškas požiūris priklausė nuo vektorinių vaizdų panaudojimas žodžių semantinei reikšmei užfiksuoti. Šis proveržis padėjo pagrindus tolesnei kalbos modeliavimo raidai.
• Teksto giluminio mokymosi modelių (ty nuo sekos iki sekos NLP) pažanga: Žodžių įterpimų integravimas į kalbos modeliavimą pradėjo naują erą. Šie vektoriniai atvaizdai buvo įvestis į gilaus mokymosi modelius, tokius kaip pasikartojantys neuroniniai tinklai (RNN) ir vėliau kodavimo-dekoderio architektūra. Šis pokytis turėjo didelį poveikį NLP tyrimams, įskaitant teksto apibendrinimą ir mašininį vertimą, kaip parodė (Sutskever ir kt., 2014). Galimybė užfiksuoti semantinį kontekstą naudojant vektorines reprezentacijas žymiai pagerino sugeneruoto turinio kokybę ir gylį.
• Transformatorių architektūros revoliucija: 2017 m. (Vaswani ir kt., 2017) pristatyta transformatoriaus architektūra laikoma lūžio tašku tobulinant NLP ir kompiuterinės vizijos tyrimus, ypač kalbant apie kalbos modeliavimo tyrimus. Transformatoriaus architektūra reiškė NLP paradigmos pokytį, įvedant dėmesio į save mechanizmą. Remiantis transformatoriaus architektūra, tokia kaip BERT, buvo sukurti keli giluminio mokymosi modeliai (Devlin ir kt., 2018). Ši naujovė leido modeliui užfiksuoti ilgalaikes priklausomybes tarp sekų, pagerinant sukurto turinio nuoseklumą ir kontekstualumą. Transformatoriaus architektūra padėjo pagrindą tolesniam LLM vystymuisi.
• LLM atsiradimas: Pastaraisiais metais AI srityje paplito didelių kalbų modeliai (LLM). Šie modeliai, kurie taip pat žinomi kaip „pagrindų modeliai“, yra parengti naudojant didžiulius ir įvairius duomenų rinkinius, apimančius knygas, naujienų straipsnius, tinklalapius ir socialinės žiniasklaidos įrašus, ir suderinti su milijardais hiperparametrų (Bommasani ir kt., 2021). Šis precedento neturintis duomenų kiekis, kartu su modelių architektūros ir mokymo metodų pažanga, pažymėjo reikšmingą lūžio tašką. Šie pamatų modeliai pasižymi išskirtiniu gebėjimu prisitaikyti prie įvairių užduočių, įskaitant užduotis, kurioms jie iš pradžių nebuvo mokomi. „ChatGPT“ yra pavyzdinis generatyvaus AI modelio veikimo pavyzdys. Ši nuostabi AI sistema buvo paleista 2022 m. lapkritį ir yra tiksliai suderinta naudojant generatyvų iš anksto paruoštą transformatorių GPT-3.5, kuris iš pradžių buvo parengtas naudojant didelį teksto ir kodo šaltinių duomenų rinkinį (Neelakantan ir kt., 2022). ChatGPT panaudoja sustiprinto mokymosi iš žmogaus grįžtamojo ryšio (RLHF) galią – techniką, kuri parodė didžiulį žadą suderinant didelių kalbų modelius (LLM) su žmogaus ketinimais (Christiano ir kt., 2017). Stulbinančiai pranašesnis ChatGPT našumas pabrėžia paradigmos pokyčio potencialą rengiant generatyvius AI modelius. Šis pokytis apima instrukcijų derinimo metodų, pvz., sustiprinimo mokymosi (Christiano ir kt., 2017), greitosios inžinerijos (Brown ir kt., 2020), ir minties grandinės (CoT) raginimų (Wei ir kt., 2022), kaip kolektyvinį žingsnį kuriant intelektualiųjų paslaugų ekosistemą, pagrįstą generatyviniais AI modeliais.
Šios pažangos kulminacija lėmė generatyvius AI modelius, kurie turi nepaprastą gebėjimą suvokti ir generuoti daugialypės terpės tikrovišką ir tinkamą turinį (įskaitant tekstą, vaizdus, garsą ir vaizdo įrašus). Dėl tokių galimybių šiuos modelius buvo galima panaudoti ir plačiai pritaikyti įvairiose programose, pavyzdžiui, švietime. Nepaisant šios pažangos, generatyvaus AI kraštovaizdyje iškilo rūpesčių ir iššūkių (Susarla ir kt., 2023). Tai, kad tokius modelius kaip „ChatGPT“ galima pritaikyti naujoms užduotims, kyla klausimų dėl jų supratimo. DI sąžiningumo ekspertai perspėjo, kad šie modeliai gali išlaikyti visuomenės šališkumą, užkoduotą jų mokymo duomenyse (Glaser, 2023), pavadindami juos „stochastinėmis papūgomis“ (Bender ir kt., 2021).
2.2. Generatyvaus AI naudojimo švietime raida
AI naudojimas švietime nėra naujiena, pirmieji bandymai naudoti AI švietime gali būti atsekami dar septintojo dešimtmečio pradžioje, kai Ilinojaus universiteto Urbana-Champaign mokslininkai sukūrė intelektualią mokymo sistemą (ITS), pavadintą PLATO (programuota logika Automatinės mokymo operacijos) (Bitzer ir kt., 1961). PLATO buvo pirmoji kompiuterinė sistema, kuri leido studentams, turintiems grafines vartotojo sąsajas, bendrauti su mokomąja medžiaga, kuri buvo sukurta ir pritaikyta naudojant AI jų poreikiams. Kitas ankstyvųjų bandymų naudoti AI švietime pavyzdys yra „Automatic Grader“ sistema, sukurta septintajame dešimtmetyje, siekiant automatiškai įvertinti programavimo klases (Hollingsworth, 1960).
Asmeninių kompiuterių atsiradimas padidino ITS plėtrą aštuntajame dešimtmetyje, o tuo laikotarpiu sukurtos sistemos pavyzdys yra TICCIT (Time-shared, Interactive Computer-Controlled Instructional Television) (Stetten, 1971). TICCIT buvo dar viena ankstyvoji ITS, kuri buvo sukurta aštuntojo dešimtmečio pradžioje Pitsburgo universitete. TICCIT buvo ankstyvas bandymas masiškai pateikti individualizuotą daugialypės terpės turinį vartotojams namuose ir mokyklose.
ITS raidos pažanga septintajame ir aštuntajame dešimtmečiuose buvo paremta mokymosi teorijomis ir principais, kurie vertina individualų individualizuotą mokinių kuravimą klasėse (žr., pavyzdžiui, BF Skinnerio novatorišką darbą apie „programuotą mokymo judėjimą“). ir Benjamin Bloom darbas apie „įvaldymo mokymąsi“ (Block & Burns, 1976 m.) Tuo laikotarpiu sukurtos ITS. ir išplėtota (Reiser, 2001a) nuo devintojo dešimtmečio kompiuterinis mokymas ir ypač dirbtiniu intelektu pagrįstas švietimas tapo automatizuoti kai kurias mokymo veiklas (Reiser, 2001b).
Pasaulio žiniatinklio (WWW) atsiradimas 1990-aisiais labai pakeitė pažangiųjų švietimo paslaugų teikimo terpę Chen ir kt. (2020). ITS išsivystė, kad teiktų išmanias, prisitaikančias ir suasmenintas mokymosi paslaugas, paremtas mašininio mokymosi modeliais. Nepaisant šių pažangos ITS kūrimo ir pateikimo vartotojams, jų galimybės apsiribojo individualizuoto mokymo ir mokymosi teikimu. WWW evoliucija į vadinamąjį „Web 2.0“ ir papildomos bendradarbiavimo ir socialinio bendravimo galimybės atvėrė kelią į naują ITS kūrimo erą. Surinkti duomenys, pagrįsti vartotojų sąveika su žiniatinklio 2.0 paslaugomis ir galimybe mokyti programinės įrangos agentus apie šiuos duomenis naudojant skirtingus mašininio mokymosi algoritmus, leido pasiekti daugiau pažangos taikant mokymosi analizę, kad būtų galima pritaikyti ir pritaikyti mokymąsi (Clow, 2013). .
XXI amžiuje įvyko keli AI naudojimo švietime proveržiai. Šiuos laimėjimus patvirtino pažanga šiose srityse: i) aparatinės įrangos galimybės ir našumas (Nickolls & Dally, 2010), ii) didelių duomenų gavyba (Wu ir kt., 2013) ir iii) AI modeliai ir architektūros (ty giluminio mokymosi modelių atsiradimas) (LeCun et al., 2015). Transformatoriaus gilaus mokymosi architektūros atsiradimas 2017 m. (Vaswani ir kt., 2017) laikomas lūžiu apskritai intelektualios programinės įrangos kūrimo istorijoje (žr. 2.1 skyrių). Daugelis išmaniųjų modelių, tokių kaip generatyviniai iš anksto apmokyti transformatoriai (GPT), pradėjo pasirodyti iškart po to (Radford ir kt., 2018). 2022 m. lapkritį OpenAI išleido „ChatGPT“, pagrįstą GPT 3.5 architektūra, ir vos per kelis mėnesius pasiekė daugiau nei 100 milijonų vartotojų. Nuo tada ir šiandien yra kuriami generatyvūs dirbtiniu intelektu pagrįsti mokymo įrankiai, skirti mokiniams teikti asmeninį mokymą, adaptyvų mokymąsi ir patrauklią mokymosi patirtį (žr. 4.2 skyrių).