Teste pe sisteme de control adaptiv. Conceptul de testare adaptivă și principiile implementării acesteia. Diagrama construită a cazurilor de utilizare pentru subsistemul de testare adaptivă este în Anexa A

Unul dintre domeniile prioritare de dezvoltare Învățământul rusesc pe scena modernă este de a asigura accesibilitatea și șanse egale de a primi o educație cu drepturi depline, precum și de a obține o calitate fundamental nouă a serviciilor educaționale profesionale. Evident, principalul mijloc de atingere a acestor obiective este creșterea rolului și importanței tehnologiei informației. Construirea unor sisteme de predare inteligente este un mare pas spre dezvoltarea și acumularea de conținut electronic pedagogic, care astăzi este format din hipertext, materiale electronice și teste. Principalele cerințe pentru noile sisteme de învățare includ: inteligență, scalabilitate, deschidere, flexibilitate și adaptabilitate la toate etapele procesului de învățare.

Recent, a existat o utilizare din ce în ce mai mare a diferite etape procesul educațional a primit diverse tipuri de mecanisme de diagnosticare electronică (materiale) - teste computerizate. Din păcate, testarea tradițională, care este implementată folosind teste standardizate, își pierde treptat relevanța. Se dezvoltă și evoluează în forme inteligente moderne și mai eficiente de testare adaptivă. Formulare inteligente diagnosticarea cunoștințelor se bazează pe fundamente teoretice și metodologice diferite de cele tradiționale și alte tehnologii de construire și reproducere a testelor. Modelul de sistem trebuie să includă module care implementează algoritmi adaptivi.

Avantajul cheie al testării adaptive față de forma tradițională este eficacitatea sa evidentă. Un test adaptiv vă permite să diagnosticați nivelul de cunoștințe al candidatului testului folosind un număr semnificativ mai mic de întrebări. Atunci când interacționează cu același test adaptiv, participanții la testare cu un nivel ridicat de pregătire și cei cu un nivel scăzut de pregătire vor rezolva subseturi complet diferite de sarcini. Primul subiect va vedea un număr semnificativ mai mare de întrebări cu un coeficient de dificultate mare, iar al doilea cu unul scăzut. Procentul de răspunsuri corecte între subiecte poate fi același, dar numărul de puncte va varia semnificativ.

Testarea adaptivă vă permite să construiți cu mai multă acuratețe un model de cunoștințe (competențe stăpânite) ale celor care iau testul. Sistemul de testare pe computer se adaptează la nivelul utilizatorului direct în timpul procesului de testare. Datorită mecanismelor flexibile de adaptare, sistemul poate determina ce întrebare și cu ce coeficient de dificultate să prezinte subiectului la fiecare moment specific de timp. De exemplu, unui subiect începe să rezolve un set de diagnostic și i se prezintă o sarcină cu un coeficient de dificultate b, a cărei soluție testează cunoștințele în cadrul unei mici unități didactice S. Dacă subiectul rezolvă corect sarcina care i-a fost prezentată, atunci nucleul analitic al sistemului selectează următoarea sarcină în cadrul aceleiași unități S, dar cu un coeficient de complexitate mai mare etc. Dacă subiectul răspunde incorect la întrebarea inițială a elementului didactic, atunci i se prezintă o sarcină cu un coeficient de dificultate mai mic etc. Valorile limită ale coeficienților de complexitate sunt descrise în modelul utilizat în diagnostic.

Un sistem inteligent de testare adaptivă computerizată trebuie să aibă următorul set de caracteristici:

Deschidere și extensibilitate . Sistemul ar trebui să fie construit pe o bază modulară. O compoziție aproximativă a modulelor de bază poate fi următoarea: „Base”, „Tester”, „Designer”, „Configurator”, „Report Designer”, „Planning Module”, „Base” este destinat menținerii unei liste de utilizatori ai copie instalată a programului, pregătirea unei liste de subiecte, gestionarea directorului de grupuri de subiecte, configurarea unui spațiu special (descompunere în blocuri tematice). „Constructor” este destinat să lucreze cu o bază de date de sarcini de testare și să dezvolte pachete de testare. „Configurator” este destinat configurarii elementelor de lucru de testare (conectarea testelor, atribuirea sesiunilor de testare). „Report Designer” este conceput pentru a procesa protocoalele primare de testare și pentru a construi diverse rapoarte. „Modulul de planificare” este conceput pentru a planifica și monitoriza procesul de testare. Testerul implementează direct un mecanism adaptativ pentru diagnosticarea nivelului de cunoștințe.

Neliniaritatea reproducerii conținutului de diagnostic. O selecție inteligentă adaptivă a următoarei sarcini de testare ar trebui implementată în funcție de rezultatele rezolvării celor anterioare.

Dificultate cunoscută . Toate sarcinile de testare trebuie să fie împărțite în categorii de dificultate și să aibă un coeficient adecvat care poate fi manipulat în timpul procesului de adaptare.

Universalitatea modelului de diagnostic. Sistemul permite testarea completă și de înaltă calitate a cunoștințelor unui număr mare de examinați fără cheltuială semnificativă de timp și resurse în cadrul unităților didactice de orice dimensiune

Fiabilitatea și acuratețea rezultatelor testării adaptive. Este folosită o abordare care exclude complet factorul eficient atunci când se analizează modelul individual al cunoștințelor subiectului.

În prezent, au fost dezvoltate și implementate un număr mare de sisteme de testare pe computer. Astfel de sisteme variază semnificativ în parametrii de clasificare. Și acum putem spune cu încredere că sistemele adaptive de testare pe computer își ocupă activ nișa pe piața de software pentru organizarea și susținerea proceselor pedagogice.


Bibliografie

  1. Nikiforov, O.Yu. Aplicarea unui mediu de testare pe computer bazat pe o bază de date de sarcini sub formă de test în sistemul de control al calității al unei instituții de învățământ superior. / O.Yu. Nikiforov, Yu.I. Nicoare // Managementul calității educației continue: Culegere de articole a celei de-a 2-a conferințe științifice și practice interregionale // Responsabil. editor E.Yu. Bahtenko; Ministerul Educației și Științei al Federației Ruse; Dept. Educație Volog. regiune; Vologda. stat ped. univ. – Vologda: VSPU, 2011. – 192 p. , Cu. 72-79.
  2. Nikiforov, O.Yu. Analiza subsistemului de testare MOODLE LMS // Tehnologii informaționale în știință și educație: Proceedings of the International Scientific and Practical Internet Conference. – Mine: Editura YURGUES, 2008. – 238 p.
  3. Nikiforov, O.Yu. Model de componentă generalizată a unui sistem de testare computerizat / O. Yu. Nikiforov // Educație, știință, afaceri: caracteristici dezvoltare Regionalași integrare: Materiale ale conferinței științifice și metodologice din întreaga Rusie. – Cherepovets, – 2006. – p.309-311.
  4. Nikiforov, O.Yu. Elementele principale ale sarcinilor sub formă de test / O. Yu. Nikiforov // Educație, știință, afaceri: trăsături ale dezvoltării și integrării regionale: Materiale ale conferinței științifice și metodologice din toată Rusia. – Cherepovets, – 2006. – p. 315-316.
  5. Nikiforov O.Yu., Koksharova E.I. Complex de caracteristici pentru clasificarea sistemelor de testare computerizată // Modern Cercetare științificăși inovație. 2013. Nr. 6
  6. Nikiforov, O.Yu. Semne de clasificare a sistemelor de testare computerizată / O. Yu. Nikiforov // Educație, știință, afaceri: caracteristici ale dezvoltării și integrării regionale: Materiale ale conferinței științifice și metodologice din toată Rusia. – Cherepovets, – 2006. – p.312-314.
Numărul de vizualizări ale publicației: Va rugam asteptati 1

Conform Conceptului de Modernizare a Educației Ruse, se poate observa că principalele eforturi de implementare a reformei de astăzi sunt concentrate pe creșterea rolului tehnologiei informației. Ele sunt utilizate în diferite moduri: pentru a gestiona procesul educațional, pentru a preda direct, pentru a controla și verifica asimilarea și aplicație practică cunoștințele dobândite de către cursanți. În acest scop, recent a existat o utilizare din ce în ce mai mare a diferite etape formarea a primit diverse tipuri de sondaje de testare. Gama de aplicare a testelor este foarte largă, de la un scurt sondaj după o explicație a temei curente până la examenele finale, finale sau de admitere. În același timp, pentru mulți mai înalți institutii de invatamant problemă de actualitate este utilizarea tehnologiei informației în dezvoltarea sistemelor automate de instruire și control al cunoștințelor. La urma urmei, utilizarea acestui tip de sistem în procesul educațional va face posibilă aplicarea de noi algoritmi adaptivi de control al testului, utilizarea capacităților multimedia ale computerelor în sarcinile de testare, reducerea volumului de documente, accelerarea procesului de calculare a rezultatelor sondajului. , simplificați administrarea și reduceți costurile de organizare și desfășurare a testării. În concluzie, se poate observa că sistemele de control al cunoștințelor informatice devin din ce în ce mai populare, ceea ce se explică prin obiectivitatea, accesibilitatea și rentabilitatea lor.

Pe baza celor de mai sus, s-a luat decizia de a dezvolta un pachet software, un sistem universal automatizat de testare adaptivă (ASAT), care este un mijloc de dezvoltare și creare a diferitelor tipuri de teste și este, de asemenea, utilizat pentru testarea și procesarea rezultatelor. Principala cerință pentru sistemul dezvoltat a fost inteligența acestuia, realizată prin organizarea adaptabilității procesului de testare.

Pachetul software ACAT oferă următoarele capabilități pentru organizarea procesului de testare:

Automatizarea procesului de creare a testelor, proces de testare de înaltă calitate.

Deschiderea și scalabilitatea sistemului.

Absența unei legături rigide la orice subiect.

Ușurință în crearea și modificarea testelor.

Oferirea posibilității de lucru cu mai mulți utilizatori. Acces personalizat pentru toate categoriile de utilizatori.

Protecție împotriva accesului neautorizat la sarcinile testate.

Au dezvoltat instrumente de navigare la toate nivelurile în timpul procesului de testare. Disponibilitatea unui mijloc de control dinamic al procesului de testare din partea profesorului.

Personalizarea (adaptarea) materialului de testare la caracteristicile individuale ale elevului (student, student, specialist etc.).

Selecția adaptivă a următoarei întrebări în funcție de corectitudinea răspunsurilor anterioare ale elevului.

Umplerea bazei de date cu sarcini de testare, permițându-vă să lucrați atât cu informații de testare text, grafice, cât și dinamice.

Abilitatea de a crea diferite sarcini dintr-un set de întrebări.

Posibilitatea de a testa părți ale cursului și, ca urmare, de a efectua teste de examen final pentru întregul curs.

Asigurarea testării complete și de înaltă calitate a cunoștințelor unui număr mare de cursanți (studenți, elevi, specialiști) fără cheltuieli speciale de timp și resurse materiale în toate secțiunile procesului educațional.

Fiabilitatea, acuratețea și obiectivitatea rezultatelor testării. Eliminarea unei abordări subiective a evaluării cunoştinţelor elevilor.

Reducerea probabilității apariției erorilor la calcularea rezultatelor testelor și generarea notei finale.

Eliberarea profesorilor de munca intensivă de muncă de prelucrare a rezultatelor testelor.

Colectarea și analiza promptă a rezultatelor testării în orice moment, cu posibilitatea de a genera rapoarte și declarații periodice pentru diverse solicitări.

Introducerea ASAT în procesul de învățare al studenților Universității de Stat Surgut și în instituțiile de învățământ din regiunea autonomă Khanty-Mansi - Ugra.

Conform metodei de evaluare a rezultatelor, testele sunt de două tipuri: tradiționale și adaptive. Avantajul unui test adaptiv față de unul tradițional este eficacitatea acestuia. Un test adaptiv poate determina nivelul de cunoștințe al candidatului cu mai puține întrebări. Atunci când efectuează același test adaptiv, testatorii cu un nivel ridicat de pregătire și cei cu un nivel scăzut de pregătire vor vedea seturi complet diferite de întrebări: primul va vedea număr mai mareîntrebări dificile, iar ultima - cele ușoare. Procentul de răspunsuri corecte pentru ambele poate fi același, dar din moment ce primul a răspuns la întrebări mai complexe, va obține mai multe puncte. Un alt efect semnificativ este creșterea fiabilității, deoarece în acest caz este eliminat invatare rapida bancă de sarcini pur și simplu „făcând clic” pe opțiunile de pe computer (astfel, puteți învăța doar sarcini ușoare, în timp ce cele dificile și unele dintre cele de mijloc se dovedesc a fi nestudiate).

În acest sistem de testare, adaptabilitatea se exprimă printr-o modificare a proporțiilor relative în prezentarea sarcinilor ușoare, medii și dificile, în funcție de numărul de răspunsuri corecte înregistrate în timpul sesiunii de testare. Trebuie remarcat faptul că trecerea la tehnica adaptativă este posibilă doar ca urmare a acumulării unei bănci semnificative de sarcini cu un nivel de dificultate măsurat empiric. Adaptabilitatea este combinată cu principiul unui „algoritm de scară” - prezentând sarcini cu o creștere sistematică a nivelului de dificultate. În primul rând, sunt prezentate sarcini ușoare, apoi cele medii și, dacă testatorul are succes la nivelurile anterioare, cele dificile. După fiecare răspuns, programul de testare determină valabilitatea așa-numitului „transfer timpuriu” al candidatului la un nivel superior. nivel inalt dificultăți. La fiecare pas se evaluează semnificația diferențelor dintre numărul de răspunsuri corecte și incorecte. Pentru valori mai mici decât nivelul de eroare de 5% (respingând ipoteza probabilității egale de apariție a răspunsurilor corecte și a erorilor), testatorul este transferat la un nivel de dificultate superior. Dacă sarcinile unui anumit nivel s-au epuizat și testatorul nu a trecut la următorul nivel de dificultate, atunci procesul de testare se încheie și se determină nivelul de cunoștințe al candidatului.

Sistemul este implementat sub forma a trei module independente:

modul de testare (destinat persoanelor testate);

modul de creare și editare a testelor (destinat profesorilor);

modul de statistică și analiză a rezultatelor (destinat profesorului), care poate fi instalat independent unul de celălalt pe diferite mașini client;

Pentru a salva datele inițiale și rezultatele testelor, se utilizează o bază de date care stochează o bancă de sarcini de testare, parametrii de configurare a testului și procesul de testare, informații pentru autentificarea utilizatorului, rezultatele testelor și alte informații despre procesarea datelor.

Modulul de creare și editare a testelor identifică profesorii înregistrați sau înregistrează noi profesori, accesează baza de date care stochează sarcinile de testare și răspunsurile pentru fiecare test, precum și parametrii acestuia și permite profesorului să creeze un nou test, să modifice setările unui test existent. testați, editați întrebările și răspunsurile.

Trebuie remarcat faptul că un profesor, s-a autentificat în sistem folosind numele său de conectare și parola, obține acces doar la propriul set de teste, fără a putea vizualiza sau modifica testele altui profesor.

Folosind baza de date, modulul de testare identifică utilizatorii înregistrați sau înregistrează noi utilizatori, selectează un test, testează subiectul prin afișarea unei întrebări pe ecran și apoi primirea unui răspuns, procesează datele primite și scrie rezultatele testului în baza de date pentru analize ulterioare și utilizarea de către profesor.

Participanții la testare pot accesa doar anumite teste prestabilite de instructor. În acest caz, se folosește un algoritm de control adaptiv al cunoștințelor, care determină alegerea sarcinii următoare în funcție de răspunsurile examinatorului la întrebările anterioare. În acest sistem, nu există nicio opțiune de a sări peste o întrebare și de a reveni la ea la sfârșitul testării, acest lucru se datorează faptului că, în funcție de modul în care testatorul răspunde la întrebarea curentă, alegerea următoarei întrebări adresate este determinată. La finalizarea testului, rezultatul testului și un scurt comentariu sunt afișate candidatului. Rezultatul testului este punctajul pe care îl primește utilizatorul pe baza criteriilor specificate de profesor pentru acest test.

Modulul de statistică și analiza rezultatelor testelor oferă profesorului posibilitatea de a vizualiza rezultatele testelor unui elev individual sau unui întreg grup, pentru una sau mai multe teste cu diferite grade de detaliu. În acest caz, raportul afișează rezultatele tuturor elevilor pentru toate testele pe care le-au susținut legate de subiectul selectat al unui anumit profesor.

Deoarece testarea se bazează pe principiul adaptabilității, întrebările, precum și numărul lor în cadrul unui test, nu vor fi aceleași pentru fiecare utilizator. Prin urmare, acest modul oferă capacitatea de a ieși nu numai Informații generale, dar și un raport mai detaliat despre test, care conține informații despre ce întrebări a primit utilizatorul și cum a răspuns la acestea.

Sistemul creat corespunde cerințe moderne cerințe pentru o clasă de acest tip de sistem, atât în ​​domeniul testării pedagogice, cât și în domeniul tehnologiei informației.

Link bibliografic

Bushmeleva K.I. SISTEM DE TESTARE ADAPTATIV AUTOMATizat // Cercetare de baza. – 2007. – Nr 2. – P. 48-50;
URL: http://fundamental-research.ru/ru/article/view?id=2517 (data accesului: 18/09/2019). Vă aducem în atenție reviste apărute la editura „Academia de Științe ale Naturii”

Controlul testelor adaptive este înțeles ca un sistem computerizat de verificare și evaluare științifică a rezultatelor învățării, care este foarte eficient datorită optimizării procedurilor de generare, prezentare și evaluare a rezultatelor efectuării testelor adaptive. Eficacitatea procedurilor de control și evaluare crește atunci când se utilizează o strategie în mai multe etape pentru selectarea și prezentarea sarcinilor bazate pe algoritmi cu dependență totală de context, în care pasul următor este efectuat numai după evaluarea rezultatelor pasului anterior. După ce subiectul finalizează următoarea sarcină, de fiecare dată este nevoie să se ia o decizie cu privire la selectarea dificultății sarcinii următoare, în funcție de dacă răspunsul anterior a fost corect sau incorect. Algoritmul de selectare și prezentare a sarcinilor se bazează pe principiul feedback-ului, când, dacă subiectul răspunde corect, următoarea sarcină este selectată ca fiind mai dificilă, iar un răspuns incorect presupune prezentarea unei sarcini ulterioare mai ușoare decât cea la care subiecților li s-a dat un răspuns incorect. De asemenea, este posibil să se pună întrebări suplimentare pe subiecte pe care studentul nu le cunoaște foarte bine pentru a determina mai exact nivelul de cunoștințe în aceste domenii. Astfel, putem spune că modelul adaptiv amintește de un profesor care susține un examen – dacă elevul răspunde la întrebările puse cu încredere și corect, profesorul îi acordă rapid o notă pozitivă. Dacă elevul începe să „plutească”, atunci profesorul îi pune întrebări suplimentare sau orientative de același nivel de complexitate sau pe aceeași temă. Și în sfârșit, dacă elevul răspunde prost încă de la început, profesorul dă și o notă destul de repede, dar negativă.

Avantaje:

Permite o măsurare mai flexibilă și mai precisă a cunoștințelor cursanților;

Vă permite să măsurați cunoștințele cu mai puține sarcini decât în ​​modelul clasic;

Identifică subiecte pe care elevul le cunoaște prost și îi permite să pună o serie de întrebări suplimentare despre ele.

Defecte:

Nu se știe dinainte câte întrebări trebuie adresate elevului pentru a-și determina nivelul de cunoștințe. Dacă întrebările incluse în sistemul de testare nu sunt suficiente, puteți întrerupe testarea și evalua rezultatul în funcție de numărul de întrebări la care a răspuns studentul;

Poate fi folosit doar pe computer.

Scale clasice de evaluare a cunoștințelor și Teoria răspunsului la item.

Teoria clasică a testării ( Teoria clasică a testelor - CTT ) creat inițial pentru interpretarea procedurilor de diagnosticare. Această teorie a fost creată pentru probleme pur aplicate, așa că unele dintre ipotezele utilizate în fundamentele acestei teorii trebuie clarificate, mai ales că aceste fundamente nu sunt aproape discutate în literatură.

Teoria clasică a testării presupune în mod explicit:

1. Unidimensionalitatea, i.e. Procedura de testare măsoară o singură calitate, pregătire sau capacitate.

2. Reprezentativitatea, în cadrul CTT, înțeleasă ca independența probabilității unei anumite evaluări din care subgrup al populației generale va efectua testul.

3. Independenta sarcinilor, i.e. sarcinile sunt independente unele de altele.

4. Independența răspunsurilor subiecților testului.

Ambele independențe menționate sunt înțelese cel puțin în sens statistic.

Întrucât procedurile de diagnostic în cele mai multe cazuri au fost efectuate sub formă de teste, iar în majoritatea testelor sub formă de întrebări închise sau, mai rar, deschise, rezultatul fiecărui răspuns s-a presupus a fi măsurabil în puncte pe o anumită scară.

Pe lângă ipotezele explicite, această teorie conține câteva ipoteze implicite. În special, se presupune implicit:

- măsurabilitatea toate răspunsurile posibile, adică existența unei proceduri eficiente pentru obținerea unui răspuns la orice întrebare adresată,

- completitudine răspunsuri, adică primirea de răspunsuri la toate întrebările adresate, din care rezultă că refuzurile de a răspunde nu sunt luate în considerare,

- echivalenţă toate întrebările și, prin urmare, ponderi egale pentru toate răspunsurile primite,

- egalitatea varianţelor când se utilizează formulare de răspuns paralele,

- distributie normala răspunsuri.

Ca și în cazul măsurătorilor tehnice, se presupune implicit că orice rezultat al măsurării constă din valoarea adevărată și eroarea de măsurare, iar erorile de măsurare sunt presupuse a fi aditive, ceea ce este necesar pentru trecerea corectă de la sumele erorilor la o integrală. eroare, iar eroarea integrală se presupune, de asemenea, a fi distribuită normal.

Cât de corecte sunt aceste ipoteze, de obicei, nu se discută. În orice caz, cele mai mari întrebări despre CTT se referă la asigurarea unei adevărate independențe a sarcinilor. Problema alegerii scalelor de evaluare nu este de asemenea discutată; ipoteza inițială este că „scorurile brute” au fost deja obținute.

O întrebare mai subtilă este legată de sensul metrologic al categoriei „erori”. În măsurătorile tehnice, se presupune implicit că eroarea și eroarea generată de aceasta sunt o proprietate a procedurii de măsurare și, prin urmare, eroarea, în principiu, poate fi estimată și luată în considerare pe baza rezultatelor verificării și calibrării. . La măsurarea elementelor ergatice, apare o altă sursă de eroare - instabilitatea a ceea ce se măsoară, care apare ca urmare a acțiunii diferiților factori, dintre care cei mai importanți includ învățarea, uitarea, oboseala și dinamica stării funcționale. Corecțiile pentru acești factori nu sunt discutate în metrologie.

Pentru a obține estimarea finală, se folosesc diverse procedee de calcul. Cel mai adesea, scorul mediu este calculat folosind formula medie aritmetică obișnuită, unde este scorul final i-subiectul, și pătratul abaterii de la media sau variantele acestui indicator - abatere standard sau dispersie. Pentru compararea rezultatelor se folosește coeficientul de corelație între sarcini și între subiecți.

Ca opțiune, se folosește uneori un scor mediu ponderat al formularului, unde sunt coeficienții de ponderare corespunzători.

Dintre toate ipotezele enumerate mai sus, cea mai dificil de demonstrat este echivalența răspunsurilor, deoarece aceasta necesită dovada egalității subiective a tuturor dificultăților răspunsurilor corespunzătoare și, în același timp, dovada importanței egale a tuturor întrebărilor puse. . Asumarea computabilității indicatorilor statistici menționați necesită dovada de fond a corectitudinii încadrării homeomorfe a scării de puncte în scara numerelor reale, în care se realizează efectiv astfel de calcule. Cu alte cuvinte, întrebările legate de validitatea de criteriu și de construct rămân de obicei deschise.

În plus față de indicatorii statistici standard menționați mai sus (chemarea corectitudinii matematice de obicei nu este discutată) pentru subiecți, sunt evaluate unele proprietăți psihometrice ale procedurilor de măsurare cu o semnificație matematică pragmatică clară, dar dubioasă, de exemplu,

Factorul de ușurință al unei sarcini (sau un coeficient de dificultate similar), unde este scorul mediu primit pentru sarcină, este scorul maxim posibil pentru aceeași sarcină, în ciuda faptului că se presupune că scorul minim posibil pentru orice sarcină este zero. în mod implicit,

Coeficientul de discriminare a sarcinii, adică coeficientul de corelație dintre rezultatul sarcinii și rezultatul final, sau ceea ce este considerat o opțiune mai informativă este coeficientul de corelație dintre rezultatul sarcinii și rezultatul final fără a lua în considerare această sarcină,

și alți coeficienți, a căror interpretare în această știință diferă de cea general acceptată.

În special, fiabilitate aici, spre deosebire de înțelegerea standard, este considerată calitatea nu a unui sistem sau obiect, ci a unei măsurători și nu se evaluează prin timpul funcționării corecte sau prin orice variante ale acestui timp, de exemplu, în termeni de timp. între eşecuri, ci ca posibilitatea de a obţine indicatori comparabili, evaluaţi prin coeficient de corelaţie. Din această interpretare obținem fiabilitate consistentă, adică coeficientul de corelație dintre rezultatele efectuării a două sarcini, distanța de timp între care este suficientă pentru ca aceste sarcini să fie considerate subiectiv independente, fiabilitate paralelă, i.e. coeficientul de corelație între rezultatele variantelor de sarcini, fiabilitatea pieselor, i.e. coeficientul de corelație dintre rezultatele întregii proceduri de măsurare și orice parte a acesteia și alți indicatori. Cu alte cuvinte, fiabilitatea consecventă în această știință se numește ceea ce în teoria măsurării profesionale este considerată o măsură cantitativă a validității test-retest, fiabilitatea paralelă și fiabilitatea formei este o măsură a validității test-subtest și, în general, există confuzie în terminologie, ceea ce duce la confuzie validitatea și fiabilitatea.

Conform unei alte versiuni, coeficientul de fiabilitate este definit ca , unde este varianța erorilor de măsurare și este varianța punctelor marcate, adică timpul nu este menționat deloc în această definiție a coeficientului de fiabilitate.

Dubiositatea unor astfel de calcule din punct de vedere matematic se datorează faptului că datele inițiale au fost obținute inițial pe o scară de puncte, pe care se specifică uneori relația de ordine, și chiar ordinea liniară, dar operațiile aritmetice nu sunt definite. . Prin urmare, adăugarea și calcularea ulterioară a mediilor, mediilor ponderate, varianțelor și corelațiilor pe o scală de scor sunt nedefinite. O altă ipoteză, de înțeles din punct de vedere pragmatic, dar cu o justificare teoretică vădit inadecvată, echivalează cu afirmații despre distribuția normală a răspunsurilor și, prin urmare, distribuția „scorurilor brute” pe o scară a numărului real. Presupunerea unei distribuții lognormale a acelorași scoruri pare adesea mai plauzibilă, dar de obicei nu este nici fundamentată. Aceste ipoteze fac posibilă utilizarea metodelor binecunoscute pentru prelucrarea statistică a rezultatelor, dar corectitudinea matematică a tuturor calculelor ulterioare după această ipoteză nu este discutată.

Multe probleme ale abordării tradiționale de construire a scalelor (metricilor) de cunoștințe ca puncte pentru finalizarea unor seturi de sarcini special selectate sunt discutate pe larg în literatura de specialitate.

În primul rând, este aproape imposibil să se demonstreze validitatea test-la-test și intertest, prin urmare, problema comparației, și cu atât mai mult a contabilității generale a rezultatelor măsurătorilor efectuate folosind diferite metode, rămâne deschisă.

„Efectele marginii” au fost observate în mod repetat, adică stabilitatea relativă a rezultatelor mai aproape de mediana distribuției răspunsului și rezultate instabile la marginile acestei distribuții, ceea ce se explică de obicei prin rolul crescând al factorilor străini atât în ​​„inferioară”. ” și părțile „superioare” ale distribuției. Pentru a combate aceste efecte, se propune de obicei o recomandare bazată pe empiric pentru a stabili o „cuantilă de încredere” a distribuției, de obicei se propune să se accepte sau, dacă răspunsul este sub sau mai sus, să se ajusteze pentru instabilitate, în principal, să se supraestimeze estimări folosind formule de corecție selectate empiric.

În cazul întrebărilor închise sunt posibile situații de ghicire aleatorie; pentru corectarea datelor în acest caz, se propune să se facă corecții ale formei, unde este rezultatul după corectare, este rezultatul (în puncte sau alte scale) de răspunsul la a treia întrebare înainte de corectare, este numărul de răspunsuri posibile la a treia întrebare, w- numărul sarcinilor neîndeplinite într-o serie de măsurători. Această formulă este justificată empiric, în special, problema oportunității luării în considerare în această formulă a sarcinilor neîndeplinite pentru care se discută valoarea corespunzătoare, ceea ce reduce valoarea, și există discuții despre sensul de fond al unor astfel de modificări.

În general, metricile calității cunoștințelor în abordarea clasică sunt justificate de calibrarea statistică a metodelor pentru populația corespunzătoare. Inca de la creatie IQ fundamentarea metrologică a măsurătorilor cunoștințelor se realizează pe baza distribuțiilor de puncte calculate pentru contingentul corespunzător de respondenți. De exemplu, sunt indicate valorile medii IQ după vârstă, grupuri sociale sau profesionale. Totuși, din diferență IQ Nu este clar ce diferențe fundamentale în structura cunoștințelor disting aceste grupuri.

Sursă:
  • http://cblis.utc.sk/cblis-cd-old/2003/3.PartB/Papers/Science_Ed/Testing-Assessment/Papanastasiou.pdf
  • adnotare

    Învățarea asistată de computer (CBT) poate avea un potențial mare atunci când este utilizată în mod corespunzător pentru a îmbunătăți învățarea. Cu toate acestea, această calitate poate fi îmbunătățită prin utilizarea testării bazate pe computer (CT) și, mai precis, prin utilizarea testării adaptive computerizate (CAT). În scopul acestei lucrări, autorul descrie mecanismul și avantajele testării adaptive pe computer, precum și modul în care aceasta poate îmbunătăți procesul de învățare în domeniul științei. Educatorul este încurajat să ia în considerare unele limitări și provocări în implementare, iar educația științifică va fi, de asemenea, discutată. CUVINTE CHEIE Testare adaptivă computerizată, CAT, testare computerizată, formare informatică, educație în științe naturale, evaluare, feedback.

    INTRODUCERE

    Învățarea bazată pe computer are un potențial extrem de mare pentru îmbunătățirea învățării în multe domenii și discipline, inclusiv în domeniul științei. Cu toate acestea, instruirea bazată pe computer trebuie monitorizată îndeaproape și continuu pentru a-și asigura eficacitatea. Acest lucru este valabil mai ales că unele cercetări anterioare au arătat că utilizarea computerului este corelată negativ cu performanța în matematică și știință (Papanastasiou și Ferdig, 2003). Deși nu este clar în ce circumstanțe acestea Consecințe negative evoluează și dacă există o relație cauză-efect între aceste variabile, de ce mai există. Prin urmare, această relație ar trebui să-i reamintească educatorului că folosirea unui computer nu este neapărat un „panacee” și că nu trebuie folosit iresponsabil și să ocupe atenția elevilor cărora le este greu să se descurce. De asemenea, această relație negativă dintre utilizarea computerului și performanță ar trebui să le reamintească educatorilor că există o nevoie semnificativă de evaluare constructivă și sumativă continuă în știință. Cu ajutorul unei evaluări adecvate, problemele care apar în timpul învățării pot fi identificate și eventual corectate dacă sunt detectate suficient de devreme. Cu toate acestea, evaluarea trebuie să fie folosită cu înțelepciune, astfel încât să poată completa procesul de învățare. Deoarece învățarea bazată pe computer este punctul central al acestei conferințe, acest articol va fi legat de evaluarea bazată pe computer. Scopul acestei lucrări este de a depăși simpla instruire bazată pe computer pentru a descrie testarea adaptivă a computerului și a discuta implicațiile, beneficiile și modul în care poate completa în mod eficient pregătirea bazată pe computer în acest domeniu al științei.

    Descriere

    Testarea asistată de computer (CT) poate fi definită ca orice tip de evaluare care se realizează prin intermediul unui computer. Cu toate acestea, testarea computerului poate dura diverse forme, în funcție de cât de adaptat este testul (College Board, 2000). De exemplu, unele teste computerizate, numite și teste computerizate fixe, sunt pur liniare (Parshall, Spray, Kalohn și Davey, 2002). Acestea sunt testele care seamănă cel mai mult cu testarea hârtiei și creionului prin faptul că au o formă fixă, lungime fixă, iar elementele de testare sunt prestabilite într-o anumită ordine. Spre deosebire de testele computerizate fixe, testele computerizate (CAT) sunt teste pe computer care au gradul maxim de adaptabilitate, deoarece pot fi adaptate pentru fiecare elev în funcție de dificultatea generală și ordinea în care întrebările sunt prezentate candidatului. Așadar, testele computerizate (CAT) sunt teste computerizate care sunt create și adaptate special pentru fiecare participant la testare, pe baza unei evaluări a abilităților celui care susține testul și pe baza răspunsurilor din pașii anteriori.

    Avantajele testelor adaptive computerizate

    Principalele avantaje ale testării adaptive pe computer sunt legate de faptul că sunt eficiente din punct de vedere al timpului și al resurselor utilizate. Aceste beneficii vor fi discutate în secțiunea următoare din punctul de vedere al testatorilor, din punctul de vedere al profesorului care dorește să determine nivelul de cunoștințe al elevului, dar și din punctul de vedere al dezvoltatorului testului.

    Eficienţă

    Testele adaptive fac posibilă evaluarea abilităților unui subiect mai precis și la un cost mai mic decât utilizarea testelor pe hârtie. Testele tipice pe hârtie sunt create pentru testarea în masă, astfel încât testul să fie administrat unui grup mare de studenți cu abilități diferite. Pentru a face acest lucru, majoritatea întrebărilor din acest test sunt de nivel mediu de dificultate (întrucât majoritatea studenților au performanțe academice medii), ca urmare, conținutul testului de acest tip creează probleme elevilor cu performanțe mari și slabe. Un candidat cu un nivel scăzut de cunoștințe este capabil să răspundă la primele întrebări relativ ușoare. Iar întrebările de nivel mediu și ridicat de dificultate nu vor fi ușor de răspuns pentru un elev. În consecință, persoana care ia testul poate ajunge să ghicească răspunsurile la aceste întrebări sau le poate lăsa pur și simplu necompletate. În acest caz, este dificil să-i evaluezi cu adevărat cunoștințele și capacitățile, deoarece orice concluzie ar trebui să se bazeze numai pe răspunsurile la primele câteva întrebări pe care studentul le-a putut înțelege. Altul, mai mult exemplu concret Această situație este prezentată mai jos. Profesorul dorește să efectueze un test de biologie pe tema „ficat” Întrebare nivel scăzut necesită identificarea locației ficatului în imaginile unei persoane, iar întrebările de nivel înalt necesită capacitatea elevului de a diagnostica boala hepatică din imagini. În acest caz, dacă un student nu poate localiza nici măcar ficatul într-o imagine a corpului uman, nu există niciun motiv să-i pună o întrebare mai dificilă. Privind astfel de teste din perspectiva unui student cu cunoștințe profunde de biologie, situația este oarecum mai bună, deși încă nu este perfectă. Majoritatea întrebărilor vor fi prea ușoare pentru această persoană. Testele adaptive vă permit să selectați în mod eficient întrebările care sunt concepute special pentru un anumit nivel de cunoștințe al fiecărui participant la test. Atunci când toate întrebările vizează în mod clar abilitățile fiecărui elev, profesorul poate ajunge la concluzii mai sigure și mai valide despre cunoștințele reale ale elevului.

    Părere

    Un alt avantaj al testării bazate pe computer în general, precum și al testelor adaptabile la computer, este că pot manipula feedback-ul direct și imediat dintre elevi și profesor (Wise & Plake, 1990). Cu un test tipic pe hârtie, există întotdeauna o întârziere între profesor și persoana care susține testul. Fără a forma o evaluare, profesorii nu vor putea determina dacă instruirea bazată pe computer este cu adevărat menită să ajute un elev să învețe sau nu. Acest lucru este deosebit de important deoarece, fără o evaluare adecvată, unii studenți se pot găsi dezavantajați de formarea pe calculator. În plus față de evaluare generală, acest tip de evaluare arată modul în care fiecare elev a stăpânit materialul în ansamblu; de asemenea, este posibil să se furnizeze o listă de domenii și subiecte în care fiecare elev a avut întrebări, pe baza performanței sale la testarea adaptivă. Cu toate acestea, profesorul poate avea o astfel de întrebare, cu testare continuă, este posibil ca unii elevi să-și amintească întrebările testului și să informeze alți elevi despre acestea. Cu toate acestea, dacă un test adaptiv conține un număr relativ mare de întrebări, această problemă nu va apărea, mai ales că elevilor diferiți ar trebui să primească itemi diferiți în funcție de nivelurile lor individuale de abilități.

    Timp

    Din punctul de vedere al dezvoltatorului de teste, crearea unui test adaptiv este consumatoare de timp, dar mai eficientă din punctul de vedere al unui profesor. În special, studenții în timpul testării adaptive trebuie să răspundă la mai puține întrebări decât în ​​timpul testării obișnuite. În plus, testarea regulată este de obicei efectuată de întregul grup pentru o anumită perioadă de timp, ceea ce poate să nu se potrivească unor studenți. Profesorul și întregul grup trebuie să aștepte până când toți elevii au finalizat testul înainte de a putea trece la o altă activitate. Cu testarea adaptivă la computer, studenții pot susține examenul ori de câte ori sunt gata, singura cerință este ca computerul să fie disponibil și nu trebuie să aștepte până când întregul grup este gata să susțină testul sau până când întregul grup l-a finalizat. . Din perspectiva unui profesor, testarea adaptivă economisește timp și profesorul nu mai trebuie să-și facă griji cu privire la crearea de teste pentru grup, atâta timp cât CAT este capabil să acopere materialul acoperit. În plus, profesorul economisește timp la verificarea lucrărilor, deoarece testul este punctat de un computer.

    Alte beneficii

    Testarea adaptivă la computer are, de asemenea, câteva beneficii suplimentare. Testarea adaptivă computerizată are un nivel ridicat de securitate, deoarece lista de întrebări nu mai poate fi furată, iar înșelarea de la vecini nu este profitabilă, deoarece majoritatea întrebărilor de testare sunt individuale pentru fiecare. În plus, alte tipuri de date pot fi colectate folosind CAT, cum ar fi timpul necesar pentru a răspunde la fiecare întrebare sau numărul de modificări care sunt făcute elevilor în timpul testului.

    CONCLUZIE

    Cercetare modernăîn domeniul testării și evaluării au arătat că potențialul testelor adaptive computerizate a crescut. Avantajele și capacitățile testării adaptive computerizate fac posibil să mergem și mai departe. Acest lucru este evident în numărul de teste pe scară largă (de exemplu, GRE, TOEFL, ASVAB) care au devenit sau devin adaptative (Papanastasiou, 2001). Totuși, un astfel de pas trebuie făcut întotdeauna cu înțelepciune, astfel încât o astfel de procedură de evaluare să fie bine integrată în procesul de învățare pentru a-i asigura eficacitatea maximă.

    Legături

    1. Bennett, R. E. (1999). Utilizarea noii tehnologii pentru a îmbunătăți evaluarea. RR99-6. Princeton, NJ: Serviciul de testare educațională. 2. Domnul, F. M. (1980). Aplicații ale teoriei răspunsului la item la problemele practice de testare. Hillsdale, NJ: Asociații Lawrence Erlbaum. 3. Meijer, R. R. & Nerling, M. L. (1999). Testare adaptivă computerizată: prezentare generală și introducere. Măsurarea psihologică aplicată, 23(3), 187-194. 4. O'Neill, K. (1995). Performanța candidaților cu dizabilități la testele de aptitudini academice pe computer. Lucrare prezentată la Asociația Americană de Cercetare Educațională, San Francisco, aprilie 1995. 5. Papanastasiou, E. C. (2001). O „procedură de rearanjare” pentru administrarea testelor adaptive atunci când opțiunile de revizuire sunt permise. (Teza de doctorat, Universitatea de Stat din Michigan, 2001). 6. Papanastasiou, E. (2002a). O „procedură de rearanjare” pentru notarea testelor adaptive cu opțiuni de revizuire. Lucrare prezentată la Consiliul Național de Măsurare în Educație, New Orleans, LA. 7. Papanastasiou, E. (2002b). Factori care diferențiază studenții la matematică din Cipru, Hong Kong și SUA. Cercetare și evaluare educațională, 8(1), 129-146. 8. Papanastasiou, E. C. & Ferdig, R. E. (2003, ianuarie). Utilizarea computerului și alfabetizarea matematică. O analiză a relațiilor existente și potențiale. Lucrare prezentată la a treia conferință mediteraneană despre educația matematică, Atena, Grecia, 3-5 ianuarie 2003. 9. Parshall, C. G., Spray, J. A., Kalohn, J. C. & Davey, T. (2002). Considerații practice în testarea pe computer. NY: Springer. 10. Parshall, C. G., Stewart, R., & Ritter, J. (1996). Inovații: grafică, sunet și moduri alternative de răspuns. Lucrare prezentată la Consiliul Național de Măsurare în Educație, 9-11 aprilie 1996, New York. 11. Consiliul Colegiului. (2000, aprilie). O prezentare generală a testării pe computer. RN-09. 12. Wainer, H. (2000). PISICI: Unde și oricând. Psicologica, 21(1-2), 121-133. 13. Wise, S. L. & Plake, B. S. (1990). Testare pe computer în învățământul superior. Măsurarea și evaluarea în consiliere și dezvoltare, 23, 3-10.

    Elena C. Papanastasiou, Ph.D. Universitatea din Kansas și Universitatea din Cipru Departamentul de Educație P.O. Box 20537 1678 Nicosia Cipru

    Una dintre domeniile în curs de dezvoltare și promițătoare în metodele moderne de predare a limbilor străine este utilizarea tehnologiilor informatice pentru a controla nivelul de dezvoltare a abilităților și abilităților de vorbire.

    Testarea computerizată face posibilă integrarea informațiilor text, grafice, audio și video în sarcinile de testare, precum și automatizarea completă a procesului de efectuare a măsurătorilor de control.

    Testarea computerului vă permite să:

    procesează rapid informațiile de intrare;

    asigura operațional părere, care permite subiectului testat să primească în mod constant și imediat întărire pentru corectitudinea răspunsului, iar profesorului să efectueze controlul pas cu pas sau operațional al acțiunilor testatorului;

    crește motivația testatorului, deoarece atunci când lucrează cu un program de calculator există un element de neobișnuit, similar unei situații de joc, apare un spirit de competiție cu computerul;

    economisiți semnificativ timp și costuri pentru organizarea și efectuarea testării.

    Deci, prima sarcină pe care o poate rezolva în mod eficient un computer este să stocheze sarcini de testare și să creeze teste din acestea, și anume, să proceseze materialul principal, original al autorului, să facă clarificările, corecțiile și completările necesare la acesta; stochează informații, selectează sarcini dintr-o bancă de date electronică în conformitate cu criteriile specificate și produce aspectul necesar al testelor.

    A doua sarcină pe care o implementează computerul este înregistrarea participanților la testare și pregătirea acestora pentru îndeplinirea sarcinilor. De exemplu, înregistrarea, care poate fi pre-testare sau chiar înainte de testare, implică completarea unui card de înregistrare pe ecranul unui computer. După ce a primit informațiile necesare, sistemul îi dă testatorului un număr de identificare.

    Computerul îl poate pregăti pe persoana care ia testul să susțină testul - oferiți instrucțiuni. Programul de calculator include informații despre metodologia de lucru cu testul: recomandări cu privire la tehnologia de efectuare a testului, date despre timpul de testare, procedura de evaluare etc. Pregătirea pentru test poate include, de asemenea, instruire care să explice cum să reacționezi la anumite sarcini. , evitați erorile aleatorii (care nu au legătură cu competența de limba și vorbire a examinatorului), pentru a dezvolta stereotipurile temporare necesare.

    Următoarea etapă este efectuarea unei sesiuni de testare folosind un computer. Problema cheie a acestei etape este durata lucrării. Prin urmare, este important să includeți în programul de calculator pentru testarea afișajului, contabilizarea și controlul timpului alocat, petrecut și rămas al subiectului de testare.

    Pentru a începe lucrul, testatorul trebuie să indice numărul său de identificare, adică numărul primit la înregistrare. După aceasta, i se prezintă un test cu sarcini și instrucțiuni pentru îndeplinirea acestora.

    Finalizarea unei sesiuni de testare poate fi fie voluntară (la cererea testatorului și cu permisiunea instructorului, pe măsură ce sarcinile sunt îndeplinite), fie forțată (la sfârșitul termenului).

    Dacă autorii-compilatorii testului nu au ordonat în mod specific sarcinile de testare în funcție de gradul de dificultate, nu au împărțit testul în secțiuni de subtest care au fost autonome în ceea ce privește obiectivele de performanță și tipurile de activitate de vorbire, atunci este permisă efectuarea testului. in orice ordine. În caz contrar, sărirea peste anumite sarcini, de exemplu cele care păreau dificile, și revenirea la acestea sunt interzise de programul de calculator.

    După finalizarea sarcinilor de testare, începe etapa de procesare a răspunsurilor și de punctare. Conform clasificării lui V. I. Nardyuzhev, I. V. Nardyuzhev, prelucrarea poate fi:

    local, efectuat la locul de testare;

    la distanță, efectuate în afara locației sesiunilor de testare;

    formal, dacă este posibilă o simplă comparație cu chei;

    expert, dacă o astfel de comparație este imposibilă și este necesară implicarea experților și specialiștilor (de exemplu, pentru a evalua un răspuns detaliat oral sau scris);

    prompt, permițând ca rezultatele să fie demonstrate imediat după testare;

    amânat din cauza unui algoritm complex de calculare a punctelor sau a necesității de a obține o opinie de la un evaluator sau expert.

    Utilizarea unui computer permite analiza statistică a informațiilor, adică, pe de o parte, să furnizeze informații despre participanții la test, pe de altă parte - ceea ce este cel mai important în stadiul actual de dezvoltare a testării lingvodidactice - să colecteze date privind calitatea a materialelor de testare.

    În primul caz, algoritmul de analiză presupune:

    )selectarea obiectului analizei statistice (subtest);

    ) determinarea numărului de participanți la testare la un anumit nivel;

    )clasificarea participanţilor la test în funcţie de numărul de puncte obţinute;

    ) determinarea procentului de răspunsuri corecte la fiecare sarcină de testare;

    )constructia de grafice pe baza datelor digitale;

    )dacă este necesar, compararea rezultatelor testelor pentru diferite obiecte.

    În al doilea caz, analiza statistică se realizează prin:

    ) determinarea valorii minime, medii, maxime a rezultatelor testelor;

    )stabilirea parametrilor statistici ai sarcinii: nivelul de dificultate, capacitatea de diferențiere (capacitatea sarcinii de a distinge elevii puternici de cei slabi);

    )analiza muncii distratorilor, inclusiv determinarea frecvenței de alegere a răspunsurilor de către toată lumea, precum și a celor slabe și puternice;

    ) determinarea independenţei sarcinilor în test.

    Testarea pe computer este posibilă cu un software special dezvoltat care implementează modelul de testare informativă și pedagogică propus de autori.

    Software-ul de calculator influențează semnificativ atât conținutul sarcinilor de testare (de exemplu, utilizarea sunetului necesită echiparea computerului cu o placă de sunet), cât și metoda de implementare a modelului informativ și pedagogic (de exemplu, conectarea computerelor la Internet vă permite să organizați și efectuați teste în timp real).

    Programe de calculator pentru testare limbă străină pot fi clasificate în funcţie de metoda de programare. Programul poate fi liniar: în acest caz, singurul lucru oferit este directie posibila lucrați cu testul, indiferent de calitatea răspunsului elevilor la o anumită întrebare sau sarcină. De exemplu, persoana care susține testul trebuie să aleagă una dintre opțiunile de răspuns la finalizarea sarcinilor pentru a testa înțelegerea citirii:

    Un program liniar poate fi complicat printr-o etapă de ajustare (de exemplu, atunci când executați sarcini pentru a testa abilitățile gramaticale). În acest caz, dacă răspunsul este incorect, computerul readuce persoana care ia testul la sarcina, instrucțiunea sau regula inițială.

    Programul ramificat oferă explicații, întrebări suplimentare și instrucțiuni pentru a ajuta la finalizarea sarcinilor inițiale și pentru a obține permisiunea de mișcare secvențială sau deplasare prin cadru.

    Programele care combină secțiuni liniare și ramificate sunt clasificate ca mixte sau combinate. Ele oferă o mai mare flexibilitate de control și adaptează munca la capacitățile individuale ale elevilor. Totodată, testarea computerizată într-o limbă străină are specificul și cerințele proprii pentru prezentarea materialului controlat și pentru îndeplinirea sarcinilor. Una dintre sarcinile principale este utilizarea la maximum a tuturor canalelor de prezentare a informației, folosind tehnologii multimedia (grafice, clipuri de animație, imagini video), precum și diverse link-uri către documente și resurse (cărți de referință, minime lexicale, contururi de intonație etc. .). La rândul său, utilizarea vizualizării didactice pe calculator, simularea situațiilor de comunicare și organizarea realizării sarcinilor și corectarea răspunsurilor, crește productivitatea monitorizării programelor de calculator și motivația testatorilor de a stăpâni o limbă străină.

    Capacitate de testare pe computer

    Astăzi în lume există diverse organizatii, angajată nu numai în dezvoltarea problemelor, ci și în sistemele de testare pe computer. Printre acestea se numără și Serviciul de Testare Educațională (ETS) - Serviciul de Testare Educațională ( #"justify">), care din 1970 se ocupă de probleme și oferte de testare pe computer acest moment versiuni de calculator ale TOEFL ( #"justify">) - Test de engleză ca limbă străină. Acest test de către Limba engleză ca limbă străină este folosită pentru admiterea la colegii din SUA și Canada.

    În Franța, Centrul Național pentru Învățare la Distanță (Centre national denseignement à distance) oferă o versiune computerizată a testului în limba engleză ca limbă străină: Test FLE - Test de Français langue étrangère et seconde - niveau général (élémentaire, intermédiaire, avancé) : compréhension écrite, grammaire, vocabulaire , compréhension orale ( #"justifica">). Testul vă permite să vă determinați nivelul de competență în limba engleză ca limbă străină. Școala de limbă engleză „LEcole des Trois Ponts” oferă și teste interactive pentru cunoașterea generală a limbii engleze ( #"justifica">).

    În Rusia, angajații Departamentului de Tehnologii Umanitare al Universității de Stat din Moscova au fost printre primii care s-au angajat în testarea computerelor. Au fost dezvoltate tehnologii computerizate de testare la distanță în care funcțiile de testare educațională sau psihologică sunt distribuite între computerul local al utilizatorului („clientul”) și computerul central al dezvoltatorului („serverul”). Această nouă tehnologie a informației permite diseminarea rapidă și pe scară largă a testelor care îndeplinesc standardele științifice internaționale. În fiecare an în perioada sărbătorilor de primăvară se desfășoară Olimpiada de telecomunicații „Teletestare” pentru absolvenți ( #"justifica">). Pe site-ul de mai sus puteți exersa în mod interactiv realizarea unor sarcini (cu răspunsuri cu variante multiple) ale versiunilor de testare demonstrativă ani diferiti, inclusiv în engleză.

    Testarea computerului în limba engleză este, de asemenea, efectuată de diverse şcoli de limbi străine in Rusia. De exemplu, școlile de limbi străine BKC-International House ( #"justify">), Limba transparentă ( #"justify">) oferă teste pentru a determina nivelul de competență în limba engleză.

    Un sistem de control computerizat deschide oportunități largi de individualizare a procesului de învățare de către elevi. Principiul individualizării învățării stă la baza testării adaptive. Testarea adaptivă este un control care vă permite să ajustați dificultatea și numărul de sarcini prezentate fiecărui elev în funcție de răspunsul acestuia la sarcina anterioară: în cazul unui răspuns corect, elevul va primi o sarcină următoare mai dificilă, în cazul a unui răspuns incorect, sarcina este mai ușoară decât cea anterioară. Modul de testare adaptivă (și nu doar testarea, ci și antrenamentul) implică un set de sarcini sub formă de test, solicitând studentului să lucreze la limita capacităților sale și asigurând astfel efect maxim. Utilizarea sarcinilor care corespund nivelului de pregătire al elevului în testarea adaptivă crește acuratețea măsurătorilor și reduce timpul de testare individuală.

    Pe baza analizei rezultatelor testării adaptive, este posibil să se construiască procesul de învățare din perspectiva unei abordări orientate spre personalitate, adică selectarea sarcinilor educaționale la nivelul optim de dificultate pentru fiecare elev. Se știe că sarcinile ușoare nu contribuie la dezvoltare, iar cele dificile reduc motivația de învățare. Prin urmare, nivelul optim de dificultate 4 sarcinile în testologie sunt considerate 50%.

    Informatizarea educației și dezvoltarea teoriei măsurătorilor pedagogice fac posibilă crearea unui sistem de control al ratingului pentru o evaluare mai obiectivă și mai precisă a cunoștințelor, aptitudinilor și abilităților elevilor. O evaluare de evaluare a învățării face posibilă caracterizarea cu un grad ridicat de fiabilitate a calității pregătirii unui student la o anumită materie academică. „Rating” tradus din engleză este o evaluare, o anumită caracteristică numerică a unui concept calitativ. De obicei, un rating este înțeles ca un „scor cumulat” sau un scor care ia în considerare „preistorie”.

    Formarea modulară necesită o structurare strictă informatii educationale, conținutul pregătirii și organizarea muncii elevilor cu blocuri (module) educaționale complete, finalizate logic. Conținutul modulului coincide cu tema de studiu a disciplinei academice. De exemplu, un modul pentru studierea subiectului „Geografia Angliei și Americii”. Totuși, spre deosebire de subiectul din modul, totul este măsurat, totul este evaluat: finalizarea fiecărei sarcini, lucru la clasă, prezența la cursuri, nivelurile inițiale, intermediare și finale ale pregătirii elevilor. Modulul definește clar obiectivele de învățare, sarcinile și nivelurile de studiu ale acestui modul și denumește abilitățile și abilitățile.

    În timpul învățării modulare, studenții ar trebui să cunoască întotdeauna o listă de concepte de bază, abilități și abilități pentru fiecare modul specific, inclusiv o măsură cantitativă de evaluare a calității materialului de învățare. Pe baza acestei liste, întrebările și sarcinile de formare sunt întocmite, care acoperă toate tipurile de lucru pe modul, și supuse controlului după studierea modulului. De regulă, în tehnologie modulară antrenament, se folosește o formă de testare de control.

    Modulele de instruire și testele pot fi transferate cu ușurință într-un mediu de învățare bazat pe computer. Mulți instituțiile rusești Furnizorii de educație la distanță își construiesc curricula pe baza de module.

    În formarea modulară, fiecare sarcină este evaluată în puncte, ratingul și termenele limită sunt stabilite (finalizarea la timp a sarcinii este evaluată și prin numărul corespunzător de puncte), adică principiul principal al controlului evaluării este controlul și evaluarea calității cunoștințelor. , aptitudini și abilități, ținând cont de munca sistematică a elevilor .

    După finalizarea instruirii, se determină o notă generală pe baza evaluărilor modulului, care este luată în considerare la determinarea rezultatelor controlului final la materie.

    Deci, testarea computerului, împreună cu instruirea, este astăzi una dintre principalele metode ale noii tehnologii informaționale pentru evaluarea nivelului de cunoaștere a limbilor străine.

    Se încarcă...Se încarcă...