Tests sur les systèmes de contrôle adaptatifs. Le concept de test adaptatif et les principes de sa mise en œuvre. Le diagramme construit des cas d'utilisation pour le sous-système de tests adaptatifs se trouve à l'annexe A.

Un des axes prioritaires de développement Éducation russe sur scène moderne est d'assurer l'accessibilité et l'égalité des chances pour recevoir une éducation à part entière, ainsi que d'atteindre une qualité fondamentalement nouvelle des services éducatifs professionnels. De toute évidence, le principal moyen d’atteindre ces objectifs consiste à accroître le rôle et l’importance des technologies de l’information. La construction de systèmes d'enseignement intelligents constitue un grand pas vers le développement et l'accumulation de contenus pédagogiques électroniques, qui se composent aujourd'hui d'hypertextes, de matériels électroniques et de tests. Les principales exigences des nouveaux systèmes d'apprentissage sont les suivantes : intelligence, évolutivité, ouverture, flexibilité et adaptabilité à toutes les étapes du processus d'apprentissage.

Récemment, on a constaté une utilisation croissante de differentes etapes processus éducatif a reçu divers types de mécanismes de diagnostic électroniques (matériels) - tests informatiques. Malheureusement, les tests traditionnels, mis en œuvre à l'aide de tests standardisés, perdent progressivement de leur pertinence. Il se développe et évolue vers des formes intelligentes et modernes de tests adaptatifs. Formulaires intelligents les diagnostics de connaissances reposent sur des fondements théoriques et méthodologiques différents des fondements traditionnels et d'autres technologies de construction et de reproduction des tests. Le modèle de système doit inclure des modules qui implémentent des algorithmes adaptatifs.

Le principal avantage des tests adaptatifs par rapport à la forme traditionnelle est son efficacité évidente. Un test adaptatif vous permet de diagnostiquer le niveau de connaissances du candidat à l'aide d'un nombre nettement inférieur de questions. Lorsqu'ils interagissent avec le même test adaptatif, les candidats ayant un niveau de formation élevé et les candidats ayant un faible niveau de formation résoudront des sous-ensembles de tâches complètement différents. Le premier sujet verra un nombre significativement plus grand de questions avec un coefficient de difficulté élevé, et le second un faible. Le pourcentage de réponses correctes selon les matières peut être le même, mais le nombre de points varie considérablement.

Les tests adaptatifs vous permettent de construire plus précisément un modèle de connaissances (compétences maîtrisées) des candidats. Le système de test informatique s'adapte au niveau de l'utilisateur directement pendant le processus de test. Grâce à des mécanismes d'adaptation flexibles, le système peut déterminer quelle question et avec quel coefficient de difficulté présenter au sujet à chaque instant précis. Par exemple, un sujet commence à résoudre un ensemble de diagnostic et se voit présenter une tâche avec un coefficient de difficulté b, dont la solution teste les connaissances dans le cadre d'une petite unité didactique S. Si le sujet résout correctement la tâche qui lui est présentée, puis le noyau analytique du système sélectionne la tâche suivante au sein de la même unité S, mais avec un coefficient de complexité plus élevé, etc. Si le sujet répond incorrectement à la question initiale de l'élément didactique, alors il se voit proposer une tâche avec un coefficient de difficulté inférieur, etc. Les valeurs limites des coefficients de complexité sont décrites dans le modèle utilisé dans le diagnostic.

Un système de test adaptatif intelligent par ordinateur doit avoir l’ensemble de caractéristiques suivant :

Ouverture et extensibilité . Le système doit être construit sur une base modulaire. Une composition approximative des modules de base peut être la suivante : « Base », « Testeur », « Concepteur », « Configurateur », « Concepteur de rapports », « Module de planification », « Base » est destiné à maintenir une liste d'utilisateurs du copie installée du programme, préparation d'une liste de matières, gestion du répertoire des groupes de matières, configuration d'un espace spécial (décomposition en blocs thématiques). "Constructor" est destiné à travailler avec une base de données de tâches de test et à développer des packages de test. « Configurateur » est destiné à configurer les éléments de travail de test (connexion des tests, attribution de sessions de test). « Report Designer » est conçu pour traiter les protocoles de test primaires et créer divers rapports. Le « Module de planification » est conçu pour planifier et surveiller le processus de test. Le testeur implémente directement un mécanisme adaptatif de diagnostic du niveau de connaissance.

Non-linéarité de la reproduction du contenu diagnostique. Une sélection intelligente adaptative de la prochaine tâche de test doit être mise en œuvre en fonction des résultats de la résolution des précédentes.

Difficulté connue . Toutes les tâches de test doivent être divisées en catégories de difficulté et avoir un coefficient approprié qui peut être manipulé pendant le processus d'adaptation.

Universalité du modèle diagnostique. Le système permet de tester de manière complète et de haute qualité les connaissances d'un grand nombre de candidats sans dépense importante de temps et de ressources au sein d'unités didactiques de toute taille.

Fiabilité et précision des résultats des tests adaptatifs. Une approche est utilisée qui exclut complètement le facteur efficace lors de l’analyse du modèle individuel des connaissances du sujet.

Actuellement, un grand nombre de systèmes de tests informatiques ont été développés et mis en œuvre. De tels systèmes varient considérablement dans les paramètres de classification. Et maintenant, nous pouvons affirmer avec certitude que les systèmes de tests informatiques adaptatifs occupent activement leur niche sur le marché des logiciels pour organiser et soutenir les processus pédagogiques.


Bibliographie

  1. Nikiforov, O. Yu. Application d'un environnement de test informatique basé sur une base de données de tâches sous forme de test dans le système de contrôle qualité d'un établissement d'enseignement supérieur. / O.Yu. Nikiforov, Yu.I. Nicoare // Management de la qualité de la formation continue : Recueil d'articles du 2ème colloque scientifique et pratique interrégional // Responsable. éditeur E.Yu. Bakhtenko ; Ministère de l'Éducation et des Sciences de la Fédération de Russie ; Département. Éducation Volog. région; Vologda. État péd. univ. – Vologda : VSPU, 2011. – 192 p. , Avec. 72-79.
  2. Nikiforov, O. Yu. Analyse du sous-système de test MOODLE LMS // Technologies de l'information dans la science et l'éducation : Actes de la Conférence internationale scientifique et pratique sur Internet. – Mines : Maison d’édition YURGUES, 2008. – 238 p.
  3. Nikiforov, O. Yu. Modèle de composants généralisé d'un système de test informatique / O. Yu. Nikiforov // Éducation, science, entreprise : caractéristiques développement régional et intégration : Documents de la conférence scientifique et méthodologique panrusse. – Tcherepovets, – 2006. – p.309-311.
  4. Nikiforov, O. Yu. Les principaux éléments des tâches sous forme de test / O. Yu. Nikiforov // Éducation, science, entreprise : caractéristiques du développement et de l'intégration régionales : Documents de la conférence scientifique et méthodologique panrusse. – Tcherepovets, – 2006. – pp. 315-316.
  5. Nikiforov O.Yu., Koksharova E.I. Complexe de fonctionnalités pour la classification des systèmes de tests informatiques // Moderne Recherche scientifique et l'innovation. 2013. N°6
  6. Nikiforov, O. Yu. Signes de classification des systèmes de test informatique / O. Yu. Nikiforov // Éducation, science, entreprise : caractéristiques du développement et de l'intégration régionales : Documents de la conférence scientifique et méthodologique panrusse. – Tcherepovets, – 2006. – p.312-314.
Nombre de vues de la publication : S'il vous plaît, attendez 1

Selon le Concept de modernisation de l'éducation russe, on peut noter que les principaux efforts visant à mettre en œuvre la réforme se concentrent aujourd'hui sur l'augmentation du rôle des technologies de l'information. Ils sont utilisés de différentes manières : pour gérer le processus éducatif, pour l'enseignement direct, pour contrôler et vérifier l'assimilation et application pratique connaissances acquises par les stagiaires. À cette fin, on a récemment eu de plus en plus recours à differentes etapes la formation a reçu divers types d'enquêtes tests. Le champ d'application des tests est très large, depuis une courte enquête après une explication du sujet en cours jusqu'aux examens finaux, finaux ou d'entrée. En même temps, pour de nombreux les établissements d'enseignement question d'actualité est l'utilisation des technologies de l'information dans le développement de systèmes automatisés de formation et de contrôle des connaissances. Après tout, l'utilisation de ce type de système dans le processus éducatif permettra d'appliquer de nouveaux algorithmes adaptatifs de contrôle des tests, d'utiliser les capacités multimédias des ordinateurs dans les tâches de test, de réduire la quantité de paperasse et d'accélérer le processus de calcul des résultats de l'enquête. , simplifient l'administration et réduisent les coûts d'organisation et de réalisation des tests. En conclusion, on peut noter que les systèmes informatiques de contrôle des connaissances sont de plus en plus populaires, ce qui s'explique par leur objectivité, leur accessibilité et leur rentabilité.

Sur la base de ce qui précède, il a été décidé de développer un progiciel, un système universel de tests adaptatifs automatisés (ASAT), qui est un moyen de développer et de créer divers types de tests, et est également utilisé pour tester et traiter les résultats. La principale exigence du système développé était son intelligence, obtenue en organisant l'adaptabilité du processus de test.

Le progiciel ACAT offre les capacités suivantes pour organiser le processus de test :

Automatisation du processus de création de tests, processus de tests de haute qualité.

Ouverture et évolutivité du système.

L’absence de lien rigide avec un sujet.

Facilité de création et de modification de tests.

Offrir la possibilité de travail multi-utilisateurs. Accès personnalisé pour toutes les catégories d'utilisateurs.

Protection contre l'accès non autorisé aux tâches testées.

Développer des outils de navigation à tous les niveaux pendant le processus de test. Disponibilité d'un moyen de contrôle dynamique du processus de test de la part de l'enseignant.

Personnalisation (adaptation) du matériel de test aux caractéristiques individuelles de l'étudiant (étudiant, étudiant, spécialiste, etc.).

Sélection adaptative de la question suivante en fonction de l’exactitude des réponses précédentes de l’élève.

Remplir la base de données avec des tâches de test, vous permettant de travailler avec des informations de test textuelles, graphiques et dynamiques.

Possibilité de créer différentes tâches à partir d'un ensemble de questions.

Possibilité de tester des parties du cours et, par conséquent, de procéder à un examen final pour l'ensemble du cours.

Assurer un test complet et de haute qualité des connaissances d'un grand nombre de stagiaires (étudiants, élèves, spécialistes) sans dépense de temps ni de ressources matérielles particulières dans toutes les sections du processus éducatif.

Fiabilité, précision et objectivité des résultats des tests. Élimination d'une approche subjective d'évaluation des connaissances des étudiants.

Réduire la probabilité d'erreurs lors du calcul des résultats des tests et de la génération de la note finale.

Libérer les enseignants du travail fastidieux de traitement des résultats des tests.

Collecte et analyse rapides des résultats des tests à tout moment avec la possibilité de générer des rapports et des relevés périodiques pour diverses demandes.

Introduction de l'ASAT dans le processus d'apprentissage des étudiants de l'Université d'État de Surgut et dans les établissements d'enseignement de l'Okrug autonome Khanty-Mansi - Ugra.

Selon la méthode d'évaluation des résultats, les tests sont de deux types : traditionnels et adaptatifs. L’avantage d’un test adaptatif par rapport à un test traditionnel est son efficacité. Un test adaptatif peut déterminer le niveau de connaissances du candidat avec moins de questions. Lors de l'exécution du même test adaptatif, les candidats ayant un niveau de formation élevé et les candidats ayant un faible niveau de formation verront des ensembles de questions complètement différents : le premier verra plus grand nombre des questions difficiles et la dernière des questions faciles. Le pourcentage de réponses correctes pour les deux peut être le même, mais comme le premier a répondu à des questions plus complexes, il marquera plus de points. Un autre effet significatif est une augmentation de la fiabilité, puisque dans ce cas elle est éliminée apprentissage rapide banque de tâches en « cliquant » simplement sur les options de l'ordinateur (ainsi, vous ne pouvez apprendre que les tâches faciles, tandis que les tâches difficiles et certaines des tâches intermédiaires s'avèrent non étudiées).

Dans ce système de test, l'adaptabilité s'exprime par un changement dans les proportions relatives dans la présentation des tâches faciles, moyennes et difficiles, en fonction du nombre de réponses correctes enregistrées au cours de la session de test. Il convient de noter que le passage à technique adaptative n'est possible que grâce à l'accumulation d'une banque importante de tâches avec un niveau de difficulté mesuré empiriquement. L'adaptabilité est combinée au principe d'un « algorithme en échelle » - présentant des tâches avec une augmentation systématique du niveau de difficulté. Tout d'abord, des tâches faciles sont présentées, puis des tâches moyennes et, si le candidat réussit aux niveaux précédents, des tâches difficiles. Après chaque réponse, le programme de test détermine la validité du « transfert anticipé » du candidat à un niveau supérieur. haut niveau des difficultés. A chaque étape, l'importance des différences entre le nombre de réponses correctes et incorrectes est évaluée. Pour les valeurs inférieures au niveau d'erreur de 5 % (en rejetant l'hypothèse d'une probabilité égale d'apparition de réponses correctes et d'erreurs), le candidat est transféré à un niveau de difficulté supérieur. Si les tâches d'un niveau donné sont épuisées et que le candidat n'est pas passé au niveau de difficulté suivant, le processus de test se termine et le niveau de connaissances du candidat est déterminé.

Le système est implémenté sous la forme de trois modules indépendants :

module de test (destiné aux candidats);

module de création et d'édition de tests (destiné aux enseignants) ;

module de statistiques et d'analyse des résultats (destiné à l'enseignant), pouvant être installé indépendamment les uns des autres sur différentes machines clientes ;

Pour enregistrer les données initiales et les résultats des tests, une base de données est utilisée qui stocke une banque de tâches de test, les paramètres de configuration des tests et le processus de test, des informations pour l'authentification des utilisateurs, les résultats des tests et d'autres informations sur le traitement des données.

Le module de création et d'édition de tests identifie les enseignants inscrits ou enregistre de nouveaux enseignants, accède à la base de données qui stocke les tâches de test et les réponses pour chaque test, ainsi que ses paramètres, et permet à l'enseignant de créer un nouveau test, de modifier les paramètres d'un test existant. tester, modifier les questions et les réponses.

Il est à noter qu'un enseignant, s'étant connecté au système à l'aide de son identifiant et de son mot de passe, n'a accès qu'à sa propre série de tests, sans pouvoir visualiser ou modifier les tests d'un autre enseignant.

À l'aide de la base de données, le module de test identifie les utilisateurs enregistrés ou enregistre de nouveaux utilisateurs, sélectionne un test, teste le sujet en affichant une question à l'écran puis en recevant une réponse, traite les données reçues et écrit les résultats du test dans la base de données pour une analyse plus approfondie et utilisation par l'enseignant.

Les candidats ne peuvent accéder qu'à certains tests pré-attribués par l'instructeur. Dans ce cas, un algorithme adaptatif de contrôle des connaissances est utilisé, qui détermine le choix de la tâche suivante en fonction des réponses du candidat aux questions précédentes. Dans ce système, il n'y a pas d'option pour sauter une question et y revenir à la fin du test, cela est dû au fait qu'en fonction de la manière dont le candidat répond à la question actuelle, le choix de la prochaine question posée est déterminé. À la fin du test, le résultat du test et un bref commentaire sont affichés au candidat. Le résultat du test est le score que l'utilisateur reçoit sur la base des critères spécifiés par l'enseignant pour ce test.

Le module de statistiques et d'analyse des résultats des tests offre à l'enseignant la possibilité de visualiser les résultats des tests d'un élève individuel ou d'un groupe entier, pour un ou plusieurs tests avec différents degrés de détail. Dans ce cas, le rapport affiche les résultats de tous les étudiants pour tous les tests qu'ils ont passés liés à la matière sélectionnée d'un enseignant spécifique.

Les tests étant basés sur le principe d'adaptabilité, les questions, ainsi que leur nombre au sein d'un test, ne seront pas les mêmes pour chaque utilisateur. Par conséquent, ce module offre la possibilité de produire non seulement informations générales, mais aussi un rapport plus détaillé sur le test, qui contient des informations sur les questions reçues par l'utilisateur et comment il y a répondu.

Le système créé correspond exigences modernes exigences pour une classe de ce type de système, tant dans le domaine des tests pédagogiques que dans le domaine des technologies de l'information.

Lien bibliographique

Bushmeleva K.I. SYSTÈME DE TESTS ADAPTATIF AUTOMATISÉ // Recherche basique. – 2007. – N° 2. – P. 48-50 ;
URL : http://fundamental-research.ru/ru/article/view?id=2517 (date d'accès : 18/09/2019). Nous portons à votre connaissance les magazines édités par la maison d'édition "Académie des Sciences Naturelles"

Le contrôle des tests adaptatifs est compris comme un système informatisé de vérification et d'évaluation scientifiquement fondée des résultats d'apprentissage, qui est très efficace en raison de l'optimisation des procédures de génération, de présentation et d'évaluation des résultats de l'exécution des tests adaptatifs. L'efficacité des procédures de contrôle et d'évaluation augmente lors de l'utilisation d'une stratégie en plusieurs étapes pour sélectionner et présenter des tâches basées sur des algorithmes entièrement dépendants du contexte, dans laquelle l'étape suivante n'est effectuée qu'après avoir évalué les résultats de l'étape précédente. Une fois que le sujet a terminé la tâche suivante, il est à chaque fois nécessaire de prendre une décision sur la sélection de la difficulté de la tâche suivante, selon que la réponse précédente était correcte ou incorrecte. L'algorithme de sélection et de présentation des tâches est basé sur le principe du feedback, lorsque, si le sujet répond correctement, la tâche suivante est sélectionnée comme plus difficile, et une réponse incorrecte entraîne la présentation d'une tâche ultérieure plus facile que celle à laquelle le les sujets ont reçu une réponse incorrecte. Il est également possible de poser des questions complémentaires sur des sujets que l'étudiant ne maîtrise pas très bien afin de déterminer plus précisément le niveau de connaissances dans ces domaines. Ainsi, on peut dire que le modèle adaptatif rappelle un enseignant passant un examen : si l'élève répond aux questions posées avec confiance et correctement, l'enseignant lui donne rapidement une note positive. Si l'élève commence à « flotter », alors l'enseignant lui pose des questions complémentaires ou directrices du même niveau de complexité ou sur le même sujet. Et enfin, si l'élève répond mal dès le début, le professeur donne aussi assez vite une note, mais négative.

Avantages :

Permet une mesure plus flexible et plus précise des connaissances des stagiaires ;

Permet de mesurer les connaissances avec moins de tâches que dans le modèle classique ;

Identifie des sujets que l'élève connaît mal et lui permet de poser un certain nombre de questions supplémentaires à leur sujet.

Défauts:

On ne sait pas à l’avance combien de questions il faudra poser à l’étudiant pour déterminer son niveau de connaissances. Si les questions incluses dans le système de test ne suffisent pas, vous pouvez interrompre le test et évaluer le résultat en fonction du nombre de questions auxquelles l'étudiant a répondu ;

Ne peut être utilisé que sur un ordinateur.

Échelles classiques d’évaluation des connaissances et théorie de la réponse aux éléments.

Théorie classique des tests ( Théorie classique des tests - CTT ) créé à l’origine pour l’interprétation des procédures de diagnostic. Cette théorie a été créée pour des problèmes purement appliqués, c'est pourquoi certaines des hypothèses utilisées dans les fondements de cette théorie doivent être clarifiées, d'autant plus que ces fondements ne sont pratiquement pas discutés dans la littérature.

La théorie classique des tests suppose explicitement :

1. Unidimensionnalité, c'est-à-dire La procédure de test ne mesure qu’une seule qualité, préparation ou capacité.

2. La représentativité, dans le cadre du CTT, comprise comme l'indépendance de la probabilité d'une évaluation particulière à partir de laquelle un sous-groupe de la population générale effectuera le test.

3. Indépendance des tâches, c'est-à-dire les tâches sont indépendantes les unes des autres.

4. Indépendance des réponses des sujets testés.

Les deux indépendances mentionnées s’entendent au moins dans un sens statistique.

Étant donné que les procédures de diagnostic étaient dans la plupart des cas effectuées sous forme de tests et, dans la plupart des tests, sous forme de questions fermées ou, moins souvent, ouvertes, le résultat de chaque réponse était supposé être mesurable en points sur une certaine échelle.

En plus des hypothèses explicites, cette théorie contient des hypothèses implicites. En particulier, il est implicitement supposé :

- mesurabilité toutes les réponses possibles, c'est-à-dire l'existence d'une procédure efficace pour obtenir une réponse à toute question posée,

- exhaustivité réponses, c'est-à-dire recevoir des réponses à toutes les questions posées, d'où il résulte que les refus de réponse ne sont pas pris en compte,

- équivalence toutes les questions et, par conséquent, un poids égal de toutes les réponses reçues,

- égalité des variances lors de l'utilisation de formulaires de réponse parallèles,

- distribution normale réponses.

Comme dans le cas des mesures techniques, il est implicitement supposé que tout résultat de mesure est constitué de la valeur vraie et de l'erreur de mesure, et les erreurs de mesure sont supposées être additives, ce qui est nécessaire pour le passage correct des sommes d'erreurs à une intégrale. erreur, et l’erreur intégrale est également supposée être normalement distribuée.

L’exactitude de ces hypothèses n’est généralement pas discutée. Au contraire, les plus grandes questions concernant CTT concernent la garantie d’une véritable indépendance des tâches. La question du choix des échelles de notation n’est pas non plus abordée, l’hypothèse de départ étant que des « scores bruts » ont déjà été obtenus.

Une question plus subtile est liée à la signification métrologique de la catégorie « erreur ». Dans les mesures techniques, il est implicitement supposé que l'erreur et l'erreur qu'elle génère sont une propriété de la procédure de mesure et, par conséquent, l'erreur peut en principe être estimée et prise en compte sur la base des résultats de vérification et d'étalonnage. . Lors de la mesure d'éléments ergatiques, une autre source d'erreur apparaît - l'instabilité de ce qui est mesuré, qui résulte de l'action de divers facteurs, dont les plus importants sont l'apprentissage, l'oubli, la fatigue et la dynamique de l'état fonctionnel. Les corrections de ces facteurs ne sont pas discutées en métrologie.

Pour obtenir l'estimation finale, diverses procédures de calcul sont utilisées. Le plus souvent, le score moyen est calculé à l'aide de la formule de moyenne arithmétique habituelle, où est le score final je-ème sujet, et le carré de l'écart par rapport à la moyenne ou aux variantes de cet indicateur - écart type ou dispersion. Pour comparer les résultats, le coefficient de corrélation entre tâches et entre matières est utilisé.

En option, on utilise parfois une note moyenne pondérée de la forme où sont les coefficients de pondération correspondants.

De toutes les hypothèses énumérées ci-dessus, la plus difficile à prouver est l'équivalence des réponses, car cela nécessite la preuve de l'égalité subjective de toutes les difficultés des réponses correspondantes et en même temps la preuve de l'égale importance de toutes les questions posées. . L'hypothèse de la calculabilité des indicateurs statistiques mentionnés nécessite une preuve substantielle de l'exactitude de l'intégration homéomorphe de l'échelle de points dans l'échelle des nombres réels, dans laquelle de tels calculs sont effectivement effectués. En d’autres termes, les questions concernant la validité des critères et de la validité conceptuelle restent généralement ouvertes.

En plus des indicateurs statistiques standard susmentionnés (dont la question de l'exactitude mathématique n'est généralement pas discutée) pour les sujets, certaines propriétés psychométriques des procédures de mesure avec une signification mathématique claire mais pragmatique douteuse sont évaluées, par exemple :

Le facteur de facilité d'une tâche (ou un coefficient de difficulté similaire), où est la note moyenne obtenue pour la tâche, est la note maximale possible pour la même tâche, malgré le fait que la note minimale possible pour toute tâche est supposée être nulle. par défaut,

Le coefficient de discrimination des tâches, c'est-à-dire le coefficient de corrélation entre le résultat de la tâche et le résultat final, ou ce qui est considéré comme une option plus informative est le coefficient de corrélation entre le résultat de la tâche et le résultat final sans tenir compte de cette tâche,

et quelques autres coefficients dont l'interprétation dans cette science diffère de celle généralement acceptée.

En particulier, fiabilité ici, contrairement à la compréhension standard, la qualité est considérée non pas d'un système ou d'un objet, mais d'une mesure, et n'est pas évaluée en fonction du temps de fonctionnement correct ou d'éventuelles variantes de ce temps, par exemple en termes de temps entre les échecs, mais comme la possibilité d'obtenir des indicateurs comparables, évalués au moyen d'un coefficient de corrélation. De cette interprétation nous obtenons fiabilité constante, c'est-à-dire le coefficient de corrélation entre les résultats de l'exécution de deux tâches, dont la distance temporelle est suffisante pour que ces tâches soient considérées comme subjectivement indépendantes, une fiabilité parallèle, c'est-à-dire coefficient de corrélation entre les résultats des variantes de tâches, fiabilité des pièces, c'est-à-dire le coefficient de corrélation entre les résultats de l'ensemble de la procédure de mesure et de n'importe quelle partie de celle-ci, et d'autres indicateurs. En d'autres termes, la fiabilité cohérente dans cette science est appelée ce qui, dans la théorie de la mesure professionnelle, est considérée comme une mesure quantitative de la validité test-retest, la fiabilité parallèle et la fiabilité de forme sont une mesure de la validité test-subtest, et en général, il existe une confusion dans la terminologie. ce qui conduit à une confusion entre validité et fiabilité.

Selon une autre version, le coefficient de fiabilité est défini par , où est la variance des erreurs de mesure et est la variance des points marqués, c'est-à-dire que le temps n'est pas du tout mentionné dans cette définition du coefficient de fiabilité.

Le caractère douteux de tels calculs d'un point de vue mathématique est dû au fait que les données initiales ont été initialement obtenues sur une échelle de points, sur laquelle la relation d'ordre, voire l'ordre linéaire, est parfois précisée, mais les opérations arithmétiques ne sont pas définies . Par conséquent, l’addition et le calcul ultérieur des moyennes, des moyennes pondérées, des variances et des corrélations sur une échelle de scores ne sont pas définis. Une autre hypothèse, compréhensible d’un point de vue pragmatique, mais avec une justification théorique clairement inadéquate, revient à affirmer la distribution normale des réponses et, par conséquent, la distribution des « scores bruts » sur une échelle de nombres réels. L’hypothèse d’une distribution lognormale des mêmes scores semble souvent plus plausible, mais n’est généralement pas non plus étayée. Ces hypothèses permettent d'utiliser des méthodes bien connues pour le traitement statistique des résultats, mais l'exactitude mathématique de tous les calculs ultérieurs après cette hypothèse n'est pas discutée.

De nombreux problèmes de l'approche traditionnelle de construction d'échelles (métriques) de connaissances comme points pour accomplir certains ensembles de tâches spécialement sélectionnés sont largement discutés dans la littérature.

Tout d'abord, il est presque impossible de prouver la validité test à test et intertest, par conséquent, la question de la comparaison, et plus encore de la comptabilité générale des résultats de mesure effectués selon différentes méthodes, reste ouverte.

Des « effets de bord » ont été notés à plusieurs reprises, c'est-à-dire la stabilité relative des résultats plus proches de la médiane de la distribution des réponses et l'instabilité des résultats aux bords de cette distribution, ce qui s'explique généralement par le rôle croissant des facteurs étrangers à la fois dans les « effets de bord inférieurs ». » et les parties « supérieures » de la distribution. Pour lutter contre ces effets, une recommandation basée sur des données empiriques est généralement proposée pour définir un certain « quantile de confiance » de la distribution. Il est généralement proposé d'accepter, ou, si la réponse est inférieure ou supérieure, d'ajuster l'instabilité, principalement de surestimer la valeur obtenue. estimations à l’aide de formules de correction sélectionnées de manière empirique.

Dans le cas de questions fermées, des situations de devinettes aléatoires sont possibles ; pour corriger les données dans ce cas, il est proposé de faire des corrections de la forme , où est le résultat après correction, est le résultat (en points ou autres échelles) de la réponse à la ème question avant correction, est le nombre de réponses possibles à la ème question, w- le nombre de tâches non accomplies dans une série de mesures. Cette formule est justifiée empiriquement, notamment par la question de l'opportunité de prendre en compte dans cette formule les tâches non accomplies pour lesquelles la valeur correspondante est discutée, ce qui réduit la valeur, et il y a des discussions sur le sens substantiel de telles modifications.

En général, les mesures de qualité des connaissances dans l’approche classique sont justifiées par le calage statistique des méthodes pour la population correspondante. Depuis la création QI la justification métrologique des mesures des connaissances est réalisée sur la base des répartitions de points calculées pour le contingent correspondant de répondants. Par exemple, les valeurs moyennes sont indiquées QI par âge, groupes sociaux ou professionnels. Cependant, de la différence QI On ne sait pas clairement quelles différences fondamentales dans la structure des connaissances distinguent ces groupes.

Source:
  • http://cblis.utc.sk/cblis-cd-old/2003/3.PartB/Papers/Science_Ed/Testing-Assessment/Papanastasiou.pdf
  • annotation

    L’apprentissage assisté par ordinateur (TCC) peut avoir un grand potentiel lorsqu’il est utilisé de manière appropriée pour améliorer l’apprentissage. Cependant, cette qualité peut être améliorée grâce à l'utilisation de tests informatisés (CT) et, plus particulièrement, à l'utilisation de tests adaptatifs informatiques (CAT). Aux fins de ce travail, l'auteur décrit le mécanisme et les avantages des tests adaptatifs informatiques, ainsi que la manière dont ils peuvent améliorer le processus d'apprentissage dans le domaine scientifique. L'éducateur est encouragé à considérer certaines limites et défis de mise en œuvre, et l'enseignement scientifique sera également discuté. MOTS CLÉS Tests informatiques adaptatifs, CAT, tests informatiques, formation en informatique, enseignement des sciences naturelles, évaluation, rétroaction.

    INTRODUCTION

    L'apprentissage par ordinateur présente un potentiel extrêmement important pour améliorer l'apprentissage dans de nombreux domaines et disciplines, y compris le domaine scientifique. Cependant, la formation informatisée doit être surveillée de près et en permanence pour garantir son efficacité. Cela est d’autant plus vrai que certaines recherches antérieures ont montré que l’utilisation d’un ordinateur est négativement corrélée aux résultats en mathématiques et en sciences (Papanastasiou et Ferdig, 2003). Même s'il n'est pas clair dans quelles circonstances ces Conséquences négativesévoluent, et s’il existe une relation de cause à effet entre ces variables, pourquoi existe-t-elle toujours. Cette relation doit donc rappeler à l'éducateur que l'utilisation d'un ordinateur n'est pas nécessairement une « panacée » et qu'il ne doit pas être utilisé de manière irresponsable et occuper l'attention des élèves qui ont du mal à s'en servir. En outre, cette relation négative entre l’utilisation de l’ordinateur et la réussite devrait rappeler aux enseignants qu’il existe un besoin important d’une évaluation continue, constructive et sommative en sciences. Grâce à une évaluation appropriée, les problèmes qui surviennent au cours de l’apprentissage peuvent être identifiés et éventuellement corrigés s’ils sont détectés suffisamment tôt. Toutefois, l’évaluation doit également être utilisée à bon escient, de manière à pouvoir compléter le processus d’apprentissage. Puisque l’apprentissage par ordinateur est au centre de cette conférence, cet article portera sur l’évaluation par ordinateur. Le but de cet article est d'aller au-delà de la simple formation sur ordinateur pour décrire les tests adaptatifs par ordinateur et discuter de ses implications, de ses avantages et de la manière dont ils peuvent compléter efficacement la formation sur ordinateur dans ce domaine scientifique.

    Description

    Les tests assistés par ordinateur (CT) peuvent être définis comme tout type d’évaluation effectuée via un ordinateur. Cependant, les tests informatiques peuvent prendre diverses formes, en fonction du degré d'adaptation du test (College Board, 2000). Par exemple, certains tests informatisés, également appelés tests informatisés fixes, sont purement linéaires (Parshall, Spray, Kalohn et Davey, 2002). Ce sont les tests qui ressemblent le plus aux tests sur papier et crayon dans la mesure où ils ont une forme et une longueur fixes et que les éléments de test sont prédéfinis dans un ordre spécifique. Contrairement aux tests informatisés fixes, les tests adaptatifs informatiques (CAT) sont des tests informatiques qui ont le degré maximum d'adaptabilité, car ils peuvent être adaptés à chaque élève en fonction de la difficulté globale et de l'ordre dans lequel les questions sont présentées au candidat. Les tests informatiques adaptatifs (CAT) sont donc des tests informatiques créés et adaptés spécifiquement pour chaque candidat sur la base d'une évaluation de ses capacités et des réponses des étapes précédentes.

    Avantages des tests adaptatifs informatiques

    Les principaux avantages des tests adaptatifs informatiques sont liés au fait qu’ils sont efficaces en termes de temps ainsi que de ressources utilisées. Ces avantages seront discutés dans la section suivante du point de vue des candidats au test, du point de vue de l'enseignant qui souhaite déterminer le niveau de connaissances de l'élève, ainsi que du point de vue du développeur du test.

    Efficacité

    Les tests adaptatifs permettent d'évaluer les capacités d'un sujet avec plus de précision et à moindre coût que les tests papier. Des tests papier typiques sont créés pour les tests de masse, de sorte que le test soit administré à un grand groupe d'étudiants de capacités diverses. Pour ce faire, la plupart des questions de ce test sont de niveau de difficulté moyen (puisque la plupart des étudiants ont des résultats académiques moyens). Par conséquent, le contenu du test de ce type crée des problèmes pour les étudiants ayant des résultats élevés et faibles. Un candidat ayant un faible niveau de connaissances est capable de répondre aux premières questions relativement simples. Et les questions de niveaux de difficulté moyen et élevé ne seront pas faciles à répondre pour un étudiant. Par conséquent, le candidat peut finir par deviner les réponses à ces questions, ou simplement les laisser vides. Dans ce cas, il est difficile d'évaluer réellement ses connaissances et ses capacités, puisque toute conclusion doit être basée uniquement sur les réponses aux premières questions que l'étudiant a pu comprendre. Un autre, plus exemple spécifique Cette situation est donnée ci-dessous. L'enseignant souhaite réaliser un test de biologie sur le thème « Foie ». Question niveau faible nécessite d'identifier l'emplacement du foie sur des photos d'une personne, et les questions de haut niveau nécessitent que l'étudiant soit capable de diagnostiquer une maladie du foie à partir de photos. Dans ce cas, si un étudiant ne peut même pas localiser le foie sur une image du corps humain, il n’y a aucune raison de lui poser une question plus difficile. Si l’on considère ces tests du point de vue d’un étudiant ayant une connaissance approfondie de la biologie, la situation est un peu meilleure, même si elle n’est pas encore parfaite. La plupart des questions seront trop faciles pour cette personne. Les tests adaptatifs vous permettent de sélectionner efficacement des questions spécifiquement conçues pour un certain niveau de connaissances de chaque candidat. Lorsque toutes les questions visent clairement les capacités de chaque élève, l'enseignant peut tirer des conclusions plus fiables et plus valables sur les connaissances réelles de l'élève.

    Retour

    Un autre avantage des tests informatisés en général, ainsi que des tests adaptatifs par ordinateur, est qu'ils peuvent manipuler la rétroaction directe et immédiate de l'élève à l'enseignant (Wise et Plake, 1990). Avec un test papier typique, il y a toujours un délai entre l’enseignant et le candidat. Sans procéder à une évaluation, les enseignants ne seront pas en mesure de déterminer si l’enseignement sur ordinateur est réellement destiné à aider un élève à apprendre ou non. Ceci est particulièrement important car sans évaluation appropriée, certains étudiants peuvent se trouver désavantagés par rapport à la formation en informatique. En plus de évaluation globale, ce type d'évaluation montre comment chaque étudiant a maîtrisé la matière dans son ensemble ; il est également possible de fournir une liste de domaines et de matières dans lesquels chaque étudiant avait des questions, en fonction de ses performances aux tests adaptatifs. Cependant, l'enseignant peut se poser une telle question, avec des tests continus, il est possible que certains élèves se souviennent des questions du test et en informent les autres élèves. Cependant, si un test adaptatif contient un ensemble de questions relativement important, ce problème ne se posera pas, d'autant plus que différents élèves devraient se voir attribuer des éléments différents en fonction de leurs niveaux de capacités individuels.

    Temps

    Du point de vue du développeur de tests, la création d'un test adaptatif prend du temps, mais est plus efficace du point de vue de l'enseignant. En particulier, les étudiants lors des tests adaptatifs doivent répondre à moins de questions que lors des tests réguliers. De plus, des tests réguliers sont généralement effectués par l'ensemble du groupe pendant un certain temps, ce qui peut ne pas convenir à certains étudiants. L'enseignant et l'ensemble du groupe doivent attendre que tous les élèves aient terminé le test avant de pouvoir passer à une autre activité. Avec les tests informatiques adaptatifs, les étudiants peuvent passer l'examen quand ils sont prêts, la seule condition est que l'ordinateur soit disponible, et ils n'ont pas à attendre que tout le groupe soit prêt à passer le test ou que tout le groupe l'ait terminé. . Du point de vue de l'enseignant, les tests adaptatifs permettent de gagner du temps et l'enseignant n'a plus à se soucier de créer des tests pour le groupe tant que le CAT est capable de couvrir la matière couverte. De plus, l'enseignant gagne du temps sur la vérification des copies, puisque le test est noté par un ordinateur.

    Autres bénéfices

    Les tests informatiques adaptatifs présentent également des avantages supplémentaires. Les tests informatiques adaptatifs ont un haut niveau de sécurité, car la liste des questions ne peut plus être volée et la tricherie des voisins n'est pas rentable, car la plupart des questions du test sont individuelles pour chacun. De plus, d'autres types de données peuvent être collectées à l'aide de CAT, telles que le temps nécessaire pour répondre à chaque question ou le nombre de modifications apportées aux étudiants pendant le test.

    CONCLUSION

    Recherche moderne dans le domaine des tests et de l'évaluation ont montré que le potentiel des tests informatiques adaptatifs a augmenté. Les avantages et les capacités des tests adaptatifs informatiques permettent d’aller encore plus loin. Cela est évident dans le nombre de tests à grande échelle (par exemple GRE, TOEFL, ASVAB) qui sont devenus ou sont en train de devenir adaptatifs (Papanastasiou, 2001). Cependant, une telle démarche doit toujours être prise avec sagesse afin qu'une telle procédure d'évaluation soit bien intégrée au processus d'apprentissage pour garantir son efficacité maximale.

    Liens

    1. Bennett, RE (1999). Utiliser les nouvelles technologies pour améliorer l’évaluation. RR99-6. Princeton, NJ : Service de tests pédagogiques. 2. Lord, F.M. (1980). Applications de la théorie des réponses aux éléments à des problèmes de tests pratiques. Hillsdale, NJ : Lawrence Erlbaum associés. 3. Meijer, RR et Nerling, ML (1999). Tests adaptatifs informatisés : aperçu et introduction. Mesure psychologique appliquée, 23(3), 187-194. 4. O'Neill, K. (1995). Performance des candidats handicapés aux tests de compétences académiques sur ordinateur. Article présenté à l'American Educational Research Association, San Francisco, avril 1995. 5. Papanastasiou, E. C. (2001). Une « procédure de réarrangement » pour administrer des tests adaptatifs lorsque les options de révision sont autorisées. (Thèse de doctorat, Michigan State University, 2001). 6. Papanastasiou, E. (2002a). Une « procédure de réorganisation » pour la notation des tests adaptatifs avec des options de révision. Article présenté au National Council of Measurement in Education, La Nouvelle-Orléans, LA. 7. Papanastasiou, E. (2002b). Facteurs qui différencient les étudiants en mathématiques à Chypre, à Hong Kong et aux États-Unis. Recherche et évaluation en éducation, 8(1), 129-146. 8. Papanastasiou, E.C. et Ferdig, R.E. (janvier 2003). Utilisation de l'ordinateur et culture mathématique. Une analyse des relations existantes et potentielles. Article présenté à la troisième conférence méditerranéenne sur l'enseignement des mathématiques, Athènes, Grèce, 3-5 janvier 2003. 9. Parshall, C. G., Spray, J. A., Kalohn, J. C. & Davey, T. (2002). Considérations pratiques dans les tests informatisés. New York : Springer. 10. Parshall, C.G., Stewart, R. et Ritter, J. (1996). Innovations : graphiques, sons et modes de réponse alternatifs. Document présenté au National Council of Measurement in Education, 9-11 avril 1996, New York. 11. Le Conseil du Collège. (2000, avril). Un aperçu des tests informatisés. RN-09. 12. Wainer, H. (2000). CHATS : Où et quand. Psicologica, 21(1-2), 121-133. 13. Wise, SL et Plake, BS (1990). Tests informatisés dans l'enseignement supérieur. Mesure et évaluation en conseil et développement, 23, 3-10.

    Elena C. Papanastasiou, Ph.D. Département d'éducation de l'Université du Kansas et de l'Université de Chypre Box 20537 1678 Nicosie Chypre

    L'un des domaines activement développés et prometteurs des méthodes modernes d'enseignement des langues étrangères est l'utilisation des technologies informatiques pour contrôler le niveau de développement des compétences et des capacités de la parole.

    Les tests informatiques permettent d'intégrer des informations textuelles, graphiques, audio et vidéo dans les tâches de test, ainsi que d'automatiser entièrement le processus de réalisation des mesures de contrôle.

    Les tests informatiques vous permettent de :

    traiter rapidement les informations saisies ;

    assurer le fonctionnement retour, qui permet au sujet du test de recevoir constamment et immédiatement un renforcement de l'exactitude de la réponse, et à l'enseignant d'effectuer un contrôle étape par étape ou opérationnel des actions du candidat ;

    augmenter la motivation du candidat, car lorsque l'on travaille avec un programme informatique, il existe un élément d'inhabitualité, semblable à une situation de jeu, un esprit de compétition avec l'ordinateur apparaît ;

    économiser considérablement du temps et des coûts sur l’organisation et la réalisation des tests.

    Ainsi, la première tâche qu'un ordinateur peut résoudre efficacement est de stocker des tâches de test et de créer des tests à partir d'elles, à savoir traiter le matériel principal et original de l'auteur, y apporter les clarifications, corrections et ajouts nécessaires ; stocker des informations, sélectionner des tâches dans une banque de données électronique selon des critères spécifiés et produire la présentation requise des tests.

    La deuxième tâche mise en œuvre par l'ordinateur consiste à enregistrer les candidats et à les préparer à accomplir des tâches. Par exemple, l'inscription, qui peut être un pré-test ou juste avant le test, consiste à remplir une carte d'enregistrement sur un écran d'ordinateur. Après avoir reçu les informations nécessaires, le système donne au candidat un numéro d'identification.

    L'ordinateur peut préparer le candidat à passer le test - fournir des instructions. Le programme informatique comprend des informations sur la méthodologie de travail avec le test : des recommandations sur la technologie pour réaliser le test, des données sur la durée du test, la procédure d'évaluation, etc. La préparation au test peut également inclure une formation expliquant comment réagir à certaines tâches , éviter les erreurs aléatoires (non liées à la compétence linguistique et vocale du candidat), pour développer les stéréotypes temporaires nécessaires.

    L'étape suivante consiste à effectuer une session de test à l'aide d'un ordinateur. Le problème clé de cette étape est la durée des travaux. Par conséquent, il est important d'inclure dans le programme informatique de test l'affichage, la comptabilité et le contrôle du temps alloué, passé et restant du sujet de test.

    Pour commencer à travailler, le candidat doit indiquer son numéro d'identification, c'est-à-dire le numéro reçu lors de l'inscription. Après cela, on lui présente un test avec des tâches et des instructions pour les accomplir.

    La réalisation d'une séance de test peut être soit volontaire (à la demande du candidat et avec l'autorisation de l'instructeur, au fur et à mesure que les tâches sont accomplies), soit forcée (à la fin du délai imparti).

    Si les auteurs-compilateurs du test n'ont pas spécifiquement classé les tâches de test par degré de difficulté, n'ont pas divisé le test en sections de sous-tests autonomes en termes d'objectifs de performance et de types d'activité vocale, il est alors permis d'effectuer le test. dans n'importe quel ordre. Dans le cas contraire, sauter certaines tâches, par exemple celles qui semblaient difficiles, et y revenir sont interdits par le programme informatique.

    Après avoir terminé les tâches du test, l'étape de traitement des réponses et de notation commence. Selon la classification de V. I. Nardyuzhev, I. V. Nardyuzhev, le traitement peut être :

    local, effectué sur le site de test ;

    à distance, réalisé en dehors du lieu des séances de tests ;

    formel, si une simple comparaison avec des clés est possible ;

    expert, si une telle comparaison est impossible et que l'intervention d'experts et de spécialistes est requise (par exemple, pour évaluer une réponse orale ou écrite détaillée) ;

    opérationnel, permettant de démontrer les résultats immédiatement après les tests ;

    reporté en raison d'un algorithme complexe de calcul des points ou de la nécessité d'obtenir l'avis d'un évaluateur ou d'un expert.

    L'utilisation d'un ordinateur permet d'effectuer une analyse statistique des informations, c'est-à-dire, d'une part, de fournir des informations sur les participants au test, d'autre part - ce qui est le plus important au stade actuel de développement des tests linguistiques - de collecter des données sur la qualité de matériel d’essai.

    Dans le premier cas, l'algorithme d'analyse suppose :

    )sélection de l'objet de l'analyse statistique (sous-test) ;

    ) détermination du nombre de participants aux tests à un niveau donné ;

    )classer les candidats en fonction du nombre de points obtenus ;

    ) détermination du pourcentage de réponses correctes à chaque tâche de test ;

    )construction de graphiques à partir de données numériques ;

    )si nécessaire, comparaison des résultats des tests pour différents objets.

    Dans le deuxième cas, l'analyse statistique est réalisée à travers :

    ) détermination de la valeur minimale, moyenne et maximale des résultats des tests ;

    )établir les paramètres statistiques de la tâche : niveau de difficulté, capacité de différenciation (capacité de la tâche à distinguer les élèves forts des élèves faibles) ;

    )analyse du travail des distractions, notamment détermination de la fréquence de choix des réponses par chacun, ainsi que faibles et fortes ;

    ) détermination de l'indépendance des tâches dans le test.

    Les tests informatiques sont possibles avec un logiciel spécialement développé qui met en œuvre le modèle de test informationnel et pédagogique proposé par les auteurs.

    Les logiciels informatiques influencent de manière significative à la fois le contenu des tâches de test (par exemple, l'utilisation du son nécessite d'équiper l'ordinateur d'une carte son) et la méthode de mise en œuvre du modèle informationnel et pédagogique (par exemple, la connexion des ordinateurs à Internet permet d'organiser et effectuer des tests en temps réel).

    Programmes informatiques pour les tests une langue étrangère peuvent être classés en fonction de la méthode de programmation. Le programme peut être linéaire : dans ce cas, la seule chose fournie est orientation possible travailler avec le test, quelle que soit la qualité de la réponse des étudiants à une question ou une tâche spécifique. Par exemple, le candidat doit choisir l'une des options de réponse lorsqu'il effectue des tâches pour tester sa compréhension écrite :

    Un programme linéaire peut être compliqué par une étape d'ajustement (par exemple, lors de l'exécution de tâches visant à tester les compétences grammaticales). Dans ce cas, si la réponse est incorrecte, l'ordinateur renvoie le candidat à la tâche, à l'instruction ou à la règle d'origine.

    Le programme ramifié fournit des explications, des questions d'orientation supplémentaires et des instructions pour aider à accomplir les tâches initiales et à obtenir l'autorisation de mouvement séquentiel ou de mouvement à travers le cadre.

    Les programmes qui combinent des sections linéaires et ramifiées sont classés comme mixtes ou combinés. Ils offrent une plus grande flexibilité de contrôle et adaptent le travail aux capacités individuelles des étudiants. Dans le même temps, les tests informatiques dans une langue étrangère ont leurs propres spécificités et leurs propres exigences pour la présentation du matériel contrôlé et pour l'accomplissement des tâches. L'une des tâches principales est d'utiliser au maximum tous les canaux de présentation de l'information, en utilisant les technologies multimédias (graphiques, clips d'animation, images vidéo), ainsi que divers liens vers des documents et des ressources (ouvrages de référence, minimums lexicaux, contours d'intonation, etc. .). À son tour, l'utilisation de la visualisation didactique informatique, simulant des situations de communication et organisant l'exécution des tâches et la correction des réponses, augmente la productivité du suivi des programmes informatiques et la motivation des candidats à maîtriser une langue étrangère.

    Capacités de tests informatiques

    Aujourd'hui dans le monde il y a diverses organisations, engagé non seulement dans le développement de problèmes, mais également dans les systèmes de test informatique. Parmi eux se trouve l'Educational Testing Service (ETS) - Educational Testing Service ( #"justify">), qui s'occupe depuis 1970 des problématiques et des offres de tests informatiques ce moment versions informatiques du TOEFL ( #"justify">) - Test d'anglais comme langue étrangère. Ce test par langue anglaise en tant que langue étrangère, il est utilisé pour l'admission dans les collèges aux États-Unis et au Canada.

    En France, le Centre national d'enseignement à distance propose une version informatique du test en anglais langue étrangère : Test FLE - Test de Français langue étrangère et seconde - niveau général (élémentaire, intermédiaire, avancé) : compréhension écrite, grammaire, vocabulaire , compréhension orale ( #"justifier">). Le test vous permet de déterminer votre niveau de maîtrise de l’anglais comme langue étrangère. L'école d'anglais "L'École des Trois Ponts" propose également des tests interactifs de maîtrise de l'anglais général ( #"justifier">).

    En Russie, les employés du Département des technologies humanitaires de l’Université d’État de Moscou ont été parmi les premiers à procéder à des tests informatiques. Des technologies de tests informatisés à distance ont été développées dans lesquelles les fonctions de tests éducatifs ou psychologiques sont réparties entre l'ordinateur local de l'utilisateur (le « client ») et l'ordinateur central du développeur (le « serveur »). Cette nouvelle technologie de l’information permet une diffusion rapide et généralisée de tests répondant aux normes scientifiques internationales. Chaque année pendant les vacances de printemps, l'Olympiade des télécommunications « Télétest » est organisée pour les diplômés ( #"justifier">). Sur le site ci-dessus, vous pouvez vous entraîner de manière interactive à effectuer certaines tâches (avec réponses à choix multiples) des versions de test de démonstration. années différentes, y compris en anglais.

    Des tests informatiques en anglais sont également effectués par divers écoles de langues en Russie. Par exemple, les écoles de langues BKC-International House ( #"justify">), Langage Transparent ( #"justify">) proposent des tests pour déterminer le niveau de maîtrise de la langue anglaise.

    Un système de contrôle informatisé ouvre de larges possibilités pour individualiser le processus d'apprentissage des étudiants. Le principe d'individualisation de l'apprentissage sous-tend les tests adaptatifs. Le test adaptatif est un contrôle qui permet d'ajuster la difficulté et le nombre de tâches présentées à chaque élève en fonction de sa réponse à la tâche précédente : en cas de réponse correcte, l'étudiant recevra une tâche suivante plus difficile, dans le cas d'une réponse incorrecte, la tâche est plus facile que la précédente. Le mode test adaptatif (et pas seulement test, mais aussi formation) implique un ensemble de tâches sous forme de test, obligeant l'étudiant à travailler jusqu'à la limite de ses capacités et assurant ainsi effet maximal. L’utilisation de tâches correspondant au niveau de préparation de l’étudiant aux tests adaptatifs augmente la précision des mesures et réduit la durée des tests individuels.

    Sur la base de l'analyse des résultats des tests adaptatifs, il est possible de construire le processus d'apprentissage dans la perspective d'une approche axée sur la personnalité, c'est-à-dire de sélectionner des tâches pédagogiques au niveau de difficulté optimal pour chaque élève. On sait que les tâches faciles ne contribuent pas au développement et que les tâches difficiles réduisent la motivation à apprendre. Par conséquent, le niveau de difficulté optimal 4 les tâches en testologie sont considérées à 50%.

    L'informatisation de l'éducation et le développement de la théorie des mesures pédagogiques permettent de créer un système de contrôle de notation pour une évaluation plus objective et précise des connaissances, des compétences et des capacités des étudiants. Une évaluation cotation des apprentissages permet de caractériser avec un haut degré de fiabilité la qualité de la préparation d’un étudiant dans une matière académique donnée. "Rating" traduit de l'anglais est une évaluation, une certaine caractéristique numérique d'un concept qualitatif. Typiquement, une notation s'entend comme un « score cumulatif » ou un score qui prend en compte la « préhistoire ».

    La formation modulaire nécessite une structuration stricte informations pédagogiques, contenu de la formation et organisation du travail des étudiants avec des blocs pédagogiques (modules) complets et logiquement complétés. Le contenu du module coïncide avec le sujet d'étude de la matière académique. Par exemple, un module pour étudier le thème « Géographie de l'Angleterre et de l'Amérique ». Cependant, contrairement au sujet du module, tout est mesuré, tout est évalué : la réalisation de chaque tâche, le travail en classe, l'assiduité aux cours, les niveaux débutant, intermédiaire et final de préparation des étudiants. Le module définit clairement les objectifs d'apprentissage, les tâches et les niveaux d'étude de ce module, et nomme les compétences et aptitudes.

    Au cours de l'apprentissage modulaire, les étudiants doivent toujours connaître une liste de concepts, de compétences et d'aptitudes de base pour chaque module spécifique, y compris une mesure quantitative d'évaluation de la qualité du matériel d'apprentissage. A partir de cette liste, des questions et des missions de formation sont élaborées, couvrant tous les types de travaux sur le module, et soumises au contrôle après étude du module. En règle générale, dans technologie modulaire formation, une forme de test de contrôle est utilisée.

    Les modules de formation et les tests peuvent être facilement transférés vers un environnement d’apprentissage informatisé. Beaucoup Institutions russes Les prestataires d'enseignement à distance construisent leurs programmes sur la base de modules.

    Dans la formation modulaire, chaque tâche est évaluée en points, sa notation et ses délais sont établis (l'achèvement dans les délais de la tâche est également évalué par le nombre de points correspondant), c'est-à-dire le principe principal du contrôle de notation est le contrôle et l'évaluation de la qualité des connaissances , compétences et aptitudes, en tenant compte du travail systématique des étudiants .

    À l'issue de la formation, une note globale est déterminée sur la base des évaluations des modules, qui est prise en compte lors de la détermination des résultats du contrôle final dans la matière.

    Ainsi, les tests informatiques, avec la formation, sont aujourd'hui l'une des principales méthodes des nouvelles technologies de l'information pour évaluer le niveau de maîtrise des langues étrangères.

    Chargement...Chargement...