Αξιοπιστία και εγκυρότητα του τεστ - τι είναι; α) σε περιγραφικές στατιστικές

Προτού μπορέσουν να χρησιμοποιηθούν οι ψυχοδιαγνωστικές τεχνικές για πρακτικούς σκοπούς, πρέπει να δοκιμαστούν σε σχέση με μια σειρά τυπικών κριτηρίων που αποδεικνύουν την υψηλή ποιότητα και την αποτελεσματικότητά τους. Τα κύρια κριτήρια για την αξιολόγηση των ψυχοδιαγνωστικών τεχνικών περιλαμβάνουν την αξιοπιστία και την εγκυρότητα. Στην ανάπτυξη αυτών των εννοιών συνέβαλαν πολύ ξένοι ψυχολόγοι (Α. Αναστάση, Ε. Γκισέλι, Τζ. Γκίλφορντ, Λ. Κρόνμπαχ, Ρ. Θόρνταϊκ, Ε. Χάγκεν κ.ά.). Ανέπτυξαν μια επίσημη λογική και μαθηματική-στατιστική συσκευή (κυρίως τη μέθοδο συσχέτισης και την πραγματολογική ανάλυση) για να τεκμηριώσουν τον βαθμό συμμόρφωσης των μεθόδων με τα αναφερόμενα κριτήρια.

Στην παραδοσιακή δοκιμή, ο όρος "αξιοπιστία"σημαίνει σχετική σταθερότητα, σταθερότητα, συνέπεια των αποτελεσμάτων των δοκιμών κατά την αρχική και επαναλαμβανόμενη χρήση στα ίδια θέματα.

Αξιοπιστία της τεχνικής- αυτό είναι ένα κριτήριο που υποδεικνύει την ακρίβεια των ψυχολογικών μετρήσεων, δηλαδή επιτρέπει σε κάποιον να κρίνει πόσο αξιόπιστα είναι τα αποτελέσματα που λαμβάνονται.

Αυτή είναι η συνέπεια των αποτελεσμάτων των δοκιμών θεμάτων σε διαφορετικά χρονικά σημεία, κατά τη διάρκεια της πρωτοβάθμιας και δευτεροβάθμιας δοκιμής και τη χρήση εργασιών που διαφέρουν ως προς την ισοδυναμία και το περιεχόμενο. Η αξιοπιστία χαρακτηρίζει δοκιμές ιδιοτήτων, αλλά όχι καταστάσεις. Ιδιότητες:

Αναπαραγωγιμότητα των αποτελεσμάτων της έρευνας.
Ακρίβεια μέτρησης.
Βιωσιμότητα των αποτελεσμάτων.

Ο βαθμός αξιοπιστίας των μεθόδων εξαρτάται από πολλούς λόγους. Αναμεταξύ αρνητικών παραγόντωντα πιο συχνά αναφερόμενα είναι τα ακόλουθα:

αστάθεια της διαγνωσμένης ιδιοκτησίας.
ατέλεια των διαγνωστικών μεθόδων (οι οδηγίες συντάσσονται απρόσεκτα, οι εργασίες είναι ετερογενείς στη φύση, οι οδηγίες για την παρουσίαση της μεθόδου στα υποκείμενα δεν είναι σαφώς διατυπωμένες κ.λπ.)
μεταβαλλόμενη κατάσταση εξέτασης (διαφορετικές ώρες της ημέρας κατά τη διεξαγωγή πειραμάτων, διαφορετικός φωτισμός δωματίου, παρουσία ή απουσία εξωτερικού θορύβου κ.λπ.)
διαφορές στη συμπεριφορά του πειραματιστή (από πείραμα σε πείραμα παρουσιάζει διαφορετικά οδηγίες, διεγείρει την ολοκλήρωση των εργασιών διαφορετικά κ.λπ.)
διακυμάνσεις στη λειτουργική κατάσταση του θέματος (σε ένα πείραμα υπάρχει καλή υγεία, σε άλλο - κόπωση κ.λπ.).
στοιχεία υποκειμενικότητας στις μεθόδους αξιολόγησης και ερμηνείας των αποτελεσμάτων (όταν καταγράφονται οι απαντήσεις των υποκειμένων της δοκιμής, οι απαντήσεις αξιολογούνται ανάλογα με τον βαθμό πληρότητας, πρωτοτυπίας κ.λπ.).

Ένα από τα πιο σημαντικά μέσα για την αύξηση της αξιοπιστίας της μεθοδολογίας είναι η ομοιομορφία της διαδικασίας εξέτασης, η αυστηρή ρύθμισή της: το ίδιο περιβάλλον, ο ίδιος τύπος οδηγιών, οι ίδιοι χρονικοί περιορισμοί για όλους, οι μέθοδοι και τα χαρακτηριστικά επαφής με τα θέματα, και ούτω καθεξής.

Τα χαρακτηριστικά της αξιοπιστίας των μεθόδων επηρεάζονται σε μεγάλο βαθμό από το υπό μελέτη δείγμα. Μπορεί είτε να μειώσει είτε να υπερεκτιμήσει αυτόν τον δείκτη· για παράδειγμα, η αξιοπιστία μπορεί να διογκωθεί τεχνητά εάν υπάρχει μια μικρή διασπορά των αποτελεσμάτων στο δείγμα, π.χ. εάν τα αποτελέσματα είναι κοντά σε αξία μεταξύ τους. Επομένως, το εγχειρίδιο συνήθως περιγράφει το δείγμα στο οποίο προσδιορίστηκε η αξιοπιστία της τεχνικής.

Επί του παρόντος, η αξιοπιστία καθορίζεται όλο και περισσότερο στα πιο ομοιογενή δείγματα, δηλ. σε δείγματα παρόμοια σε φύλο, ηλικία, επίπεδο εκπαίδευσης, επαγγελματική κατάρτιση κ.λπ.

Υπάρχουν τόσες ποικιλίες αξιοπιστίας της μεθόδου όσες και οι συνθήκες που επηρεάζουν τα αποτελέσματα των διαγνωστικών εξετάσεων. Δεδομένου ότι όλοι οι τύποι αξιοπιστίας αντικατοπτρίζουν τον βαθμό συνέπειας δύο σειρών δεικτών που λαμβάνονται ανεξάρτητα, η μαθηματική και στατιστική τεχνική με την οποία καθορίζεται η αξιοπιστία της μεθοδολογίας είναι οι συσχετισμοί (σύμφωνα με τον Pearson ή τον Spearman). Όσο περισσότερο ο συντελεστής συσχέτισης που προκύπτει προσεγγίζει τη μονάδα, τόσο μεγαλύτερη είναι η αξιοπιστία και το αντίστροφο.

Κ.Μ. Γκούρεβιτςπροτείνεται να ερμηνευτεί η αξιοπιστία ως:

αξιοπιστία του ίδιου του οργάνου μέτρησης (συντελεστής αξιοπιστίας).
σταθερότητα του υπό μελέτη χαρακτηριστικού (συντελεστής σταθερότητας).
σταθερότητα, δηλ. σχετική ανεξαρτησία των αποτελεσμάτων από την προσωπικότητα του πειραματιστή (συντελεστής σταθερότητας).

Ο δείκτης που χαρακτηρίζει το όργανο μέτρησης προτείνεται να ονομάζεται συντελεστής αξιοπιστίας. δείκτης που χαρακτηρίζει τη σταθερότητα της μετρούμενης ιδιότητας - συντελεστής σταθερότητας. και ο δείκτης για την αξιολόγηση της επιρροής της προσωπικότητας του πειραματιστή είναι ο συντελεστής σταθερότητας. Με αυτή τη σειρά συνιστάται να ελέγξετε τη μεθοδολογία: συνιστάται πρώτα να ελέγξετε το εργαλείο μέτρησης. Εάν τα δεδομένα που λαμβάνονται είναι ικανοποιητικά, τότε μπορούμε να προχωρήσουμε στον καθορισμό ενός μέτρου σταθερότητας της ιδιότητας που μετράται και στη συνέχεια, εάν είναι απαραίτητο, να εξετάσουμε το κριτήριο της σταθερότητας. (Αξιοπιστία: δοκιμή-επανέλεγχος, παράλληλες μορφές, μέρη σώματος, εσωτερική συνέπεια, παραγοντική διακύμανση).

Προσδιορισμός της αξιοπιστίας ενός οργάνου μέτρησης.Η ακρίβεια και η αντικειμενικότητα της μέτρησης εξαρτάται από το πώς συντάσσεται η μεθοδολογία, πόσο σωστά επιλέγονται οι εργασίες και πόσο ομοιόμορφη είναι.

Για τον έλεγχο της αξιοπιστίας ενός οργάνου μέτρησης, υποδεικνύοντας την ομοιογένειά του (ομοιογένεια), χρησιμοποιείται η μέθοδος διαχωρισμού. Οι εργασίες χωρίζονται σε ζυγές και περιττές (όλες οι εργασίες πρέπει να ολοκληρωθούν) και στη συνέχεια τα αποτελέσματα συσχετίζονται μεταξύ τους. Εάν η τεχνική είναι ομοιογενής, τότε δεν θα υπάρχει μεγάλη διαφορά επιτυχίας μεταξύ αυτών των μισών, ο συντελεστής θα είναι υψηλός. Μπορείτε να συγκρίνετε μέρη, αλλά είναι καλύτερα να συγκρίνετε άρτια και περιττά, γιατί αυτή η μέθοδος δεν εξαρτάται από την προπόνηση, την κούραση κ.λπ.

Η τεχνική είναι αξιόπιστη εάν ο συντελεστής δεν είναι χαμηλότερος 0,75 - 0,85, καλύτερα 0,90 και πάνω.

Προσδιορισμός της σταθερότητας του υπό μελέτη χαρακτηριστικού.Είναι επίσης απαραίτητο να διαπιστωθεί πόσο σταθερό είναι το χαρακτηριστικό που σκοπεύει να μετρήσει ο ερευνητής. Το ζώδιο μπορεί να αλλάζει με την πάροδο του χρόνου, αλλά οι διακυμάνσεις του δεν πρέπει να είναι απρόβλεπτες.

Για τον έλεγχο, χρησιμοποιείται μια τεχνική που ονομάζεται επανέλεγχος δοκιμής. Συνίσταται στην επανεξέταση των θεμάτων χρησιμοποιώντας την ίδια τεχνική. Η σταθερότητα κρίνεται από τον συντελεστή συσχέτισης μεταξύ των αποτελεσμάτων της πρώτης και της δεύτερης εξέτασης. Θα υποδεικνύει εάν κάθε υποκείμενο διατηρεί ή όχι τον τακτικό του αριθμό στο δείγμα.

Ο βαθμός σταθερότητας επηρεάζεται από την ποικιλία των παραγόντων. Πρέπει να τηρείται η ομοιομορφία της διαδικασίας εξέτασης.

Κατά τον προσδιορισμό της σταθερότητας ενός χαρακτηριστικού, το χρονικό διάστημα μεταξύ 1 και 2 εξετάσεων έχει μεγάλη σημασία. Όσο μικρότερο είναι αυτό το διάστημα, τόσο μεγαλύτερη είναι η πιθανότητα αυτό το ζώδιο να διατηρήσει το επίπεδο της πρώτης δοκιμής. Συνιστάται η επανάληψη της δοκιμής σε σύντομο χρονικό διάστημα μετά τη δοκιμή. Ο ίδιος ο πειραματιστής ορίζει αυτή την περίοδο, αλλά πιο συχνά στην ψυχολογική βιβλιογραφία υποδεικνύουν ένα διάστημα αρκετών μηνών (αλλά όχι περισσότερο από έξι μήνες). Το ζήτημα της σταθερότητας της ιδιοκτησίας που μετράται δεν επιλύεται πάντα ομοιόμορφα. Η απόφαση εξαρτάται από την ουσία του συμπτώματος που διαγιγνώσκεται.

Εάν η ιδιότητα που μετράται έχει ήδη σχηματιστεί, τότε ο συντελεστής δεν πρέπει να είναι μικρότερος από 0,80.

Ορισμός της σταθερότητας, δηλ. σχετική ανεξαρτησία των αποτελεσμάτων από την προσωπικότητα του πειραματιστή. Δεδομένου ότι η τεχνική αναπτύσσεται για περαιτέρω χρήση από άλλους ψυχοδιαγνωστικούς, είναι απαραίτητο να προσδιοριστεί σε ποιο βαθμό τα αποτελέσματά της επηρεάζονται από την προσωπικότητα του πειραματιστή. Ο συντελεστής σταθερότητας προσδιορίζεται συσχετίζοντας τα αποτελέσματα δύο πειραμάτων που πραγματοποιήθηκαν στο ίδιο δείγμα, αλλά από διαφορετικούς πειραματιστές. Ο συντελεστής συσχέτισης δεν πρέπει να είναι μικρότερος από 0,80.

Το ζήτημα της εγκυρότητας αποφασίζεται αφού εδραιωθεί η αξιοπιστία, αφού μια αναξιόπιστη τεχνική δεν μπορεί να είναι έγκυρη.

Εγκυρότητατεστ - μια έννοια που μας λέει τι μετρά το τεστ και πόσο καλά το κάνει (Α. Αναστάση). Εγκυρότηταστον πυρήνα του, είναι ένα σύνθετο χαρακτηριστικό που περιλαμβάνει, αφενός, πληροφορίες σχετικά με το εάν η τεχνική είναι κατάλληλη για τη μέτρηση για ποιο σκοπό δημιουργήθηκε και, αφετέρου, ποια είναι η αποτελεσματικότητα, η αποδοτικότητα και η πρακτική χρησιμότητα της.

Για το λόγο αυτό, δεν υπάρχει ενιαία καθολική προσέγγιση για τον προσδιορισμό της εγκυρότητας. Ανάλογα με το ποια πτυχή της εγκυρότητας θέλει να εξετάσει ο ερευνητής, χρησιμοποιούνται διαφορετικές μέθοδοι απόδειξης. Με άλλα λόγια, η έννοια της εγκυρότητας περιλαμβάνει τους διαφορετικούς τύπους της, που έχουν τη δική τους ιδιαίτερη σημασία. Ο έλεγχος της εγκυρότητας μιας μεθοδολογίας ονομάζεται επικύρωση.

Εγκυρότητα είναι η συμμόρφωση μιας συγκεκριμένης μελέτης με αποδεκτά πρότυπα (ένα άψογο πείραμα).

Η εγκυρότητα στην πρώτη της κατανόηση έχει να κάνει με την ίδια τη μεθοδολογία, δηλ. αυτή είναι η εγκυρότητα του οργάνου μέτρησης. Αυτός ο τύπος επαλήθευσης ονομάζεται θεωρητική επικύρωση. Η εγκυρότητα στη δεύτερη κατανόησή της δεν αναφέρεται τόσο στη μεθοδολογία όσο στον σκοπό της χρήσης της. Αυτή είναι ρεαλιστική επικύρωση.

Κατά τη διάρκεια της θεωρητικής επικύρωσης, ο ερευνητής ενδιαφέρεται για την ίδια την ιδιότητα που μετράται από την τεχνική.

Δεδομένου ότι, για να καθοριστεί η θεωρητική επικύρωση, είναι δύσκολο να βρεθεί κάποιο ανεξάρτητο κριτήριο που να βρίσκεται εκτός της μεθοδολογίας, και ως εκ τούτου αβάσιμες δηλώσεις σχετικά με την εγκυρότητα αυτής της μεθοδολογίας θεωρούνταν προηγουμένως δεδομένες. Δεδομένου ότι η θεωρητική επικύρωση στοχεύει στο να αποδείξει ότι η τεχνική μετρά ακριβώς την ιδιότητα που υποτίθεται ότι μετράει. Για τη θεωρητική επικύρωση, το βασικό πρόβλημα είναι η σχέση μεταξύ των ψυχολογικών φαινομένων και των δεικτών τους, μέσω των οποίων αυτά τα ψυχολογικά φαινόμενα προσπαθούν να γίνουν γνωστά. Δείχνει ότι η πρόθεση του συγγραφέα και τα αποτελέσματα της μεθοδολογίας συμπίπτουν.

Δεν είναι τόσο δύσκολο να πραγματοποιηθεί η θεωρητική επικύρωση μιας νέας τεχνικής εάν υπάρχει ήδη μια τεχνική με γνωστή, αποδεδειγμένη εγκυρότητα για τη μέτρηση μιας δεδομένης ιδιότητας. Η παρουσία συσχέτισης μεταξύ μιας νέας και μιας παρόμοιας παλιάς τεχνικής δείχνει ότι η τεχνική που αναπτύχθηκε μετρά την ίδια ψυχολογική ποιότητα με την τεχνική αναφοράς.

Για τον έλεγχο της θεωρητικής εγκυρότητας, είναι σημαντικό, αφενός, να καθοριστεί ο βαθμός σύνδεσης με μια σχετική τεχνική (convergent validity) και, αφετέρου, η απουσία αυτής της σύνδεσης με τεχνικές που έχουν διαφορετική θεωρητική βάση (discriminant validity ).

Σημαντικό ρόλο στην κατανόηση των μετρήσεων της μεθοδολογίας παίζει η σύγκριση των δεικτών της με πρακτικές μορφές Δραστηριότητας. Είναι σημαντικό η μεθοδολογία να επεξεργαστεί θεωρητικά.

Πραγματική Επικύρωση

Η πρακτική αποτελεσματικότητα, η σημασία και η χρησιμότητα της μεθοδολογίας ελέγχονται, καθώς η μεθοδολογία μπορεί να χρησιμοποιηθεί μόνο όταν αποδειχθεί ότι η ιδιότητα που μετράται εκδηλώνεται σε ορισμένους τύπους Δραστηριοτήτων.

Για να ελεγχθεί η πραγματιστική εγκυρότητα, χρησιμοποιείται ένα ανεξάρτητο εξωτερικό κριτήριο - ένας δείκτης της εκδήλωσης της μελετημένης ιδιότητας στην καθημερινή ζωή. Ένα τέτοιο κριτήριο μπορεί να είναι η ακαδημαϊκή επίδοση (για τεστ μαθησιακών ικανοτήτων, τεστ επιτεύγματος, τεστ νοημοσύνης), επιτεύγματα παραγωγής (για μεθόδους επαγγελματικού προσανατολισμού), η αποτελεσματικότητα πραγματικών δραστηριοτήτων - σχέδιο, μοντελοποίηση και ούτω καθεξής (για τεστ ειδικών ικανοτήτων ), υποκειμενικές αξιολογήσεις (για τεστ προσωπικότητας).

Οι Αμερικανοί ερευνητές Tiffin και McCormick προσδιόρισαν 4 τύπους εξωτερικών κριτηρίων:

Κριτήριο απόδοσης (πλήθος εκτελεσθείσας εργασίας, ακαδημαϊκές επιδόσεις, χρόνος, ρυθμός αύξησης των προσόντων).
Υποκειμενικά κριτήρια (περιλαμβάνουν διάφορους τύπους απαντήσεων που αντικατοπτρίζουν τη στάση ενός ατόμου απέναντι σε κάτι, τις απόψεις, τις απόψεις του).
Φυσιολογικό κριτήριο (χρησιμοποιείται κατά τη μελέτη της επίδρασης του εξωτερικού περιβάλλοντος που επηρεάζει το σώμα και την ψυχή).
Κριτήριο τυχαιότητας (για παράδειγμα, όταν ο στόχος αφορά το πρόβλημα της επιλογής για εργασία εκείνων των ατόμων που είναι λιγότερο επιρρεπή σε ατυχήματα).

Το εξωτερικό κριτήριο πρέπει να έχει 3 βασικές απαιτήσεις:

Πρέπει να είναι σχετικό, δηλαδή να υπάρχει εμπιστοσύνη ότι το κριτήριο περιλαμβάνει ακριβώς εκείνα τα χαρακτηριστικά της ατομικής ψυχής που μετρά η διαγνωστική τεχνική. Το εξωτερικό κριτήριο και το διαγνωστικό μοντέλο πρέπει να βρίσκονται σε εσωτερική σημασιολογική αντιστοιχία.
Πρέπει να είναι απαλλαγμένο από παρεμβολές (μόλυνση). Ομάδες ανθρώπων που βρίσκονται σε περισσότερο ή λιγότερο πανομοιότυπες συνθήκες θα πρέπει να επιλέγονται για έρευνα.
Πρέπει να είναι αξιόπιστο. Σταθερότητα και σταθερότητα της υπό μελέτη συνάρτησης.

Η αξιολόγηση της εγκυρότητας της μεθοδολογίας μπορεί να είναι ποσοτική και ποιοτική.

Για τον υπολογισμό ενός ποσοτικού δείκτη (συντελεστής εγκυρότητας), τα αποτελέσματα που προκύπτουν από την εφαρμογή διαγνωστικών τεχνικών συγκρίνονται με τα δεδομένα των ίδιων ατόμων που λαμβάνονται χρησιμοποιώντας ένα εξωτερικό κριτήριο. Χρησιμοποιούνται διαφορετικοί τύποι γραμμικής συσχέτισης (σύμφωνα με τον Spearman, σύμφωνα με τον Piersen).

Ποιοτική περιγραφή της ουσίας του υπό μέτρηση ακινήτου. Δεν χρησιμοποιείται καμία στατιστική επεξεργασία εδώ.

Υπάρχουν αρκετές είδη εγκυρότητας, λόγω των ιδιαιτεροτήτων της διαγνωστικής τεχνικής, καθώς και της προσωρινής κατάστασης του εξωτερικού κριτηρίου:

Εγκυρότητα περιεχομένου (χρησιμοποιείται σε τεστ επίδοσης): 3 - 4 ερωτήσεις από ένα μεγάλο θέμα μπορούν να δείξουν την αληθινή γνώση ενός μαθητή. Για να γίνει αυτό, τα διαγνωστικά αποτελέσματα συγκρίνονται με τις αξιολογήσεις των ειδικών του δασκάλου.
Σύγχρονη εγκυρότητα ή τρέχουσα εγκυρότητα - συλλέγονται δεδομένα που σχετίζονται με την παρούσα εποχή: ακαδημαϊκές επιδόσεις, παραγωγικότητα κ.λπ. Τα αποτελέσματα επιτυχίας των δοκιμών συσχετίζονται με αυτά.
"Προβλεπτική" εγκυρότητα ("προγνωστική"). Καθορίζεται από ένα αξιόπιστο εξωτερικό κριτήριο, αλλά οι πληροφορίες σχετικά με αυτό συλλέγονται λίγο καιρό μετά τη δοκιμή. Η ακρίβεια της πρόβλεψης είναι αντιστρόφως ανάλογη με το χρόνο που καθορίζεται για μια τέτοια πρόβλεψη.
«Αναδρομική» εγκυρότητα. Καθορίζεται με βάση ένα κριτήριο που αντικατοπτρίζει γεγονότα ή την κατάσταση ποιότητας στο παρελθόν. Μπορεί να χρησιμοποιηθεί για γρήγορη απόκτηση πληροφοριών σχετικά με τις προγνωστικές δυνατότητες της τεχνικής.

ΜΕΘΟΔΟΣ ΥΠΟΛΟΓΙΣΜΟΥ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΤΕΣΤ

Bovtrukevich Maria Viktorovna,

φοιτητής 3ου έτουςΣΟΛ.Μινσκ

Κιρεένκο Άννα Βλαντιμίροβνα

φοιτητής 3ου έτους, Τμήμα Τεχνολογιών Πληροφορικής, BSU,ΣΟΛ.Μινσκ

Sirotina Irina Kazimirovna

επιστημονικός επόπτης, ανώτερος δάσκαλος, BSU,ΣΟΛ.Μινσκ

Σήμερα, το θέμα του ελέγχου των δοκιμών είναι πολύ επίκαιρο. Χρησιμοποιείται ευρέως κατά τη διεξαγωγή εκστρατειών εισαγωγής σε πανεπιστήμια, κατά τη δοκιμή των γνώσεων των μαθητών σε σχολεία, λύκεια, δευτεροβάθμια ειδικά και ανώτατα εκπαιδευτικά ιδρύματα και κατά την πρόσληψη. Επειδή τα τεστ βοηθούν στον προσδιορισμό των ικανοτήτων, των κλίσεων, των κλίσεων ενός ατόμου, καθώς και του επιπέδου γνώσεων, δεξιοτήτων και ικανοτήτων, στη συνέχεια κατέλαβαν σημαντική θέση στο χώρο της εκπαίδευσης.

Δοκιμήείναι ένα εργαλείο που αποτελείται από ένα ποιοτικά επαληθευμένο σύστημα εργασιών δοκιμής, μια τυποποιημένη διαδικασία διεξαγωγής και μια προσχεδιασμένη τεχνολογία και ανάλυση αποτελεσμάτων για τη μέτρηση των ιδιοτήτων και των χαρακτηριστικών ενός ατόμου, εκπαιδευτικά επιτεύγματα, η αλλαγή των οποίων είναι δυνατή στη διαδικασία της συστηματικής εκπαίδευσης.

Παιδαγωγικό τεστείναι ένα σύστημα εργασιών συγκεκριμένης μορφής, συγκεκριμένου περιεχομένου και ομοιόμορφα αυξανόμενης δυσκολίας - ένα σύστημα που δημιουργήθηκε με στόχο την αντικειμενική αξιολόγηση της δομής και τη μέτρηση του επιπέδου ετοιμότητας των μαθητών. .

Το κύριο πρόβλημα του ελέγχου της γνώσης είναι η διαδικασία δημιουργίας τεστ, η ενοποίηση και η ανάλυσή τους. Για να φέρει το τεστ σε πλήρη ετοιμότητα για χρήση, είναι απαραίτητο να συλλέγονται στατιστικά δεδομένα για αρκετά χρόνια. Αρκετά συχνά, υπάρχει σημαντική υποκειμενικότητα στο σχηματισμό του περιεχομένου των ίδιων των τεστ, στην επιλογή και διατύπωση ερωτήσεων τεστ. Πολλά εξαρτώνται επίσης από το συγκεκριμένο σύστημα δοκιμών, από το πόσος χρόνος διατίθεται για τη δοκιμή γνώσεων, από τη δομή των ερωτήσεων που περιλαμβάνονται στην δοκιμαστική εργασία κ.λπ. Για να αξιολογηθεί αντικειμενικά το επίπεδο γνώσης, είναι απαραίτητο να σχεδιαστεί σωστά το τεστ: Δεν αρκεί να βάζετε ερωτήσεις και επιλογές απαντήσεων, καθώς σε αυτήν την περίπτωση μπορεί να προκύψουν πολλές αντιφάσεις, λάθη και αβεβαιότητες· οι εργασίες μπορεί να αποδειχθούν πολύ απλές ή, αντίθετα, πολύ περίπλοκες. Για το λόγο αυτό, οι δοκιμαστικές εργασίες υποβάλλονται σε ειδική διαδικασία αξιολόγησης, την οποία θα εξετάσουμε στην εργασία μας.

Σκοπός Η δουλειά μας είναι να συστηματοποιήσουμε μεθόδους που μας επιτρέπουν να υπολογίζουμε τα χαρακτηριστικά της δοκιμής. Αφού αναλύσαμε την επιστημονική βιβλιογραφία για το ερευνητικό θέμα, επιλέξαμε τα πιο κοινά χαρακτηριστικά δοκιμής, τα συγκεντρώσαμε, περιγράψαμε λεπτομερώς την εφαρμογή τους, συντάξαμε γενικούς κανόνες για τη δημιουργία ενός τεστ υψηλής ποιότητας και δώσαμε παραδείγματα. Ελπίζουμε ότι αυτή η εργασία θα βελτιώσει μια τέτοια μορφή ελέγχου γνώσης όπως ο έλεγχος των τεστ, που με τη σειρά του θα βελτιώσει την ποιότητα της εκπαίδευσης.

Στη θεωρία και την πράξη των μετρήσεων δοκιμής, οι ακόλουθοι προσδιορίζουν μια ποικιλία χαρακτηριστικών δοκιμής: αξιοπιστία, εγκυρότητα, διακριτικότητα, κοινωνικοπολιτισμική προσαρμοστικότητα, αξιοπιστία, σαφήνεια, τυποποίηση, ακρίβεια, πολυπλοκότητα, κανονικοποίηση κ.λπ. Σε αυτή την εργασία, λόγω των προδιαγραφών μας Μελέτη, εξετάσαμε τα εξής από αυτά: αξιοπιστία, εγκυρότητα, διακριτικότητα.

Διάκριση Τα καθήκοντα ορίζονται ως η ικανότητα διαχωρισμού των υποψηφίων με υψηλή συνολική βαθμολογία τεστ από αυτούς που έλαβαν χαμηλή βαθμολογία ή των υποψηφίων με υψηλή εκπαιδευτική παραγωγικότητα από αυτούς με χαμηλή παραγωγικότητα. .

Για να υπολογίσουμε τη διάκριση, θα χρησιμοποιήσουμε τη μέθοδο των ακραίων ομάδων: κατά τον υπολογισμό της διακριτικότητας μιας δοκιμαστικής εργασίας, λαμβάνονται υπόψη τα αποτελέσματα των περισσότερο και των λιγότερο επιτυχημένων μαθητών. Το ποσοστό των μελών των ακραίων ομάδων μπορεί να ποικίλλει ευρέως ανάλογα με το μέγεθος του δείγματος. Όσο μεγαλύτερο είναι το δείγμα, τόσο μικρότερη είναι η αναλογία των θεμάτων στα οποία μπορείτε να περιοριστείτε όταν προσδιορίζετε ομάδες με υψηλά και χαμηλά αποτελέσματα. Το κατώτερο όριο της «ομαδικής αποκοπής» είναι 10% του συνολικού αριθμού των ατόμων στο δείγμα, το ανώτερο όριο είναι 33%. Στην εργασία μας θα χρησιμοποιήσουμε την ομάδα 27%, αφού με αυτό το ποσοστό επιτυγχάνεται η μέγιστη ακρίβεια στον προσδιορισμό της διακριτικότητας.

Δείκτης διάκρισης ρεορίζεται ως η διαφορά μεταξύ της αναλογίας των ατόμων που έλυσαν σωστά το πρόβλημα από τις ομάδες «υψηλής παραγωγικότητας» και «χαμηλής παραγωγικότητας» και βρίσκεται χρησιμοποιώντας τον τύπο:

Οπου: Nn max - ο αριθμός των μαθητών στην ομάδα των καλύτερων που ολοκλήρωσαν σωστά την εργασία. Nn min - ο αριθμός των μαθητών στη χειρότερη ομάδα που ολοκλήρωσαν σωστά την εργασία. Ν max - ο συνολικός αριθμός θεμάτων στην καλύτερη ομάδα. Ν min - ο συνολικός αριθμός θεμάτων στη χειρότερη ομάδα.

Ο V.K. Gaida και ο V.P. Zakharov προτείνουν να υπολογιστεί ο συντελεστής διάκρισης υπολογίζοντας το μέτρο αντιστοιχίας μεταξύ της επιτυχίας της επίλυσης ενός προβλήματος και ολόκληρης της δοκιμής. Αυτός ο δείκτης θα είναι ο συντελεστής διάκρισης· ο τύπος χρησιμοποιείται για τον υπολογισμό του:

, (2)

Οπου: Χ- αριθμητικός μέσος όρος όλων των επιμέρους βαθμολογιών του τεστ.

x n- τον αριθμητικό μέσο όρο των βαθμολογιών του τεστ για τα θέματα που έλυσαν σωστά το πρόβλημα.

δx- τυπική απόκλιση των επιμέρους βαθμολογιών δοκιμής για το δείγμα.

n- τον αριθμό των θεμάτων που έλυσαν σωστά το πρόβλημα.

Nd- συνολικός αριθμός θεμάτων.

Ο συντελεστής διάκρισης μπορεί να πάρει τιμές από -1 έως +1. Μια υψηλή θετική τιμή της διακριτικότητας μιας δοκιμαστικής εργασίας υποδηλώνει την αποτελεσματικότητα της διαίρεσης των θεμάτων, μια υψηλή αρνητική τιμή δείχνει την ακαταλληλότητα αυτής της εργασίας για τη δοκιμή, την ασυνέπειά της με το συνολικό αποτέλεσμα. Αποτέλεσμα ρε≥0,3 θεωρείται ικανοποιητικό. Εάν η τιμή του συντελεστή είναι κοντά στο 0, τότε οι εργασίες θα πρέπει να θεωρηθούν ως εσφαλμένα διατυπωμένες.

Εγκυρότητα σημαίνει την καταλληλότητα των αποτελεσμάτων των δοκιμών για το σκοπό για τον οποίο πραγματοποιήθηκε η δοκιμή. Εγκυρότηταείναι ένα χαρακτηριστικό της ικανότητας ενός τεστ να εξυπηρετεί τον επιδιωκόμενο σκοπό μέτρησης. Εγκυρότητακαθορίζει πόσο καλά ένα τεστ αντικατοπτρίζει αυτό που υποτίθεται ότι πρέπει να μετρήσει.

Διακρίνονται οι παρακάτω τύποι: Μεβασανιστικόςεγκυρότητα - χαρακτηριστικό της αντιπροσωπευτικότητας του περιεχομένου του τεστ σε σχέση με τις γνώσεις και τις δεξιότητες που έχουν προγραμματιστεί για τη δοκιμή· Προς τηνεποικοδομητικόςΗ (εννοιολογική) εγκυρότητα είναι χαρακτηριστικό της επαρκούς μέτρησης μιας θεωρητικής κατασκευής, δηλ. ε. εάν το τεστ νοημοσύνης μετράει πραγματικά το IQ. Προς τηντελετουργικόεγκυρότητα - καθορίζει την ικανότητα του τεστ να χρησιμεύει ως δείκτης αυστηρά καθορισμένων χαρακτηριστικών και μορφών συμπεριφοράς. Τρεύμαεγκυρότητα - ένα χαρακτηριστικό ενός τεστ που αντανακλά την ικανότητά του να διακρίνει μεταξύ θεμάτων με βάση το χαρακτηριστικό που είναι το αντικείμενο αναγνώρισης σε αυτήν την τεχνική. ΠρογνωστικόςΗ εγκυρότητα παρέχει πληροφορίες σχετικά με το πόσο με ακρίβεια μπορεί να κριθεί η ποιότητα που προσδιορίζεται σε μια δοκιμή για μια χρονική περίοδο μετά τη μέτρηση.

Για την αξιολόγηση της εγκυρότητας ενός τεστ, χρησιμοποιείται συνήθως μια συσχέτιση μεταξύ των βαθμολογιών του τεστ και κάποιου εξωτερικού κριτηρίου. Για τα παιδαγωγικά τεστ, τα κριτήρια που λαμβάνονται συνήθως είναι οι αξιολογήσεις των ειδικών, που δίνονται από αυτούς κατά την παραδοσιακή δοκιμή των γνώσεων των μαθητών χωρίς τη χρήση τεστ. Η διαδικασία επικύρωσης περιπλέκεται από την ανάγκη να καθοριστεί ένα μέτρο συνέπειας στις αξιολογήσεις των εμπειρογνωμόνων, από τους οποίους συνήθως υπάρχουν τουλάχιστον τρία άτομα.

Η εγκυρότητα με ποσοτικές μεθόδους προσδιορισμού καθορίζεται κυρίως με τη χρήση ποιοτικών αξιολογήσεων, συνήθως με τη συμμετοχή ειδικών: o παραγοντικόΗ ανάλυση λέγεται όταν η παραγοντική ανάλυση χρησιμοποιείται για τον προσδιορισμό της εγκυρότητας για τον προσδιορισμό των φορτίων παραγόντων και της σύνθεσης παραγόντων μιας δοκιμής. Προς την συναίνεσηεγκυρότητα - δεδομένα από εξωτερικούς εμπειρογνώμονες χρησιμοποιούνται για τη λήψη της δεύτερης σειράς αξιολογήσεων. ε εμπειρικόςεγκυρότητα - για τη λήψη της δεύτερης σειράς εκτιμήσεων, χρησιμοποιούνται τα αποτελέσματα που λαμβάνονται με την εφαρμογή προηγουμένως γνωστών μεθόδων ή από άλλες πηγές.

Σε αυτό το έγγραφο θα εξετάσουμε ένα παράδειγμα υπολογισμού εγκυρότητας λαμβάνοντας υπόψη τα αποτελέσματα των δοκιμών και τις εκτιμήσεις των ειδικών:

, (3)

όπου: - αριθμητικός μέσος όρος των αξιολογήσεων εμπειρογνωμόνων,

Η τυπική απόκλιση αυτών των εκτιμήσεων είναι:

(3.2)

Ομοίως, ο αριθμητικός μέσος όρος των βαθμολογιών των τεστ των μαθητών και
- Η τυπική απόκλιση αυτών των βαθμολογιών, υπολογίζεται επίσης με τους τύπους (3.1), (3.2).

Αξιοπιστία είναι ένα χαρακτηριστικό μιας δοκιμής που αντανακλά την ακρίβεια των μετρήσεων της δοκιμής, καθώς και τη σταθερότητα των αποτελεσμάτων της δοκιμής στη δράση τυχαίων παραγόντων.

Υπάρχουν δύο τύποι αξιοπιστίας: η αξιοπιστία ως σταθερότητα. αξιοπιστία ως εσωτερική συνέπεια.

Η αξιοπιστία ως σταθερότητα.Η σταθερότητα των αποτελεσμάτων των δοκιμών είναι η δυνατότητα λήψης των ίδιων αποτελεσμάτων από άτομα σε διαφορετικές περιπτώσεις. Η αξιοπιστία ως σταθερότητα μετριέται με την επανάληψη της δοκιμής στο ίδιο δείγμα ατόμων, συνήθως δύο εβδομάδες μετά την πρώτη δοκιμή. Η αξιοπιστία ενός τεστ είναι υψηλότερη, τόσο πιο συνεπή είναι τα αποτελέσματα του ίδιου ατόμου όταν δοκιμάζει ξανά τη γνώση χρησιμοποιώντας το ίδιο τεστ ή την αντίστοιχη μορφή του (παράλληλη δοκιμή). Για να βρείτε αυτό το χαρακτηριστικό, προτείνεται η χρήση του τύπου Pearson:

, (4)

Οπου ΧΕγώ- βαθμολογία δοκιμής του i-ου θέματος στην πρώτη μέτρηση.

Y i- βαθμολογία δοκιμής του ίδιου θέματος κατά τη διάρκεια επαναλαμβανόμενων μετρήσεων.

Ν- αριθμός θεμάτων.

Η εσωτερική συνοχή καθορίζεται από τη σύνδεση κάθε συγκεκριμένου στοιχείου δοκιμής με το συνολικό αποτέλεσμα, τον βαθμό στον οποίο κάθε στοιχείο έρχεται σε σύγκρουση με τα άλλα και τον βαθμό στον οποίο κάθε μεμονωμένη ερώτηση μετρά το χαρακτηριστικό στο οποίο στοχεύει ολόκληρο το τεστ. Για τον έλεγχο της εσωτερικής συνοχής, λαμβάνονται υπόψη οι ακόλουθες μέθοδοι: μέθοδος διαχωρισμού ή μέθοδος αυτόνομων εξαρτημάτων. μέθοδος ισοδύναμων εντύπων· Μέθοδος άλφα του Cronbach. Η μέθοδος διαχωρισμού χρησιμοποιεί τους ακόλουθους τύπους: Spearman-Brown; Ρολό; Kuder-Richardson; Στάνλεϋ. Αν οι τιμές των συντελεστών rπέφτουν στην περιοχή 0,80-0,89, τότε λένε ότι η δοκιμή έχει καλή αξιοπιστία και εάν αυτός ο συντελεστής δεν είναι μικρότερος από 0,90, τότε η αξιοπιστία μπορεί να ονομαστεί πολύ υψηλή. Κατά την εφαρμογή της μεθόδου διαχωρισμού, ο πίνακας δοκιμής χωρίζεται σε δύο μισά, που αποτελούνται από εργασίες με ζυγούς και περιττούς αριθμούς.

Ο τύπος Spearman-Brown μοιάζει με αυτό:

Πριν εφαρμόσετε αυτόν τον τύπο, είναι απαραίτητο να εφαρμόσετε τον τύπο (3). Σημειώστε ότι σε αυτή την περίπτωση ΧΕγώ- βαθμολογία δοκιμής Εγώ-ο θέμα για εργασίες με ζυγό αριθμό. Y i

Ο τύπος Rulon μοιάζει με αυτό:

Διασπορά των διαφορών μεταξύ των αποτελεσμάτων κάθε υποκειμένου και στα δύο μισά του τεστ μικρό 2 ρεβρίσκεται με τον τύπο:

Οπου: X i- βαθμολογία δοκιμής του i-ου θέματος για εργασίες με ζυγό αριθμό.

Y i- βαθμολογία τεστ του ίδιου θέματος για εργασίες με περιττό αριθμό.

Διασπορά των συνολικών βαθμολογιών αποτελεσμάτων μικρό 2 zβρίσκεται με τον τύπο:

, (6.2)

Οπου: Z i- συνολική βαθμολογία για το τεστ Εγώο μαθητής.

Ο τύπος Kuder-Richardson μοιάζει με αυτό:

, (7)

Οπου: p j- μερίδιο σωστών απαντήσεων σε ι-η εργασία, δηλ. αριθμός σωστών απαντήσεων διαιρεμένος με αριθμό μαθητών·

q j- αναλογία λανθασμένων απαντήσεων σε ι-η εργασία, δηλαδή ο αριθμός των λανθασμένων απαντήσεων διαιρεμένος με τον αριθμό των μαθητών ( q j= 1 -p j);

μικρό 2 z- διασπορά των συνολικών πόντων του αποτελέσματος, η οποία υπολογίζεται σύμφωνα με τον τύπο (5.2).

Κατά τον υπολογισμό της αξιοπιστίας χρησιμοποιώντας τον τύπο Stanley, οι μαθητές πρέπει να χωριστούν σε δύο ομάδες. Η πρώτη ομάδα θα περιλαμβάνει το 27% των «ισχυρών» μαθητών (αυτοί που συγκέντρωσαν τους περισσότερους βαθμούς) και η αδύναμη ομάδα θα περιλαμβάνει το 27% των «αδύναμων» μαθητών (αυτοί που συγκέντρωσαν τους χαμηλότερους βαθμούς).

Ο τύπος του Stanley:

, (8)

Οπου W L- τον αριθμό των λανθασμένων απαντήσεων σε αυτήν την ερώτηση στην αδύναμη ομάδα.

W H- ο αριθμός των λανθασμένων απαντήσεων σε αυτήν την ερώτηση σε μια ισχυρή ομάδα.

n- αριθμός ερωτήσεων στο τεστ.

κ- ο αριθμός των ατόμων στην ισχυρή (αδύναμη) ομάδα, δηλαδή 27% του συνολικού αριθμού των υποκειμένων.

Ο συντελεστής άλφα Cronbach δείχνει την εσωτερική συνέπεια των χαρακτηριστικών που περιγράφουν ένα αντικείμενο και βρίσκεται από τον τύπο:

, (9)

Οπου: μικρό 2 Υ- διασπορά των συνολικών πόντων του αποτελέσματος, η οποία υπολογίζεται σύμφωνα με τον τύπο (3.2).

μικρό 2 Yi- διασπορά στοιχείων Εγώ.

Θα δείξουμε τη μέθοδο για τον υπολογισμό των χαρακτηριστικών δοκιμής σε ένα συγκεκριμένο παράδειγμα. Λάβαμε τα αποτελέσματα των εξετάσεων μαθητών που παρουσιάζονται στον Πίνακα 1.

Τραπέζι 1

Τα πρώτα αποτελέσματα δοκιμών

Αγudent *Εγώ*	Αναθεώρηση εμπειρογνωμόνων	ΑΡΙΘΜΟΣ δουλειας
Αγudent *Εγώ*	Αναθεώρηση εμπειρογνωμόνων		1 0

Δύο εβδομάδες αργότερα, η δοκιμή επαναλήφθηκε και ελήφθη το αποτέλεσμα που παρουσιάζεται στον Πίνακα 2.

πίνακας 2

Αποτελέσματα της δεύτερης δοκιμής

*Εγώ*	Αναθεώρηση εμπειρογνωμόνων	ΑΡΙΘΜΟΣ δουλειας
*Εγώ*	Αναθεώρηση εμπειρογνωμόνων		1 0

Χρησιμοποιώντας τα δεδομένα από τους πίνακες, ας προχωρήσουμε στον υπολογισμό όλων των παραπάνω χαρακτηριστικών.

Διάκριση

1. Υπολογίζουμε τον αριθμό των μαθητών στις εξωτερικές ομάδες, στρογγυλοποιώντας αμέσως σε ακέραιους αριθμούς:

2. Σκεφτείτε μια ομάδα από τους καλύτερους και μια ομάδα από τις χειρότερες, καθεμία από τις οποίες θα έχει 3 άτομα. Παίρνουμε τον πίνακα 3.

Πίνακας 3

Συνοπτικός πίνακας δοκιμών με εκτιμήσεις εμπειρογνωμόνων

Εγώ

Αναθεώρηση εμπειρογνωμόνων, Ei

ΑΡΙΘΜΟΣ δουλειας

Συνολική βαθμολογία τεστ

1 0

Έτσι, η καλύτερη ομάδα περιλαμβάνει μαθητές με αριθμό 1, 10, 4. στη χειρότερη ομάδα: 3, 5, 2 (αν υπάρχουν μαθητές με την ίδια βαθμολογία τεστ, λαμβάνουμε υπόψη τις αξιολογήσεις των ειδικών).

3. Ας δημιουργήσουμε έναν πίνακα4 που αποτελείται μόνο από μαθητές από την καλύτερη ομάδα και μαθητές από τη χειρότερη ομάδα, υπολογίζοντας αμέσως τον αριθμό των μαθητών σε κάθε ομάδα που ολοκλήρωσαν σωστά την εργασία.

Πίνακας 4

Συνοπτικός πίνακας δοκιμών με εκτιμήσεις εμπειρογνωμόνων
για ακραίες ομάδες

Εγώ

Εκτίμηση πραγματογνώμονα, Ει

ΑΡΙΘΜΟΣ δουλειας

1 0

Ομάδα από τους καλύτερους

Η χειρότερη ομάδα

4. Υπολογίζουμε τον δείκτη διακριτικότητας για κάθε εργασία χρησιμοποιώντας τον τύπο (1):

, , , , , , , , , .

Συμπεραίνουμε ότι οι εργασίες 6 και 7 δεν εισάγουν διακρίσεις.

Εγκυρότητα

Βρέθηκε ο πίνακας 6 μι i (αξιολόγηση ειδικού), Z i(συνολική βαθμολογία για το τεστ), n- είναι γνωστό, στην περίπτωσή μας είναι ίσο με 10.

1. Βρίσκουμε επίσης από τον τύπο (3.1):

2. Βρίσκουμε επίσης από τον τύπο (3.2):

3.Η εγκυρότητα υπολογίζεται με τον τύπο (3). Για ευκολία, ας υπολογίσουμε ξεχωριστά:

Παίρνουμε: .

Η αξιοπιστία ως βιωσιμότητα

1. Αρχικά, ας φτιάξουμε τον πίνακα 5.

Πίνακας 5

Εύρεση αξιοπιστίας χρησιμοποιώντας τον τύπο Pearson

Αριθμός μαθητή i	Βαθμολογία πρώτου τεστ Χ *Εγώ*	*Επαναλάβετε τη βαθμολογίαY i***	Χ *Εγώ* *Y i*	*(X i) 2*	*(Y i) 2*

2. Ας εφαρμόσουμε τον τύπο (4):

Η αξιοπιστία ως εσωτερική συνέπεια.Θα θεωρήσουμε αυτό το χαρακτηριστικό ως μέθοδο διαχωρισμού σύμφωνα με τον τύπο Rulon (6).

1. Αρχικά, ας βρούμε τη διακύμανση των διαφορών μεταξύ των αποτελεσμάτων κάθε θέματος και στα δύο μισά του τεστ. Ας συμπληρώσουμε τον πίνακα 6.

Πίνακας 6

Υπολογισμός διακύμανσης διαφορών αποτελεσμάτων

*Εγώ*	*Πόντοι για εργασίες με ζυγό αριθμόX i***	*Βαθμολογία για εργασίες με περιττούς αριθμούςY i***	Χ *Εγώ* *-Y i*

2. Εφαρμόστε τον τύπο (6.1): .

3. Ας βρούμε τη διασπορά των συνολικών βαθμολογιών του αποτελέσματος κατασκευάζοντας πρώτα τον Πίνακα 7.

Πίνακας 7

Υπολογισμός της διακύμανσης των συνολικών βαθμολογιών

*Εγώ*	*Βαθμολογία για όλες τις εργασίες ZΕγώ***

4. Εφαρμόζοντας τον τύπο (6.2) και μετά τον τύπο (6), λαμβάνουμε:

, .

Ερμηνεία αποτελεσμάτων

1. Αξιοπιστία ως σταθερότητα: δεδομένου ότι η τιμή του συντελεστή είναι περίπου 0,923, η δοκιμή έχει υψηλό βαθμό αξιοπιστίας. Αυτό σημαίνει ότι από αυτή την άποψη συντάσσεται πολύ καλά.

2. Αξιοπιστία ως εσωτερική συνέπεια: Η τιμή του συντελεστή συσχέτισης είναι περίπου 0,198. Αυτό υποδηλώνει χαμηλή αξιοπιστία, επομένως είναι καλύτερο να επαναλάβετε τη δοκιμή για να προσδιορίσετε ποια στοιχεία δοκιμής πρέπει να αντικατασταθούν.

3. Διακριτικότητα: οι εργασίες 6 και 7 δεν εισάγουν διακρίσεις, καθώς ένας συντελεστής διάκρισης μικρότερος από 0,3 θεωρείται μη ικανοποιητικός. Αυτό σημαίνει ότι αυτά τα στοιχεία δεν είναι κατάλληλα για τη δοκιμή και πρέπει να αντικατασταθούν.

4. Εγκυρότητα: ο βαθμός συσχέτισης μεταξύ των αποτελεσμάτων των δοκιμών και του εξωτερικού κριτηρίου (εκτιμήσεις εμπειρογνωμόνων) είναι αρκετά υψηλός και ανέρχεται σε 0,962823. Αυτό το αποτέλεσμα υποδεικνύει την υψηλή εγκυρότητα της εξέτασης.

Εφιστούμε την προσοχή σας ειδικές περιπτώσεις.

Μερικές φορές, κατά την εύρεση ενός συντελεστή ασφαλείας, εμφανίζεται διαίρεση με το μηδέν. Αυτό μπορεί να συμβεί εάν όλοι οι μαθητές έχουν τον ίδιο αριθμό σωστών και λανθασμένων απαντήσεων. Αυτό συμβαίνει σπάνια στην πράξη· πιθανότατα οι απαντήσεις διέρρευσαν. Σε αυτή την περίπτωση, η δοκιμή πρέπει να επαναληφθεί.
Όταν βρίσκουμε την αξιοπιστία ως σταθερότητα, είναι επίσης πιθανό η απάντηση να δίνει αβεβαιότητα, δηλ. το μηδέν διαιρείται με το μηδέν. Αυτό μπορεί να συμβεί όταν ένας μαθητής δώσει τον ίδιο αριθμό σωστών και λανθασμένων απαντήσεων στην πρώτη και επανεξετάσει. Αυτό σημαίνει ότι το τεστ σχεδιάστηκε με μεγάλη επιτυχία ή, αντίθετα, πολύ ανεπιτυχώς. Σας συμβουλεύουμε να ελέγξετε άλλα χαρακτηριστικά δοκιμής και να βγάλετε ένα συμπέρασμα με βάση αυτά.
Κατά τον υπολογισμό της εγκυρότητας, είναι επίσης πιθανό να προκύψει διαίρεση με το 0. Αυτό μπορεί να συμβεί εάν όλοι οι μαθητές έχουν τον ίδιο αριθμό σωστών και λανθασμένων απαντήσεων ή εάν όλες οι αξιολογήσεις των ειδικών είναι ίδιες. Αυτή η περίπτωση είναι σπάνια πιθανό να συμβεί στην πράξη· πιθανότατα, οι απαντήσεις έχουν διαρρεύσει και το δεδομένο αποτέλεσμα είναι λοξό.

Εάν θέλουμε να δημιουργήσουμε δοκιμαστικά αντικείμενα που έχουν ικανοποιητική διακριτική ικανότητα, τότε πρέπει να αποφύγουμε τα ακόλουθα: 1) υπερβολική πολυπλοκότητα και σύγχυση διατυπώσεων. 2) ασάφεια των συνθηκών. 3) προφανεια της λυσης? 4) η εξάρτηση του αποτελέσματος από τη μνήμη ή από άλλα μεμονωμένα χαρακτηριστικά του υποκειμένου και όχι από το επίπεδο ανάπτυξης εκείνων των δεξιοτήτων και ικανοτήτων για την αξιολόγηση των οποίων αναπτύσσεται το τεστ. 5) παραλογισμός, μη πραγματικότητα των επιλογών απάντησης. 6) η εμφάνιση δύο ή περισσότερων σωστών απαντήσεων που δεν καθορίζονται στη συνθήκη.

Υπάρχουν οι ακόλουθοι τρόποι για να αυξηθεί η εγκυρότητα του τεστ: 1) επιλογή της βέλτιστης δυσκολίας των εργασιών για να εξασφαλιστεί η κανονική κατανομή των βαθμολογιών του τεστ. 2) εξέταση της ποιότητας του περιεχομένου της δοκιμής.
3) υπολογισμός του βέλτιστου χρόνου εκτέλεσης της δοκιμής. 4) επιλογή εργασιών με υψηλή διακριτικότητα.

Μια προκαταρκτική μελέτη των πηγών αναξιοπιστίας καθιστά δυνατή, ει δυνατόν, την εξάλειψη της επιρροής τους κατά την κατασκευή της δοκιμής. Τέτοιες πηγές περιλαμβάνουν συνήθως: 1. Υποκειμενικότητα κατά την αξιολόγηση των αποτελεσμάτων των εργασιών δοκιμής. Η πιο αποτελεσματική μέθοδος για να ξεπεραστεί αυτό το μειονέκτημα είναι η χρήση κλειστών εργασιών, οι οποίες, λόγω της δυνατότητας αντικειμενικής αξιολόγησης των αποτελεσμάτων απόδοσης, ceteris paribus, οδηγούν σε αύξηση της αξιοπιστίας της δοκιμής. 2. Μαντεύοντας. Όπως δείχνουν ειδικές μελέτες, η εικασία μειώνει σημαντικά την αξιοπιστία του τεστ, ειδικά σε περιπτώσεις που δοκιμάζεται μια ομάδα αδύναμων μαθητών, που συνήθως καταφεύγουν σε εικασίες όταν ολοκληρώνουν τα πιο δύσκολα τεστ. 3. Έλλειψη λογικής ορθότητας στη διατύπωση των τεστ. Κατά κανόνα, οι δυνατοί μαθητές χάνουν λανθασμένες εργασίες, κάτι που γενικά επηρεάζει αρνητικά την αξιοπιστία του τεστ. 4. Αδικαιολόγητη επιλογή συντελεστών στάθμισης. Στη σωστή κατάσταση πραγμάτων, η επιλογή των συντελεστών στάθμισης στη διαδικασία υπολογισμού των επιμέρους βαθμολογιών των μαθητών θα πρέπει να βασίζεται στην κατάλληλη θεωρία. 5. Μήκος ζύμης. Η αξιοπιστία αυξάνεται όσο αυξάνεται το μήκος της δοκιμής. Για ικανοποιητική αλλά όχι καλή αξιοπιστία, συνήθως αρκούν 30 δοκιμαστικά στοιχεία. 6. Έλλειψη τυπικών οδηγιών για τη δοκιμή. Οι οδηγίες δοκιμής πρέπει να είναι εξαιρετικά τυποποιημένες και ακριβείς. Τυχόν ασάφειες, ασάφειες και αποκλίσεις από τις απαιτήσεις τυποποίησης στις οδηγίες οδηγούν σε μείωση της αξιοπιστίας της δοκιμής. 7. Άλλες πηγές αναξιοπιστίας σχετίζονται με εξεταζόμενους και όχι με αντικείμενα δοκιμής. Για παράδειγμα, ο εξεταζόμενος μπορεί να αισθάνεται αδιαθεσία ενώ εργάζεται στο τεστ ή να κάνει λάθος στις οδηγίες. Τα αποτελέσματα των δοκιμών μπορεί να επηρεαστούν από κόπωση και πλήξη, θερμοκρασία δωματίου, θόρυβο έξω από το παράθυρο κ.λπ.

Συμπερασματικά, σημειώνουμε ότι στο πλαίσιο του έργου μας, προκειμένου να βελτιστοποιηθεί η διαδικασία εμπειρικής επεξεργασίας των χαρακτηριστικών του τεστ, οι μαθητές της ειδικότητας «Επιστήμη Υπολογιστών» Faley Alexander και Berezyuk Sergey εφάρμοσαν εξελίξεις διαδικτυακή υπηρεσία.Η επεξεργασία των δεδομένων χρήστη χωρίζεται σε τρία στάδια: λήψη πληροφοριών από τον πελάτη και δημιουργία συστοιχιών αρχικών δεδομένων, επεξεργασία τιμών με χρήση τύπων υπολογισμού και αλγορίθμων, διάταξη και εμφάνιση των αποτελεσμάτων στον χρήστη. Το κοινό-στόχος αυτής της υπηρεσίας μπορεί να είναι κυρίως δάσκαλοι σχολείων και καθηγητές πανεπιστημίου Διεύθυνση έργου: www.qualitester.com.

Βιβλιογραφία:

1. Avanesov V. S. Σύνθεση εργασιών δοκιμής / V. S. Avanesov. - Μ.: Adept, 1998. - 217 σελ.

2. Avanesov V.S. Εφαρμογή εργασιών σε δοκιμαστική μορφή σε νέες εκπαιδευτικές τεχνολογίες / V.S. Avanesov // Σχολικές τεχνολογίες. - 2007. - Αρ. 3. - Σ. 146-163.

3. Avanesov V. S. Μορφή δοκιμαστικών εργασιών: σχολικό βιβλίο. επίδομα / V. S. Avanesov. M.: Testing Center, 2005. - 120 p.

4. Gutsanovich S. A., Radkov A. M. Δοκιμές στη διδασκαλία των μαθηματικών: διαγνωστικές και διδακτικές βάσεις / S. A. Gutsanovich, A. M. Radkov. - Mozyr: Εκδοτικός Οίκος "White Wind", 2001. - 168 p.

5. Mayorov A. N. Θεωρία και πρακτική δημιουργίας τεστ για το εκπαιδευτικό σύστημα. - Μόσχα: «Intellect-Center», 2002. - 296 σελ.

6. Chelyshkova, Μ.Β. Θεωρία και πράξη κατασκευής παιδαγωγικών τεστ. - Μόσχα: «Λόγος», 2002. - 432 σελ.

1. Κατά τη διεξαγωγή έρευνας, τίθεται συχνά το ερώτημα πόσο αντιπροσωπευτικό είναι το υλικό που χρησιμοποιείτε. Πώς ονομάζεται το μέτρο αντιστοιχίας για ένα συγκεκριμένο χαρακτηριστικό του θέματος στον πληθυσμό στον οποίο ανήκει:
α) εγκυρότητα·
β) μεταβλητότητα.
γ) αντιπροσωπευτικότητα;
δ) αξιοπιστία.
2. Πώς ονομάζεται το ερευνητικό στάδιο στο οποίο διατυπώνονται ιδέες για τα αίτια και τις συνέπειες των φαινομένων που επιλέγονται για έρευνα:
α) στάδιο παρατήρησης·
β) στάδιο συσχέτισης.
γ) στάδιο ελέγχου.
δ) στάδιο σχηματισμού υπόθεσης.
3. Ποια δήλωση περιγράφει την έννοια της εγκυρότητας:
α) την ικανότητα της δοκιμής να προσδιορίζει την έκταση του ελαττώματος·
β) χαρακτηριστικά της ενότητας των μεθόδων χρήσης της δοκιμής·
γ) ένδειξη ότι η δοκιμή μετρά αυτό που προορίζεται να μετρήσει·
δ) ένα μέτρο της πιθανότητας λήψης εσφαλμένων αποτελεσμάτων.
4. Η αντιπροσωπευτικότητα της δοκιμής δείχνει:
α) τη δυνατότητα εφαρμογής των κανόνων που καθορίζονται στη δοκιμή σε αυτό το δείγμα·
β) ο βαθμός ομοιογένειας του διαγνωσθέντος δείγματος.
γ) πόσο διαφέρει το αποτέλεσμα ενός θέματος σε ένα δεδομένο τεστ από το αποτέλεσμα ενός άλλου μαθήματος.
5. Ποια δήλωση ορίζει την έννοια της τυποποίησης δοκιμής:
α) τη συμμόρφωση της δοκιμής με τα πρότυπα·
β) χρήση ενιαίων διαδικασιών για τη διεξαγωγή και τον υπολογισμό των αποτελεσμάτων.
γ) συντονισμός των προτύπων πληθυσμού με πολιτιστικά και κοινωνικά πρότυπα.
6. Ποια δήλωση περιγράφει με μεγαλύτερη ακρίβεια τι είναι το IQ:
α) χαρακτηριστικά των υπαρχουσών γνωστικών ικανοτήτων·
β) χαρακτηριστικά των εγγενών ικανοτήτων.
γ) ένα μέτρο επίκτητων πνευματικών δεξιοτήτων.
δ) χαρακτηριστικά της ζώνης εγγύς ανάπτυξης.
7. Η αξιολόγηση της ψυχολογικής κατάστασης χρησιμοποιώντας ένα σύστημα δοκιμών ονομάζεται:
α) ψυχοδιαγνωστικά·
β) διάγνωση?
γ) μέτρηση.
δ) ψυχολογικό πείραμα.
8. Έργα των οποίων δύο ερευνητές ήταν στην αρχή της μεθόδου δοκιμής:
ΕΝΑ) E. Kraepelin and A. Binet;
β) P. Janet και F. Galton.
γ) F. Galton και J. Cattell.
δ) F. Galton και A. Binet.
9. Ποιος πρότεινε τη μελέτη της μνήμης με τη μέθοδο του εικονογράμματος:
α) Σ.Λ. Rubinstein;
μπαρ. Luria;
γ) Τ. Ribot;
δ) V.B. Ζεϊγκάρνικ.
10. Διδακτικές μέθοδοι που χρησιμοποιούνται στην παιδιατρική διαγνωστική από την Α.Υα. Η Ivanova στοχεύει στη μελέτη:
α) πνευματικό επίπεδο·
β) ζώνες εγγύς ανάπτυξης.
γ) κίνητρα για εκπαιδευτικές δραστηριότητες.
δ) συναισθηματικά μπλοκ της πνευματικής εργασίας.
11. Οι ρυθμίσεις στόχου των πινάκων Bourdon test και Raven σχετίζονται ως εξής:
α) προϋποθέσεις ευφυΐας - ευφυΐας.
β) νοημοσύνη - σκέψη.
γ) ακαμψία - ευελιξία.
12. Ότι ένα από τα παραπάνω αποτελεί ουσιώδες στοιχείο του προτεινόμενου Α.Φ. «φυσικό πείραμα» του Lazursky σε αντίθεση με το εργαστηριακό:
α) οι πειραματικές συνθήκες δεν συνδέονται με τεχνητές συνθήκες και απαιτήσεις·
β) το πείραμα πραγματοποιείται χωρίς τη χρήση τεχνικών μέσων·
γ) ο πειραματιστής συμμετέχει στην εκτέλεση της εργασίας μαζί με το υποκείμενο.
δ) παρατήρηση σε φυσικές συνθήκες με την ακρίβεια και την επιστημονικότητα ενός πειράματος, όταν το υποκείμενο δεν γνωρίζει την έρευνα που διεξάγεται.
ε) χρησιμοποιείται ειδικός εξοπλισμός και σαφώς προγραμματισμένες εργασίες.
13. Το τεστ απογοήτευσης Rosenzweig ανήκει σε μία από τις ακόλουθες ομάδες:
α) ερωτηματολόγια προσωπικότητας·
β) δοκιμασίες επίδοσης.
γ) ψυχομετρικά τεστ.
δ) προβολικές μέθοδοι.
ε) δωρεάν συνέντευξη.
14. Η αξιολόγηση IQ βασίζεται στη σύγκριση:
α) ηλικία διαβατηρίου και επίπεδο εκπαίδευσης·
β) νοητική και συναισθηματική ηλικία.
γ) πνευματική ηλικία και ηλικία διαβατηρίου.
δ) μέγιστοι και ελάχιστοι δείκτες.
ε) το επίπεδο της τρέχουσας ανάπτυξης και των πιθανών δυνατοτήτων.
15. Η παρατήρηση των συμμετεχόντων είναι:
α) παρατήρηση με χρήση «μπαταριών» ψυχολογικών τεστ·
β) μακροπρόθεσμη παρατήρηση.
γ) παρατήρηση σε εργαστήριο.
δ) παρατήρηση, στην οποία ο ψυχολόγος είναι άμεσος συμμετέχων στα γεγονότα.
ε) η παρατήρηση περιλαμβάνει διάφορα στάδια.
16. Η μέθοδος της γνώσης, η οποία περιορίζεται στην καταγραφή των αναγνωρισμένων γεγονότων στη μελέτη των ηλικιακών χαρακτηριστικών, ονομάζεται:
α) διαμορφωτικό πείραμα.
β) παρατήρηση.
γ) πείραμα εξακρίβωσης·
δ) οιονεί πείραμα.
δ) μοντελοποίηση.
17. Η μέθοδος της ενεργού επιρροής του ερευνητή στις αλλαγές στον ψυχισμό του παιδιού είναι:
α) παρατήρηση συμμετεχόντων·
β) πιλοτικό πείραμα.
γ) πείραμα ελέγχου.
δ) διαμορφωτικό πείραμα.
δ) πείραμα διαπίστωσης.
18. Ένα συνώνυμο του μορφοποιητικού πειράματος είναι:
α) οιονεί πείραμα.
β) προβολικό πείραμα.
γ) πείραμα ελέγχου.
δ) γενετική μοντελοποίηση.
ε) εργαστηριακό πείραμα.
19. Τα δεδομένα σχετικά με την πραγματική ανθρώπινη συμπεριφορά που λαμβάνονται μέσω εξωτερικής συμπεριφοράς ονομάζονται:
α) L-δεδομένα.
β) Q-δεδομένα.
γ) T-δεδομένα.
δ) Ζ-δεδομένα.
20. Ο B.G. Ananyev αναφέρεται στη μέθοδο της διαχρονικής έρευνας:
α) στις οργανωτικές μεθόδους·
β) σε εμπειρικές μεθόδους.
γ) σε μεθόδους επεξεργασίας δεδομένων·
δ) σε ερμηνευτικές μεθόδους.
21. Το είδος των αποτελεσμάτων που καταγράφονται με τη χρήση ερωτηματολογίων και άλλων μεθόδων αυτοαξιολόγησης ονομάζεται:
α) L-δεδομένα.
β) Q-δεδομένα.
γ) T-δεδομένα.
δ) Ζ-δεδομένα.
22. Η σκόπιμη, συστηματικά πραγματοποιούμενη αντίληψη των αντικειμένων για τη γνώση των οποίων ενδιαφέρεται ένα άτομο είναι:
α) πείραμα·
β) ανάλυση περιεχομένου.
γ) παρατήρηση.
δ) η μέθοδος ανάλυσης των προϊόντων δραστηριότητας.
23. Η μακροπρόθεσμη και συστηματική παρατήρηση, η μελέτη των ίδιων ανθρώπων, η οποία επιτρέπει σε κάποιον να αναλύσει την ψυχολογική ανάπτυξη σε διάφορα στάδια της ζωής και να βγάλει ορισμένα συμπεράσματα με βάση αυτό, ονομάζεται συνήθως έρευνα:
α) ακροβατικά·
β) διαμήκης?
γ) συγκριτικό?
δ) σύνθετη.
24. Η έννοια της «αυτοπαρατήρησης» είναι συνώνυμη με τον όρο:
α) εσωστρέφεια·
β) εισαγωγή.
γ) ενδοσκόπηση;
δ) ενδοσκόπηση.
25. Ένα σύντομο, τυποποιημένο ψυχολογικό τεστ που επιχειρεί να αξιολογήσει μια συγκεκριμένη ψυχολογική διαδικασία ή προσωπικότητα στο σύνολό της είναι:
α) παρατήρηση·
β) πείραμα.
γ) δοκιμή.
δ) αυτοπαρατήρηση.
26 Η λήψη από το υποκείμενο δεδομένων σχετικά με τις δικές του ψυχικές διεργασίες και καταστάσεις κατά τη στιγμή της εμφάνισής τους ή μετά από αυτήν είναι:
α) παρατήρηση·
β) πείραμα.
γ) δοκιμή.
δ) αυτοπαρατήρηση.
27. Η ενεργός παρέμβαση ενός ερευνητή στις δραστηριότητες ενός υποκειμένου προκειμένου να δημιουργηθούν προϋποθέσεις για τη διαπίστωση ενός ψυχολογικού γεγονότος ονομάζεται:
α) ανάλυση πλαισίου·
β) ανάλυση των προϊόντων δραστηριότητας.
γ) συνομιλία.
δ) πείραμα.
28. Μια μέθοδος μελέτης της δομής και της φύσης των διαπροσωπικών σχέσεων των ανθρώπων που βασίζεται στη μέτρηση της διαπροσωπικής επιλογής ονομάζεται:
α) ανάλυση περιεχομένου·
β) μέθοδος σύγκρισης.
γ) η μέθοδος των κοινωνικών μονάδων.
δ) κοινωνιομετρία.
29. Η ικανότητα του ερευνητή να προκαλεί κάποια νοητική διαδικασία ή ιδιότητα είναι το κύριο πλεονέκτημα:
α) παρατηρήσεις·
β) πείραμα.
γ) ανάλυση περιεχομένου.
δ) ανάλυση προϊόντων δραστηριότητας.
30. Η αξιολόγηση της συνέπειας των δεικτών που προέκυψε από επαναλαμβανόμενες δοκιμές των ίδιων θεμάτων με την ίδια δοκιμασία ή την ισοδύναμη μορφή της χαρακτηρίζει τη δοκιμασία ως προς τα εξής:
ΕΝΑ) εγκυρότητα;
β) αξιοπιστία.
γ) αξιοπιστία.
31. Τα πρώτα τεστ νοημοσύνης για παιδιά αναπτύχθηκαν από:
α) Binet-Simon;
β) Ι.Π. Pavlov;
γ) Ebbinghaus.
32. Οι επίσημες μέθοδοι περιλαμβάνουν:
α) δοκιμές·
β) ερωτηματολόγια.
γ) προβολικές τεχνικές.
δ) ψυχοφυσιολογικές τεχνικές.
ε) όλες οι απαντήσεις είναι σωστές.
στ) όλες οι απαντήσεις είναι λανθασμένες.
33. Οι λιγότερο επίσημες μέθοδοι ΔΕΝ περιλαμβάνουν:
ΕΝΑ) παρατήρηση;
β) συνομιλία.
γ) ανάλυση των προϊόντων δραστηριότητας.
δ) ερωτηματολόγια.
δ) δοκιμές.
34. Η τυποποίηση είναι:

35. Η αξιοπιστία είναι:
α) ομοιομορφία της διαδικασίας διεξαγωγής και αξιολόγησης της δοκιμής·
β) συνέπεια των αποτελεσμάτων των δοκιμών κατά την αρχική και επαναλαμβανόμενη χρήση στα ίδια θέματα
γ) μια έννοια που υποδεικνύει τι μετρά ένα τεστ και πόσο καλά το κάνει
36. Η ισχύς είναι:
α) ομοιομορφία της διαδικασίας διεξαγωγής και αξιολόγησης της δοκιμής·
β) συνέπεια των αποτελεσμάτων των δοκιμών κατά την αρχική και επαναλαμβανόμενη χρήση στα ίδια θέματα
γ) μια έννοια που υποδεικνύει τι μετρά ένα τεστ και πόσο καλά το κάνει
37. Η τεχνική που χρησιμοποιείται για επαναλαμβανόμενη εξέταση ατόμων που χρησιμοποιούν την ίδια τεχνική για τον έλεγχο της σταθερότητας του συμπτώματος που διαγιγνώσκεται ονομάζεται:
α) σταθερότητα·
β) ανάλυση περιεχομένου.
γ) δοκιμή-επανέλεγχος.
38. Οι πίνακες Schulte έχουν σχεδιαστεί για να μελετούν το εύρος προσοχής και οι πίνακες Schulte-Gorbov έχουν σχεδιαστεί για να μελετούν:
α) σταθερότητα της προσοχής·
β) συγκέντρωση.
γ) δυνατότητα εναλλαγής της προσοχής.
δ) δυναμική ασυμμετρία προσοχής.
39. Ποια παράγραφος υποδεικνύει τις μεθόδους που προσδιορίζουν καλύτερα την ποικιλομορφία σκέψης:
α) ταξινόμηση και προσθήκη αριθμών·
β) προσθήκη ψηφίων και εξάλειψη αντικειμένων.
γ) εικονόγραμμα και προσθήκη σχημάτων.
δ) ταξινόμηση και εξαίρεση ειδών.
ε) εικονόγραμμα και ταξινόμηση.
40. Η τεχνική Dembo-Rubinstein είναι:
α) τεστ αυτοεκτίμησης·
β) πειραματικές ψυχολογικές μεθόδους για τη μελέτη των χαρακτηριστικών της προσωπικότητας σύμφωνα με την αυτοεκτίμηση.
γ) πειραματικές ψυχολογικές μέθοδοι για τη μελέτη της αυτοεκτίμησης.
41. Ποια από τις παρακάτω προτάσεις ΔΕΝ αντικατοπτρίζει τους βασικούς κανόνες για την αξιολόγηση του προφίλ MMPI:
α) το προφίλ πρέπει να αξιολογηθεί ως σύνολο·
β) κατά την αξιολόγηση του προφίλ, η πιο σημαντική τιμή είναι ο κανόνας Τ σε κάθε κλίμακα, με τον οποίο η σύγκριση αντικατοπτρίζει τον βαθμό σοβαρότητας της ψυχοπαθολογίας.
γ) το προφίλ χαρακτηρίζει τα χαρακτηριστικά της προσωπικότητας και την τρέχουσα ψυχική κατάσταση.
δ) κατά την αξιολόγηση ενός προφίλ, το πιο σημαντικό είναι η αναλογία του επιπέδου κάθε κλίμακας προς το μέσο επίπεδο του προφίλ στο σύνολό του και, ειδικά, σε σχέση με τις γειτονικές κλίμακες.
42. Το τεστ «κηλίδας μελανιού» δημιουργήθηκε από τον G. Rorschach:
α) το 1912·
β) το 1921·
γ) το 1935?
δ) το 1951
43. Η ελάχιστη ηλικία από την οποία μπορεί να χρησιμοποιηθεί το τεστ χρωματικής σχέσης Α.Μ. Etkinda:
α) 3-4 χρόνια?
β) 5-6 χρόνια?
γ) 7-8 χρόνια?
δ) 9-10 ετών.
44. «Κύβοι Koos», «Link cube» είναι μέθοδοι έρευνας:
α) τη διαδικασία επίλυσης εποικοδομητικών προβλημάτων·
β) αφηρημένη λογική σκέψη.
γ) λογιστική σκέψη.
δ) RAM.
45. Στην έκδοση του τεστ Wechsler για ενήλικες και παιδιά, τα αποτελέσματα του τεστ εξαρτώνται περισσότερο από πολιτισμική άποψη:
α) εξαρτήματα που λείπουν·
β) αριθμητική?
γ) λαβύρινθος?
δ) ευαισθητοποίηση.
46. Ποιος από τους παρακάτω παράγοντες μπορεί να οδηγήσει σε μείωση της απόδοσης στο λεκτικό τεστ Wechsler:
α) υψηλό επίπεδο άγχους.
β) υψηλή ανάγκη για αυτοπραγμάτωση.
γ) υψηλό επίπεδο προσοχής.
δ) υψηλή αυτοεκτίμηση.
47. Ποια από τις ακόλουθες δοκιμές ΔΕΝ είναι προβολική:
α) ΤΑΤ·
β) Δοκιμή Rorschach.
γ) Τεστ άγχους Spielberg-Hanin.
δ) δοκιμή ημιτελών φράσεων.
48. Ποιο από τα ακόλουθα τεστ ΔΕΝ προορίζεται για την αξιολόγηση των πνευματικών ικανοτήτων:
α) ΤΑΤ·
β) Τεστ Wechsler.
γ) τεστ γενικής ικανότητας.
δ) Τεστ Stanford-Binet.
49. Το ερωτηματολόγιο Spielberg-Khanin σάς επιτρέπει:
α) να αξιολογήσει το επίπεδο της κατάθλιψης.
β) να εντοπίσει μια τάση για πολικές διακυμάνσεις της επίδρασης.
γ) συγκρίνετε την αληθινή και την περιστασιακή αυτοεκτίμηση.
δ) συγκρίνετε το άγχος της κατάστασης και το συνταγματικό άγχος.
50. Ποιο τεστ σάς επιτρέπει να συγκρίνετε λεκτικές και μη λεκτικές ικανότητες:
α) Δοκιμή Rorschach.
β) Τεστ Wechsler.
γ) Δοκιμή Bender.
δ) Τεστ Cattell.
51. Το ερωτηματολόγιο προσωπικότητας 16 παραγόντων αναπτύχθηκε από…..
α) Cattell
β) Rorschich
γ) Wexler
δ) Μπέντερ
52. Ποιο τεστ περιέχει 3 κλίμακες εγκυρότητας και 10 κλινικές κλίμακες:
α) Τεστ Wechsler για ενήλικες.
β) Τεστ Eysenck.
γ) MMPI;
δ) Τεστ Cattell.
53. Τα τεστ επάρκειας δείχνουν:
α) επίπεδο προηγούμενης εκπαίδευσης·
β) ο βαθμός συμβολής της κληρονομικότητας στις ικανότητες.
γ) ευκαιρίες για επιτυχία σε έναν συγκεκριμένο τομέα.
δ) γενικό επίπεδο νοητικών ικανοτήτων.
54. Ποιο από τα χρώματα στη δοκιμή Luscher ΔΕΝ είναι βασικό χρώμα:
α) μπλε?
β) κίτρινο?
γ) μωβ?
δ) γαλαζοπράσινο.
55. Η αξιοπιστία της δοκιμής δείχνει:
α) ποια σταθερότητα των αποτελεσμάτων της μέτρησης εξασφαλίζεται από την ίδια τη δοκιμή·
β) πόσο σταθερές είναι αυτές οι ιδιότητες και ποιότητες που μετρώνται με τη χρήση της δοκιμής.
γ) πόσο σταθερή είναι η διαδικασία για τον υπολογισμό της συνολικής βαθμολογίας για το τεστ.
56. Ποιος είναι ο αρχικός σκοπός του ερωτηματολογίου του T. Leary:
α) μελέτη της δυναμικής της ομάδας.
β) μελέτη των σχέσεων στην οικογένεια.
γ) μελέτη των ταυτοποιήσεων μεμονωμένων ρόλων.
δ) μελέτη κοινωνικής σύγκρουσης.
57. Ποια δήλωση περιγράφει σωστά τον σκοπό της δοκιμής Rosenzweig:
α) εντοπισμός επιθετικών αντιδράσεων στο στρες.
β) προσδιορισμό του επιπέδου αντοχής στην καταπόνηση.
γ) τον προσδιορισμό των τύπων αντίδρασης στην απογοήτευση.
δ) διάγνωση κλινικών τύπων επιθετικότητας.
58. Η μεθοδολογική βάση της ψυχοδιαγνωστικής είναι:
α) καλά ανεπτυγμένη ψυχολογική θεωρία.
β) ψυχομετρία.
γ) πρακτικός τομέας εφαρμογής ψυχοδιαγνωστικών μεθόδων.
59. Ο παράγοντας κοινωνικής επιθυμίας έχει τη μεγαλύτερη επιρροή σε:
α) την κατάσταση του πελάτη·
β) καταστάσεις εξέτασης.
γ) παθοψυχολογική διάγνωση.
60. Η εγκυρότητα περιεχομένου μιας δοκιμής είναι:
β) προβληματισμό στο περιεχόμενο της δοκιμής των βασικών πτυχών του ψυχολογικού φαινομένου που μελετάται.
γ) δείκτη εσωτερικής ομοιογένειας (συνέπειας) του τεστ.
61. Εάν το δείγμα είναι αντιπροσωπευτικό μιας διατομής του πληθυσμού, τότε:
α) τα αποτελέσματα της κατανομής δειγματοληψίας μπορούν να περιγραφούν με κατανομή κοντά στο κανονικό·
β) τα αποτελέσματα της δειγματοληπτικής κατανομής μπορούν να περιγραφούν με οποιαδήποτε μαθηματική κατανομή.
γ) με βάση τα αποτελέσματα της δειγματοληπτικής κατανομής, είναι γενικά αδύνατο να κριθεί η αντιπροσωπευτικότητα του δείγματος.
62. Ο μη γραμμικός μετασχηματισμός των τυπικών δεικτών είναι απαραίτητος για:
α) ευκολία ερμηνείας των αποτελεσμάτων που λαμβάνονται·
β) να επιτύχει συγκρισιμότητα των αποτελεσμάτων που ανήκουν στις κατανομές που λαμβάνονται από διάφορες δοκιμές.
γ) να επιτύχουν συγκρισιμότητα των αποτελεσμάτων που ανήκουν σε κατανομές διαφορετικών σχημάτων.
63. Το κοινωνικο-ψυχολογικό πρότυπο είναι:
α) μια στατιστική νόρμα που λαμβάνεται εμπειρικά από ένα δείγμα·
β) το σύστημα των απαιτήσεων της κοινωνίας για το άτομο·
γ) μια ατομική νόρμα που υπολογίζεται για ένα δεδομένο άτομο.
64. Η ιδέα της τυποποίησης μεθόδων και δοκιμών ανήκει:
α) J. Kettelu;
β) W. Wundt;
γ) Α. Binet.
65. Οι προβολικές δοκιμές και τεχνικές διαφέρουν από τις αντικειμενικές δοκιμές και τις τυποποιημένες αυτοαναφορές στο ότι:
α) δεν μπορεί να δώσει αντικειμενικά και αξιόπιστα αποτελέσματα·
β) τα αποτελέσματα των δοκιμών δεν μπορούν να επισημοποιηθούν·
γ) η ερμηνεία των αποτελεσμάτων του τεστ εξαρτάται από την ικανότητα και το επίπεδο προσόντων του ψυχοδιαγνωστικού.
66. Η εμπειρική επικύρωση από εμπειρογνώμονες αναφέρεται σε:
α) θεωρητικός τύπος επικύρωσης·
β) πρακτικός τύπος επικύρωσης.
γ) θεωρητικούς και πρακτικούς τύπους επικύρωσης.
67. Η εγκυρότητα κατασκευής μιας δοκιμής είναι:
α) ο βαθμός αναπαράστασης (αναπαράστασης) της υπό μελέτη ψυχολογικής δομής στα αποτελέσματα των δοκιμών·
β) δείκτη εσωτερικής ομοιογένειας (συνέπειας) της δοκιμής·
γ) προβληματισμό στο περιεχόμενο της δοκιμής των βασικών πτυχών της πνευματικής ιδιοκτησίας που μελετάται.
68. Η σχέση εγκυρότητας και αξιοπιστίας έχει ως εξής:
α) εγκυρότητα ≤ αξιοπιστία.
β) εγκυρότητα ≥ αξιοπιστία.
γ) εγκυρότητα = αξιοπιστία.
69. Η αξιοπιστία της δοκιμής είναι:
α) την προστασία του από παραποίηση αποτελεσμάτων από ψυχοδιαγνωστολόγο·
β) την προστασία του από επιρροή στα αποτελέσματα διαφόρων εξωτερικών επιρροών·
γ) την προστασία του από παραποίηση αποτελεσμάτων από το υποκείμενο της δοκιμής·
70. Η εγκυρότητα του τεστ αποδεικνύεται από:
α) ανεξαρτησία των αποτελεσμάτων της εξέτασης από τη γνώμη του ψυχοδιαγνώστη·
β) εάν αυτή η δοκιμή μπορεί να χρησιμοποιηθεί στην πράξη.
γ) εάν το τεστ μετρά το νοητικό φαινόμενο που προορίζεται να μετρήσει.

Η δοκιμή συνήθως εξετάζεται αξιόπιστος, εάν με τη βοήθειά του λαμβάνονται οι ίδιοι δείκτες για κάθε θέμα κατά τη διάρκεια επαναλαμβανόμενων δοκιμών.

αξιοπιστία εσωτερικής συνέπειας:Εάν μια συγκεκριμένη μεταβλητή μετριέται από μέρος μιας δοκιμής, τότε άλλα μέρη, που δεν συνάδουν με την πρώτη, μετρούν κάτι άλλο.

Αξιοπιστία δοκιμής-επανάληψης δοκιμής- περιλαμβάνει επανειλημμένη παρουσίαση του ίδιου τεστ στα ίδια υποκείμενα και υπό τις ίδιες περίπου συνθήκες με το αρχικό, και στη συνέχεια τη δημιουργία συσχέτισης μεταξύ δύο σειρών δεδομένων (τουλάχιστον 1 μήνα μετά το 1, συντελεστής συντελεστής μεγαλύτερος από 0,7).

Αξιοπιστία παράλληλων μορφώνπεριλαμβάνει τη δημιουργία ισοδύναμων μορφών του ερωτηματολογίου και την παρουσίασή τους στα ίδια υποκείμενα προκειμένου στη συνέχεια να αξιολογηθεί η συσχέτιση μεταξύ των αποτελεσμάτων που προέκυψαν (ΔΥΣΚΟΛΙΑ, 2 σετ εργασιών).

Αξιοπιστία εξαρτημάτων δοκιμήςκαθορίζεται με διαίρεση του ερωτηματολογίου σε δύο μέρη (συνήθως ζυγές και περιττές εργασίες), μετά από τα οποία υπολογίζεται η συσχέτιση μεταξύ αυτών των μερών. Συνήθως, αυτή η μέθοδος προσδιορισμού της αξιοπιστίας συνιστάται μόνο σε περιπτώσεις όπου είναι απαραίτητο να επιτευχθούν γρήγορα αποτελέσματα.

Η καλύτερη διαδικασία για τον προσδιορισμό της αξιοπιστίας είναι η διεξαγωγή επαναλαμβανόμενων μελετών σε περισσότερο ή λιγότερο σημαντικά χρονικά διαστήματα.

Όλες οι μελέτες αξιοπιστίας πρέπει να εκτελούνται σε αρκετά μεγάλα (συνιστώνται 200 ή περισσότερα άτομα) και αντιπροσωπευτικά δείγματα. Η αξιοπιστία είναι ένα σημαντικό χαρακτηριστικό μιας δοκιμής, αλλά δεν έχει αξία από μόνη της. Είναι απαραίτητο να επιτευχθεί εγκυρότητα.

7. Εγκυρότητα του τεστ

Το τεστ ονομάζεται έγκυρο, εάν μετρά αυτό που προορίζεται να μετρήσει.

Φαινόμενη εγκυρότητα- περιγράφει την ιδέα του εξεταζόμενου για το τεστ.

Ταυτόχρονη εγκυρότητααξιολογείται από τη συσχέτιση του ανεπτυγμένου τεστ με άλλα, η εγκυρότητα του οποίου σε σχέση με τη μετρούμενη παράμετρο έχει τεκμηριωθεί

Προγνωστική εγκυρότητακαθορίζεται χρησιμοποιώντας μια συσχέτιση μεταξύ των δεικτών δοκιμής και κάποιου κριτηρίου που χαρακτηρίζει την ιδιότητα που μετράται, αλλά σε μεταγενέστερο χρόνο.

Αυξητική εγκυρότηταέχει περιορισμένη αξία και αναφέρεται στην περίπτωση όπου μια δοκιμή σε μια μπαταρία δοκιμών μπορεί να έχει χαμηλή συσχέτιση με ένα κριτήριο αλλά να μην επικαλύπτεται με άλλες δοκιμές σε αυτήν τη μπαταρία. Σε αυτή την περίπτωση, το τεστ έχει αυξητική εγκυρότητα. Αυτό μπορεί να είναι χρήσιμο κατά τη διεξαγωγή επαγγελματικής επιλογής χρησιμοποιώντας ψυχολογικά τεστ.

Διαφορική εγκυρότηταμπορεί να απεικονιστεί χρησιμοποιώντας τεστ ενδιαφέροντος ως παράδειγμα. Τα τεστ ενδιαφέροντος γενικά συσχετίζονται με τις ακαδημαϊκές επιδόσεις, αλλά με διαφορετικούς τρόπους στους κλάδους.

εμπειρικό -υπολογίζεται το μέγεθος της στατιστικής σχέσης μεταξύ των αποτελεσμάτων της εξέτασης των ίδιων υποκειμένων με χρήση αυτής της τεχνικής και των γνωστών τεχνικών που μετρούν αυτήν την ιδιότητα.

Δομική εγκυρότηταΗ δοκιμή αποδεικνύεται περιγράφοντας όσο το δυνατόν πληρέστερα τη μεταβλητή που προορίζεται να μετρήσει η δοκιμή.

κριτήριαλ– ένα ποσοτικό μέτρο της σχέσης μεταξύ των ληφθέντων αποτελεσμάτων των δοκιμών και των εξωτερικών κριτηρίων για την αξιολόγηση της ιδιότητας που διαγιγνώσκεται.

Μια σημαντική διαφορά μεταξύ των ψυχομετρικών τεστ είναι ότι τυποποιημένη, και αυτό σας επιτρέπει να συγκρίνετε τους δείκτες που λαμβάνονται από ένα άτομο με εκείνους του γενικού πληθυσμού ή των αντίστοιχων ομάδων.

Η τυποποίηση των δοκιμών είναι πιο σημαντική σε περιπτώσεις όπου σύγκριση των δεικτών των θεμάτων.

Αυτό εισάγει την έννοια κανόνες ή κανονιστικούς δείκτες.Για να ληφθούν τυπικά πρότυπα, ένας μεγαλύτερος αριθμός θεμάτων πρέπει να επιλεγεί προσεκτικά σύμφωνα με σαφώς καθορισμένα κριτήρια. Κατά τη διαμόρφωση ενός δείγματος τυποποίησης, θα πρέπει να λαμβάνεται υπόψη όγκο και αντιπροσωπευτικότητα.

Σε ορισμένες περιπτώσεις, είναι απαραίτητο να σχηματιστούν πολλές ομάδες τυποποίησης ή να διαστρωθεί η ομάδα τυποποίησης σχετικά με παραμέτρους όπως η ηλικία, το φύλο, η κοινωνική θέση. Ο καθορισμός προτύπων δεν είναι πάντα απαραίτητος. Όταν χρησιμοποιούνται ψυχολογικά τεστ στην επιστημονική έρευνα, οι κανόνες δεν είναι τόσο σημαντικοί και οι «ακατέργαστοι» δείκτες δοκιμών είναι επαρκείς.

Κανόνεςγια κάθε ομάδα πρέπει να παρουσιαστεί σε μέσες τιμές και τυπική απόκλιση.

Σήμερα, στην πράξη, αυτός ο τύπος αξιολόγησης παραγώγων χρησιμοποιείται όλο και περισσότερο, όπως π.χ τυπικούς δείκτες, ικανοποιώντας τις περισσότερες από τις απαιτήσεις για ψυχολογική μέτρηση. Τέτοιοι δείκτες εκφράζουν τη διαφορά μεταξύ του μεμονωμένου αποτελέσματος του θέματος και του μέσου όρου σε μονάδες τυπικής απόκλισης της αντίστοιχης κατανομής.

Η δημιουργία ενός τυποποιημένου τεστ και η δημοσίευσή του συνήθως ολοκληρώνει το έργο ενός ψυχολόγου., ωστόσο, θα πρέπει να θυμόμαστε ότι με την πάροδο του χρόνου, απαιτείται αναθεώρηση (επιθεώρηση) του τεστ.

Κατά τη δημιουργία μιας δοκιμής, μπορείτε να χρησιμοποιήσετε παραγοντική ανάλυσηνα συμπιέσει πληροφορίες ή να περιγράψει συμπαγή τα φαινόμενα που μελετώνται παρουσία πολλών παρατηρήσεων ή μεταβλητών. να βρουν μερικούς θεμελιώδεις παράγοντες που θα εξηγούσαν το μεγαλύτερο μέρος της διακύμανσης σε μια ομάδα βαθμολογιών σε διάφορα τεστ ή άλλα ψυχομετρικά μέτρα.

Υπάρχουν πολλές διαδικασίες ανάλυσης παραγόντων, αλλά όλες περιλαμβάνουν δύο στάδια: 1) παραγοντοποίηση του πίνακα συσχέτισης για να ληφθεί ο αρχικός πίνακας παραγόντων. 2) περιστροφή του πίνακα παραγόντων για να ανακαλύψετε την απλούστερη διαμόρφωση των φορτίων παραγόντων.

Η μετατροπή των ψυχοδιαγνωστικών διαδικασιών και τεχνικών σε ένα αξιόπιστο εργαλείο επιστήμης και πρακτικής εξαρτάται από τις προσπάθειες πολλών ειδικών στον ψυχομετρικό εντοπισμό σφαλμάτων, σχεδιάζοντας τεστ που πληρούν τις βασικές ψυχομετρικές απαιτήσεις: αξιοπιστία, εγκυρότητα, τυποποίηση. Οι βασικές αρχές του ελέγχου και του προσδιορισμού της αξιοπιστίας, κατασκευής και επικύρωσης των ψυχοδιαγνωστικών μεθόδων καλύπτονται σε μια σειρά ειδικών εργασιών για την ψυχοδιαγνωστική (A. Anastasi, A. Bodalsi, V. Stolin, A. Shmelev, K. Gurevich, V. Melnikov , και τα λοιπά.). Σε αυτό το σεμινάριο θα περιγράψουμε τις βασικές έννοιες και αρχές διεξαγωγής μιας ψυχοδιαγνωστικής εξέτασης, η γνώση των οποίων αποτελεί απαραίτητη προϋπόθεση για τα επαγγελματικά προσόντα ενός πρακτικού ψυχολόγου.

Η ψυχοδιαγνωστική ως επιστημονικός κλάδος περιλαμβάνει τρεις τομείς ψυχολογικής γνώσης:

η θεματική περιοχή της ψυχολογίας που μελετά αυτά τα ψυχικά φαινόμενα.

ψυχομετρία - η επιστήμη της μέτρησης των ατομικών διαφορών και των διαγνωστικών μεταβλητών.

την πρακτική χρήση της ψυχολογικής γνώσης με σκοπό την επαρκή ψυχολογική επιρροή και την παροχή βοήθειας στους ανθρώπους να λύσουν τα προβλήματά τους.

Η μεθοδολογική βάση της ψυχοδιαγνωστικής είναι η ψυχομετρία. Αυτή η επιστήμη είναι που αναπτύσσει την τεχνολογία για τη δημιουργία συγκεκριμένων ψυχοδιαγνωστικών τεχνικών και καθορίζει τη μεθοδολογία για τη διασφάλιση των επιστημονικών απαιτήσεων για αυτές:

αξιοπιστία - εσωτερική συνοχή τμημάτων της δοκιμής και επαναληψιμότητα των αποτελεσμάτων κατά τη διάρκεια επαναλαμβανόμενων δοκιμών.

εγκυρότητα – αντανάκλαση στα αποτελέσματα των δοκιμών ακριβώς της ιδιότητας για την οποία προορίζεται να γίνει διάγνωση·

αξιοπιστία - προστασία του τεστ από την επίδραση στα αποτελέσματα της επιθυμίας του εξεταζόμενου να τα αλλάξει προς την επιθυμητή κατεύθυνση.

αντιπροσωπευτικότητα - η παρουσία κανόνων για τα αποτελέσματα μιας μαζικής έρευνας στον πληθυσμό για τον οποίο έχει σχεδιαστεί το τεστ, επιτρέποντας σε κάποιον να εκτιμήσει τον βαθμό απόκλισης από τις μέσες τιμές οποιουδήποτε μεμονωμένου δείκτη.

Αυτές οι ψυχομετρικές απαιτήσεις ισχύουν για διαφορετικές ομάδες τεστ, με τον μεγαλύτερο βαθμό σε αντικειμενικά τεστ και ερωτηματολόγια προσωπικότητας και στο μικρότερο βαθμό σε προβολικές τεχνικές.

Η αντικειμενική αξιολόγηση των ψυχολογικών τεχνικών και τεστ σημαίνει τον προσδιορισμό της αξιοπιστίας τους. Στην ψυχομετρία, ο όρος «αξιοπιστία» αναφέρεται πάντα στη συνέπεια των βαθμολογιών που λαμβάνονται από τα ίδια θέματα.

Πόσο χρήσιμο είναι αυτό το τεστ; Εκπληρώνει πραγματικά τις λειτουργίες του; Αυτές οι ερωτήσεις μπορούν και μερικές φορές προκαλούν μακροχρόνιες, άκαρπες συζητήσεις. Οι προκαταλήψεις, τα υποκειμενικά συμπεράσματα και οι προσωπικές προκαταλήψεις οδηγούν, όπως πιστεύει η Α. Αναστάση, αφενός σε υπερεκτίμηση των δυνατοτήτων ενός συγκεκριμένου τεστ και αφετέρου στην επίμονη απόρριψή του. Ο μόνος τρόπος να απαντηθούν τέτοιες ερωτήσεις είναι μέσω εμπειρικών δοκιμών. Αντικειμενική αξιολόγησηΤα ψυχολογικά τεστ σημαίνει πρώτα απ' όλα τον προσδιορισμό της αξιοπιστίας και της εγκυρότητάς τους σε συγκεκριμένες καταστάσεις.

Δοκιμή αξιοπιστίαςυπάρχει συνέπεια στις βαθμολογίες που λαμβάνονται από τα ίδια θέματα όταν επανεξετάζονται με το ίδιο τεστ ή με ισοδύναμο έντυπο.

Εάν το IQ ενός παιδιού είναι 110 τη Δευτέρα και 80 την Παρασκευή, τότε είναι προφανές ότι αυτός ο δείκτης δύσκολα μπορεί να ληφθεί με σιγουριά. Ομοίως, εάν ένα άτομο προσδιόρισε σωστά 40 λέξεις σε μια σειρά 50 λέξεων και 20 σε μια άλλη θεωρούμενη ισοδύναμη σειρά, τότε κανένας από αυτούς τους δείκτες δεν μπορεί να θεωρηθεί ως μέτρο της λεκτικής κατανόησής του. Φυσικά, και στα δύο παραδείγματα είναι πιθανό μόνο ένας από τους δύο δείκτες να είναι λανθασμένος, αλλά μόνο οι επόμενες δοκιμές μπορούν να το επιβεβαιώσουν. Από τα δεδομένα που παρουσιάζονται, προκύπτει μόνο ότι οι δείκτες μαζί δεν μπορούν να είναι σωστοί.

Προτού διατεθεί στο κοινό ένα ψυχολογικό τεστ, πρέπει να διενεργηθεί ενδελεχής, αντικειμενικός έλεγχος της αξιοπιστίας του. Η αξιοπιστία μπορεί να ελεγχθεί σε σχέση με τις αλλαγές με την πάροδο του χρόνου, την επιλογή συγκεκριμένων εργασιών ή δειγμάτων δοκιμής, την προσωπικότητα του πειραματιστή ή του επεξεργαστή δοκιμής και άλλες πτυχές της δοκιμής. Είναι πολύ σημαντικό να προσδιορίσετε ακριβώς το είδος της αξιοπιστίας και τον τρόπο με τον οποίο προσδιορίζεται, καθώς το ίδιο τεστ μπορεί να διαφέρει σε διαφορετικές πτυχές. Συνιστάται επίσης να έχετε πληροφορίες σχετικά με τον αριθμό και τα χαρακτηριστικά των ατόμων στα οποία ελέγχθηκε η αξιοπιστία του τεστ.

Αυτές οι πληροφορίες θα επιτρέψουν στο χρήστη της δοκιμής να αποφασίσει πόσο αξιόπιστο είναι το τεστ για την ομάδα στην οποία σκοπεύει να την εφαρμόσει.

Την πληρέστερη εξήγηση για την αξιοπιστία των μεθόδων δοκιμής δίνει η Α. Αναστάση. Η αξιοπιστία αναφέρεται στη συνέπεια των αποτελεσμάτων των εξετάσεων που λαμβάνονται όταν επαναλαμβάνεται στα ίδια θέματα σε διαφορετικά χρονικά σημεία, χρησιμοποιώντας διαφορετικά σύνολα ισοδύναμων εργασιών ή όταν αλλάζουν άλλες συνθήκες εξέτασης. Ο υπολογισμός βασίζεται στην αξιοπιστία λάθη μέτρησης,που χρησιμεύει για να υποδείξει τα πιθανά όρια διακυμάνσεων της μετρούμενης ποσότητας που προκύπτουν υπό την επίδραση εξωγενών τυχαίων παραγόντων. Με την ευρεία της έννοια, η αξιοπιστία αναφέρεται στον βαθμό στον οποίο οι επιμέρους διαφορές στις βαθμολογίες των τεστ αποδεικνύονται «αληθινές» και στον βαθμό στον οποίο μπορούν να αποδοθούν σε τυχαία σφάλματα. Εάν το μεταφράσουμε στη γλώσσα των ειδικών όρων, τότε η μέτρηση της αξιοπιστίας μιας δοκιμής μας επιτρέπει να εκτιμήσουμε την τιμή της συνολικής διασποράς των δεικτών δοκιμής, η οποία είναι διακύμανση σφάλματος.Το ερώτημα, ωστόσο, είναι τι θα μετρηθεί ως διακύμανση σφάλματος. Οι ίδιοι παράγοντες, που είναι ξένοι σε σχέση με ορισμένα προβλήματα, θεωρούνται ήδη πηγές «αληθινών» διαφορών κατά την επίλυση άλλων προβλημάτων. Για παράδειγμα, εάν μας ενδιαφέρουν οι εναλλαγές της διάθεσης, τότε οι καθημερινές αλλαγές στις βαθμολογίες του τεστ συναισθηματικής κατάστασης θα μπορούσαν να σχετίζονται με τον σκοπό του τεστ και επομένως με την πραγματική διακύμανση των βαθμολογιών. Αλλά εάν το τεστ έχει σχεδιαστεί για να μετρήσει πιο σταθερά χαρακτηριστικά προσωπικότητας, τότε οι ίδιες ημερήσιες διακυμάνσεις μπορούν να αποδοθούν στη διακύμανση σφαλμάτων.

Το σημαντικό είναι ότι τυχόν αλλαγές στις συνθήκες υπό τις οποίες διεξάγεται το τεστ, εάν δεν σχετίζονται με τον σκοπό του, θα αυξήσουν τη διακύμανση του σφάλματος. Επομένως, τηρώντας ομοιόμορφες συνθήκες δοκιμής (έλεγχος του γενικού περιβάλλοντος, χρονικοί περιορισμοί, οδηγίες προς το υποκείμενο, επαφή μαζί του και άλλοι παρόμοιοι παράγοντες), ο πειραματιστής μειώνει τη διακύμανση σφάλματος και αυξάνει την αξιοπιστία του τεστ. Αλλά ακόμη και υπό βέλτιστες συνθήκες, κανένα τεστ δεν είναι απολύτως αξιόπιστο εργαλείο. Επομένως, ένα τυπικό σύνολο δεδομένων δοκιμής θα πρέπει να περιλαμβάνει ένα μέτρο αξιοπιστίας. Αυτό το μέτρο χαρακτηρίζει το τεστ όταν χορηγείται υπό τυπικές συνθήκες και χορηγείται σε άτομα παρόμοια με αυτά που συμμετείχαν στο κανονιστικό δείγμα. Ως εκ τούτου, είναι επίσης απαραίτητο να παρέχονται πληροφορίες σχετικά με αυτό το δείγμα.

Ο K. M. Gurevich ορίζει την αξιοπιστία ως «μια εξαιρετικά περίπλοκη και πολύπλευρη έννοια, μία από τις κύριες λειτουργίες της οποίας είναι η αξιολόγηση της συνέπειας των δεικτών απόδοσης των δοκιμών» [Gurevich, 1981].

Κατ' αρχήν, μπορούμε να πούμε ότι η αξιοπιστία πρέπει να δικαιολογεί το σφάλμα μέτρησης - θα πρέπει να δείχνει πόσο μεγάλο μέρος της μεταβλητότητας των μετρήσεων οφείλεται σε σφάλμα. Υπάρχουν διάφοροι κύριοι παράγοντες που καθορίζουν το επίπεδο αξιοπιστίας. Έτσι, η αξιοπιστία θα τείνει πάντα να αυξάνεται εάν οι συνθήκες της διαδικασίας δοκιμής διατηρούνται σταθερές, καθώς αυτό μειώνει το σφάλμα μεταβλητότητας της μετρούμενης παραμέτρου. Ταυτόχρονα, η πολλαπλότητα των στόχων, η πολυπλοκότητα του προβλήματος και η μεταβλητότητα των καταστάσεων τείνουν να αυξάνουν τα σφάλματα μέτρησης, μειώνοντας έτσι την αξιοπιστία.

Υπάρχουν τόσες ποικιλίες αξιοπιστίας δοκιμών όσες και οι συνθήκες που επηρεάζουν τα αποτελέσματα των δοκιμών, επομένως οποιεσδήποτε τέτοιες συνθήκες μπορεί να αποδειχθούν ξένες προς το σκοπό και στη συνέχεια

η διακύμανση που προκαλείται από αυτά θα πρέπει να περιλαμβάνεται στη διακύμανση σφάλματος. Ωστόσο, μόνο λίγοι τύποι αξιοπιστίας βρίσκουν πρακτική εφαρμογή. Δεδομένου ότι όλοι οι τύποι αξιοπιστίας αντικατοπτρίζουν τον βαθμό συνέπειας ή συνέπειας δύο σειρών δεικτών που λαμβάνονται ανεξάρτητα, η μέτρησή τους μπορεί να συντελεστής συσχέτισης.Μια πιο εξειδικευμένη συζήτηση της συσχέτισης με μια λεπτομερή περιγραφή των υπολογιστικών διαδικασιών δίνεται σε εγχειρίδια στατιστικής για δασκάλους και ψυχολόγους (V. Avanesov, A. Gusev, Ch. Izmailov, M. Mikhalevskaya, κ.λπ.).

Στην πράξη, τρεις κύριες μέθοδοι χρησιμοποιούνται για την αξιολόγηση της αξιοπιστίας των δοκιμών:

1) επανέλεγχος.

2) παράλληλη δοκιμή?

3) μέθοδος διαχωρισμού.

Ας εξετάσουμε το καθένα ξεχωριστά.

Επανάληψη δοκιμήςΕίναι μια από τις κύριες μεθόδους μέτρησης της αξιοπιστίας. Αλλεπάλληλος

Η δοκιμή ενός δείγματος υποκειμένων πραγματοποιείται με την ίδια δοκιμασία μετά από ορισμένο χρονικό διάστημα υπό τις ίδιες συνθήκες. Ο επανέλεγχος συνήθως ονομάζεται επανέλεγχο,και η αξιοπιστία που μετράται με αυτόν τον τρόπο είναι αξιοπιστία δοκιμής-επανεξέτασης.Το σχήμα αξιολόγησης αξιοπιστίας δοκιμής-επανεξέτασης μοιάζει με αυτό:

Στην περίπτωση αυτή, ως δείκτης αξιοπιστίας λαμβάνεται ο συντελεστής συσχέτισης μεταξύ των αποτελεσμάτων δύο δοκιμών.

Η μέθοδος επαναλαμβανόμενων δοκιμών έχει τόσο πλεονεκτήματα όσο και μειονεκτήματα. Τα πλεονεκτήματα περιλαμβάνουν τη φυσικότητα και την απλότητα του προσδιορισμού του συντελεστή αξιοπιστίας. Τα μειονεκτήματα περιλαμβάνουν την αβεβαιότητα στην επιλογή του διαστήματος μεταξύ δύο μετρήσεων. Η εμφάνιση προσωρινής αβεβαιότητας οφείλεται στο γεγονός ότι ο επαναληπτικός έλεγχος διαφέρει από τον αρχικό. Τα υποκείμενα είναι ήδη εξοικειωμένα με το περιεχόμενο του τεστ, θυμούνται τις αρχικές τους απαντήσεις και καθοδηγούνται από αυτές κατά την επανάληψη του τεστ. Επομένως, κατά τη διάρκεια των επαναλαμβανόμενων δοκιμών, συχνά παρατηρείται είτε «προσαρμογή» στα αρχικά αποτελέσματα, ή, ως συνέπεια αρνητισμού, η επίδειξη «νέων» αποτελεσμάτων. Για να αποφευχθεί αυτό, όταν δίνετε αξιοπιστία δοκιμής-επανεξέτασης στο εγχειρίδιο δοκιμής, θα πρέπει να υποδείξετε σε ποιο χρονικό διάστημα αντιστοιχεί. Λόγω του γεγονότος ότι η αξιοπιστία δοκιμής-επανεξέτασης μειώνεται με την αύξηση του χρονικού διαστήματος, οι πιο αξιόπιστοι είναι οι υψηλοί συντελεστές αξιοπιστίας που λαμβάνονται με σαφώς μεγάλα διαστήματα μεταξύ των δοκιμών. Οι ανεπαρκώς υψηλοί συντελεστές αξιοπιστίας μπορεί να είναι συνέπεια του μη βέλτιστου προσδιορισμού των χρονικών διαστημάτων.

Παράλληλη δοκιμήΣε αυτήν την περίπτωση, οργανώνονται πολλαπλές μετρήσεις χρησιμοποιώντας παράλληλες ή ισοδύναμες δοκιμές. Τα παράλληλα τεστ είναι τεστ που μετρούν την ίδια νοητική ιδιότητα με το ίδιο σφάλμα. Σε αυτήν την περίπτωση, τα ίδια άτομα εκτελούν πολλαπλές εκδόσεις του ίδιου τεστ ή ισοδύναμων δοκιμών. Κατά κανόνα, η πρακτική χρήση αυτού του τύπου αξιοπιστίας συνδέεται με σημαντικές δυσκολίες, καθώς είναι εξαιρετικά δύσκολο να κατασκευαστούν πολλές εκδόσεις ενός τεστ με τέτοιο τρόπο ώστε το υποκείμενο να μην μπορεί να εντοπίσει την ψυχολογική τους ομοιογένεια. Και η παραμορφωτική επίδραση της προπόνησης σε αυτή την περίπτωση δεν εξαλείφεται εντελώς. Επιπλέον, τίθεται το ερώτημα: οι εναλλακτικοί τύποι αξιοπιστίας είναι χαρακτηριστικά αξιοπιστίας δοκιμής και όχι παράμετροι ισοδυναμίας δοκιμής; Εξάλλου, εάν δύο μορφές δοκιμών πραγματοποιούνται υπό τον ίδιο τύπο σταθερών συνθηκών, τότε, πιθανότατα, μελετώνται οι δείκτες ισοδυναμίας των δύο μορφών δοκιμών και όχι οι δείκτες αξιοπιστίας των ίδιων των δοκιμών. Το σφάλμα μέτρησης σε αυτή την περίπτωση καθορίζεται από διακυμάνσεις στην εκτέλεση της δοκιμής και όχι από διακυμάνσεις στη δομή της δοκιμής.

Το σχήμα για τη χρήση παράλληλων δοκιμών για τη μέτρηση της αξιοπιστίας έχει ως εξής:

Ο συντελεστής συσχέτισης που υπολογίζεται μεταξύ δύο δοκιμών ονομάζεται ισοδύναμη αξιοπιστία.

Μέθοδος διάσπασηςΕίναι μια ανάπτυξη της μεθόδου παράλληλων δοκιμών και βασίζεται στην παραδοχή του παραλληλισμού όχι μόνο των επιμέρους εντύπων δοκιμής, αλλά και των επιμέρους εργασιών σε ένα τεστ. Αυτό είναι ένα από τα απλούστερα τεστ ενός τεστ, όταν υπολογίζεται ο συντελεστής συσχέτισης μεταξύ των μισών του. Πώς να χωρίσετε το τεστ σε δύο μισά για να μπορέσετε να ευθυγραμμίσετε και τα δύο μισά σε μία ή την άλλη συγκεκριμένη βάση; Τις περισσότερες φορές, οι δοκιμαστικές εργασίες χωρίζονται σε ζυγές και περιττές, γεγονός που επιτρέπει σε κάποιο βαθμό την εξάλειψη πιθανών ελλείψεων. Το κύριο πλεονέκτημα αυτού του τύπου αξιοπιστίας είναι η ανεξαρτησία των αποτελεσμάτων των δοκιμών από στοιχεία δραστηριότητας όπως η ανάπτυξη, η εκπαίδευση, η εξάσκηση, η κόπωση κ.λπ. Κατά τη διαίρεση της δοκιμής σε δύο μέρη, ο δείκτης αξιοπιστίας υπολογίζεται χρησιμοποιώντας τον τύπο Spearman-Brown, ο οποίος τον πρότεινε ανεξάρτητα το ένα από το άλλο. Τα άρθρα τους δημοσιεύτηκαν στο ίδιο τεύχος ψυχολογικού περιοδικού με συμπεράσματα και τύπους [Avanesov , 1982]. Στη φόρμουλα τους

R(x, 0=2 RJ\ + R, y

όπου R είναι ο συντελεστής συσχέτισης των δύο μισών του τεστ. Ο μέσος συντελεστής συσχέτισης όλων των στοιχείων δοκιμής ή ο μέσος συντελεστής προσδιορισμού θεωρείται ως συντελεστής δείκτη αξιοπιστίας.

Μέχρι στιγμής, έχουμε εξετάσει τρεις εμπειρικές μεθόδους για την αξιολόγηση της αξιοπιστίας του τεστ: επανέλεγχο με το ίδιο τεστ, επανέλεγχο με μια παράλληλη μορφή του τεστ και διαχωρισμό του τεστ.

Ποια από αυτές τις μεθόδους παρέχει μια πραγματική εκτίμηση της αξιοπιστίας του τεστ; Ποια μέθοδο πρέπει να χρησιμοποιήσετε; Η απάντηση σε αυτό το ερώτημα εξαρτάται από τις προσωπικές προτιμήσεις και τους στόχους της μελέτης.

Όταν χρησιμοποιούμε τη μέθοδο επαναλαμβανόμενων δοκιμών, λαμβάνουμε αξιολόγηση του βαθμού σταθερότητας των αποτελεσμάτων με την πάροδο του χρόνου και ανάλογα με τις συνθήκες δοκιμής. Ως εκ τούτου, ονομάζεται επίσης ο συντελεστής αξιοπιστίας δοκιμής-επανάληψης δοκιμής συντελεστής σταθερότηταςή σταθερότηταδοκιμή. Κατά τη χρήση της μεθόδου παράλληλων μορφών και της μεθόδου διαχωρισμού, αξιολογείται ο βαθμός αμοιβαίας συνέπειας των εξαρτημάτων δοκιμής. Επομένως, οι συντελεστές αξιοπιστίας που λαμβάνονται με αυτές τις δύο μεθόδους ερμηνεύονται ως ταλαντευόμενοι και ομοιογένεια, ομοιογένειαδοκιμές.

Εκτός από τους δείκτες σταθερότητας και ομοιογένειας, ο R. B. Cattell θεωρεί απαραίτητο να ληφθεί υπόψη ο δείκτης δυνατότητα μεταφοράς.Είναι μια αξιολόγηση της ικανότητας ενός τεστ να διατηρεί την ακρίβεια μέτρησης σε διαφορετικά δείγματα, υποκαλλιέργειες και πληθυσμούς. Μαζί, η σταθερότητα, η ομοιογένεια και η φορητότητα αποτελούν ένα σύνθετο χαρακτηριστικό της αξιοπιστίας, το οποίο ο R. B. Cattell αποκαλεί συνοχήκαι το ορίζει ως «ο βαθμός στον οποίο ένα τεστ συνεχίζει να προβλέπει αυτό που κάποτε προέβλεψε παρά τις αλλαγές (εντός ορισμένων ορίων): α) τον βαθμό στον οποίο εφαρμόζεται το τεστ. β) τις συνθήκες υπό τις οποίες χρησιμοποιήθηκε· γ) τη σύνθεση του δείγματος στο οποίο εφαρμόζεται.»

Τέλος, υπάρχει ένας τύπος αξιοπιστίας που σχετίζεται άμεσα με την αξιοπιστία του ατόμου που κάνει το τεστ. Μια εκτίμηση της αξιοπιστίας του ατόμου που χορηγεί το τεστ λαμβάνεται με ανεξάρτητη προσομοίωση του τεστ από δύο διαφορετικούς πειραματιστές.

Η αξιοπιστία των αποτελεσμάτων της δοκιμής δεν εξαρτάται μόνο από την αξιοπιστία της ίδιας της δοκιμής και τη διαδικασία διεξαγωγής της. Ένας σημαντικός παράγοντας που επηρεάζει τα αποτελέσματα της ερμηνείας των δεδομένων είναι η ειδικότητα ενός συγκεκριμένου δείγματος. Τα πιο σημαντικά χαρακτηριστικά του δείγματος, από αυτή την άποψη, θα πρέπει να αναγνωριστούν ως κοινωνικο-ψυχολογική ομοιογένεια σε διάφορες παραμέτρους. λαμβάνονται επίσης υπόψη η ηλικία και το φύλο.

Ο A.G. Shmelev προτείνει να πραγματοποιηθεί η ακολουθία ενεργειών κατά τον έλεγχο της αξιοπιστίας ως εξής [General psychodiagnostics, 1987]:

1. Μάθετε εάν υπάρχουν δεδομένα για την αξιοπιστία του τεστ που προτείνεται για χρήση, για ποιο πληθυσμό και σε ποια διαγνωστική κατάσταση δοκιμάστηκε. Εάν δεν έγινε έλεγχος ή εάν τα χαρακτηριστικά του νέου πληθυσμού και των καταστάσεων είναι σαφώς συγκεκριμένα, ελέγξτε ξανά την αξιοπιστία λαμβάνοντας υπόψη τις επιλογές που αναφέρονται παρακάτω.

2. Εάν το επιτρέπουν οι ευκαιρίες, δοκιμάστε ξανά σε ολόκληρο το δείγμα τυποποίησης και υπολογίστε όλους τους συντελεστές που δίνονται τόσο για ολόκληρη τη δοκιμή όσο και για μεμονωμένα στοιχεία. Η ανάλυση των λαμβανόμενων συντελεστών θα βοηθήσει να κατανοήσουμε πόσο αμελητέο είναι το σφάλμα μέτρησης.

3. Εάν οι δυνατότητες είναι περιορισμένες, επαναλάβετε τη δοκιμή μόνο σε μέρος του δείγματος (τουλάχιστον 30 άτομα), υπολογίστε χειροκίνητα τη συσχέτιση κατάταξης για να αξιολογήσετε την εσωτερική

συνοχή (με μέθοδο διαχωρισμού) και σταθερότητα ολόκληρης της δοκιμής.

Φυσικά, οι θεωρούμενες έννοιες της ψυχοδιαγνωστικής είναι τα σημαντικότερα χαρακτηριστικά της. Ωστόσο, οι δείκτες υψηλής αξιοπιστίας από μόνοι τους δεν καθορίζουν την πρακτική αξία της δοκιμής. Ο κύριος παράγοντας που σας επιτρέπει να μετρήσετε τα στοχευόμενα αποτελέσματα των ψυχολογικών τεστ είναι η εγκυρότητα.