Welche Arten der Validierung gibt es? Was ist das? Antworten auf diese und weitere Fragen finden Sie im Artikel. Validität ist an sich ein einzelnes Merkmal, das einerseits Angaben dazu enthält, ob die Technologie geeignet ist, zu messen, wofür sie entwickelt wurde, und andererseits, was ihre Wirksamkeit, ihr praktischer Nutzen, ihre Effizienz ist. Die Überprüfung der Gültigkeit einer Technologie wird als Validierung bezeichnet. Wir werden es weiter unten genauer betrachten.
Aufrufe
Viele Leute fragen: "Was ist Validierung?" Es wird gesagt, dass der verfeinerte Geist keine Grenzen kennt. Methodologen scheinen miteinander zu konkurrieren, wer mehr Arten und Arten von Validität entdecken oder erfinden wird. Was für Namen sind in letzter Zeit nicht entstanden! Es stellt sich heraus, dass es Folgendes gibt:
- externe und interne Validität;
- konvergent;
- Diskriminanz;
- offensichtlich;
- faktoriell;
- voraussagend;
- konstruktiv;
- Kriterium;
- sinnvoll und so weiter.
Es gibt keine Möglichkeit zu verstehen, und noch mehr, eine Variation vernünftig von einer anderen zu unterscheiden. Verwirrung bei Definitionen und Klassifikationen führt dazu, dass unterschiedliche Autoren ganz unterschiedliche Verbesserungsmöglichkeiten auf dieselbe Validitätsform zurückführen.
Externe Kriterien
Um die pragmatische Validierung der Methodik durchzuführen, dh um ihre praktische Bedeutung, Effektivität und Effizienz zu bewerten, wird normalerweise ein externes unabhängiges Kriterium verwendet - ein Indikator für die Qualität, die im Alltag untersucht wird. Ein solches Kriterium können sowohl Produktionsleistungen (für Technologien mit beruflicher Ausrichtung) als auch akademische Leistungen (für Intelligenz-, Leistungs- oder Lernfähigkeitstests) und die Wirksamkeit tatsächlicher Aktivitäten sein - Modellieren, Zeichnen usw. (für Tests von besondere Fähigkeiten), persönliche Assessments (zur Identitätsprüfung).
Typen externer Validierungskriterien sind wie folgt:
- Leistungsmaße (dazu können z. B. der Umfang der durchgeführten Arbeit, die für die Ausbildung aufgewendete Zeit, die akademische Leistung, die Wachstumsrate der Qualifikationen und dergleichen gehören);
- physiologische Zeichen (werden verwendet, wenn die Auswirkungen der Umwelt und anderer situationsbedingter Variablen auf die menschliche Psyche und den Körper untersucht werden);
- Blutdruck, Pulsfrequenz, Ermüdungserscheinungen, elektrischer Hautwiderstand und so weiter werden gemessenweiter;
- subjektive Maße (umfassen verschiedene Arten von Antworten, die die Einstellung einer Person zu jemandem oder etwas, ihre Ansichten, Meinungen, Vorlieben widerspiegeln; in der Regel werden solche Maße mithilfe von Fragebögen, Fragebögen, Interviews erhoben);
- Unfallzeichen (wird verwendet, wenn der Zweck der Studie beispielsweise das Problem betrifft, weniger unfallgefährdete Personen für die Arbeit auszuwählen).
Empirische Gültigkeit. Worum geht es?
Nur wenige Menschen wissen, was empirische Validierung ist. Bei der Inh altsvalidität wird der Test durch Experten evaluiert (Feststellung der Übereinstimmung der Testaufgaben mit den Inh alten des Messgegenstandes). Und der empirische wird immer anhand der statistischen Korrelation gemessen: Die Korrelation zweier Arten von Werten wird berechnet - Testergebnisse und Indizes für einen externen Parameter, der als Zuverlässigkeitskriterium ausgewählt wurde.
Konstruktiv
Nicht jeder kennt die Arten von Validierungsmethoden. Was ist Konstruktvalidität? Es hat mit dem theoretischen Konstrukt selbst zu tun und besteht darin, nach Faktoren zu suchen, die das Testleistungsverh alten erklären.
Als spezifischer Typ wird Konstruktvalidität in einem Artikel von Mil und Cronbach (1955) legitimiert. Mit dieser Form der Validität werteten die Autoren alle Testerhebungen aus, die nicht direkt darauf abzielten, einige signifikante Kriterien vorherzusagen. Die Forschung enthielt Informationen über psychologische Konstrukte.
Inh altsgültigkeit
Du immer nochSie fragen: "Validierung - was ist das." Berücksichtigen Sie die Inh altsvalidität. Es erfordert, dass jedes Problem, jede Frage oder Aufgabe, die zu einem bestimmten Bereich gehört, eine identische Chance hat, ein Testelement zu werden.
Content Validity bewertet die Eignung der Testinstanz für den gemessenen Verh altensbereich. Verifizierungen, die von zwei Gruppen von Entwicklern erstellt werden, werden an einer Stichprobe der zu überprüfenden durchgeführt. Die Zuverlässigkeit von Tests wird berechnet, indem die Fragen in zwei Bereiche aufgeteilt werden, was zu einem Index der Inh altsvalidität führt.
Vorhersage
Wir prüfen weiterhin Validierungsmethoden. Die Vorhersagevalidität wird auch durch ein externes, ziemlich zuverlässiges Kriterium festgelegt. Aber einige Zeit nach der Überprüfung werden Informationen über ihn gesammelt.
Externer Maßstab ist in der Regel die in jeder Beurteilung ausgewiesene Berufung einer Person für die Art des Berufes, für den sie aufgrund der Ergebnisse diagnostischer Tests ausgewählt wurde.
Obwohl diese Methode am besten für die Aufgabe von Diagnosewerkzeugen geeignet ist - die Vorhersage des zukünftigen Erfolgs -, ist sie sehr schwierig anzuwenden. Die Genauigkeit der Vorhersage ist umgekehrt abhängig von der für eine solche Vorhersage zugewiesenen Zeit. Je mehr Zeit nach der Messung vergeht, desto mehr Faktoren müssen bei der Bewertung des Vorhersagewerts der Technologie berücksichtigt werden. Es ist jedoch fast unmöglich, alle Faktoren zu berücksichtigen, die die Vorhersage beeinflussen.
Rückblick
Einverstanden, die Validierung ist ein sehr komplizierter Prozess. Es ist bekannt, dass die retrospektive Gültigkeit auf der Grundlage des Kriteriums offenbart wird,den Zustand einer Qualität oder eines Ereignisses in der Vergangenheit widerspiegeln. Kann verwendet werden, um sofort prädiktive Technologiequellen zu erh alten. Um also zu revidieren, inwieweit gute Ergebnisse eines Fertigkeitstests einem schnellen Lernen entsprechen, kann man derzeit bei Personen mit niedrigen und hohen diagnostischen Indizes frühere Expertenmeinungen, Leistungsbeurteilungen usw. vergleichen.
Diskriminanz und Konvergenz
Validierungsarten sind für viele von Interesse. Lassen Sie uns herausfinden, was Diskriminanz- und Konvergenzvalidität sind. Die Strategie, etablierte Items in den Test einzuführen, hängt davon ab, wie der Psychologe das diagnostische Konstrukt aufdeckt. Wenn Eysenck die Eigenschaft „Neurotizismus“unabhängig von Introversion-Extroversion definiert, dann bedeutet dies, dass sein Fragebogen gleichermaßen Positionen repräsentieren soll, die von neurotischen Extrovertierten und Introvertierten bestätigt werden.
Wenn sich in der Praxis herausstellt, dass sich die Items aus dem Quadranten „Introversion-Neurotizismus“in der Aufgabe durchsetzen, dann bedeutet dies aus Sicht der Eysenckschen Theorie, dass der Indikator „Neurotizismus“mit einem irrelevanten Indikator aufgeladen ist - "Introvertiertheit". Ein identischer Effekt tritt auf, wenn es eine Verzerrung in der Stichprobe gibt – wenn es mehr neurotische Introvertierte als dieselben Extravertierten gibt.
Um solche Komplexitäten zu vermeiden, sind Psychologen bereit, sich mit empirischen Items zu befassen, die nur über einen einzigen Faktor informieren. Aber in Wirklichkeit ist diese Anforderung nie erfüllt: Jeder empirische Index erweist sich als bestimmt nichtnur durch den Faktor, den wir brauchen, sondern auch durch andere - irrelevant für das Messproblem.
Daher ist der Testersteller bei Faktoren, die konzeptionell als orthogonal zum Gemessenen definiert sind (und damit in allen Kombinationen auftreten), verpflichtet, bei der Auswahl der Items die Strategie des unauthentischen Abwägens anzuwenden.
Die Übereinstimmung der Punkte mit dem gemessenen Indikator garantiert die konvergente Validität des Tests. Die Konsistenz von Items in Bezug auf irrelevante Quellen liefert diskriminierende Validität. Empirisch manifestiert es sich im Fehlen einer signifikanten Korrelation mit dem Test, der die konzeptionell einzigartige Qualität misst.
Werkzeugkasten
In den allgemeinen Validierungsmethoden enth alten die Autoren normalerweise:
- nicht-formalisiert (von einfachen Tricks zur sorgfältigen Überprüfung der Liste der Alternativen im Fragebogen bis hin zu ausgefeilteren Verfahren für die theoretische Schritt-für-Schritt-Analyse);
- formalisiert, die Verfahren und Techniken der mathematischen Statistik umfassen: Testen statistischer Hypothesen, Berechnung von Schätzungen, Korrelationsanalyse, Konstruktion von Konfidenzintervallen, Bewertung von Beziehungen zwischen Variablen, Streuungs-, Fakultäts-, Regressions- und Strukturanalysen usw ein.
Erstellungswerkzeuge
Und doch, was ist Validierung? Ausgefeilte Validierungswerkzeuge wurden zuerst von Psychologen entwickelt. Bereits 1959 wurde von D. Fiske und D. Campbell (USA) eine spezielle Technik entwickelt. Sie erhielt ein völlig natürliches Englisch, aber nicht übersetzbarunsere Sprache, Name: Multi-Method-Multi-Damn-Matrix (MTMM). Diese Matrix war eine Korrelationstabelle. Es bestand aus zwei sehr attraktiven Erfindungen, von denen eine dazu bestimmt war, konvergente Wahrheit zu enthüllen, und die andere für diskriminierende Wahrheit.
Ihre Autoren argumentierten, dass jeder die interne Akzeptanz beweisen kann, wenn:
- Werte, zwischen denen ein hoher theoretischer Zusammenhang angenommen wird, finden in der Empirie eine identische Ebene (Konvergenz);
- Werte, die theoretisch keinen Zusammenhang haben, werden sich nach der Durchführung des Tests als empirisch ohne Zusammenhang herausstellen (Diskriminierung).
Grob gesagt sollte die konvergente Validität aussagen, dass zwischen zwei Mitarbeiterteams, beispielsweise Bauarbeitern und Fließbandarbeitern, in Bezug auf die Chancen auf dem Arbeitsmarkt viel mehr Ähnlichkeit besteht als zwischen Eigentümern und Mitarbeitern. Wenn der theoretisch beabsichtigte Zusammenhang empirisch gefunden wird, ist Ihre Stichprobe valide.
Diskriminanzvalidität zeigt den Grad der Identifizierung verschiedener Phänomene. Um das gleiche Beispiel des Arbeitsmarktes zu nehmen, würde man erwarten, dass eine wohlgeformte Theorie mit ihrer Hilfe zwischen den Chancen von Eigentümern und Arbeitnehmern auf dem Arbeitsmarkt unterscheiden könnte. Du kannst sie nicht verwirren, und deine Theorie kann sie unterscheiden.
Wenn Sie eine Skala erstellt haben, die mathematische Fähigkeiten misst, dann sollten im Falle der Gültigkeit der konvergenten Indizes mathematischer Talente gut mit den allgemeinen Fähigkeiten einer Person korrelieren, wenn auf theoretischer Ebene eine solche Beziehung bestehtes gibt und zwar schlecht - mit ästhetischen Fähigkeiten, die einem Menschen ganz andere Begabungen abverlangen als Zählfähigkeiten, wenn natürlich von Ihrer Theorie eine geringe Korrelation proklamiert wird.
Typen
Validierung ist der Prozess der Abstimmung, Verbesserung der erstellten psychodiagnostischen Methoden. Seine grundlegende Aufgabe besteht darin, sicherzustellen, dass die Technologie genau das diagnostiziert, was der Entwickler benötigt. Dabei wird zwischen theoretischer und pragmatischer Validierung unterschieden.
Für den ersten Typ ist das Kardinalproblem die Beziehung zwischen mentalen Phänomenen und ihren Indizes, mit deren Hilfe diese Phänomene erkannt werden sollen. Es zeigt, dass die Ergebnisse der Methodik und die abstrakte Intention des Autors übereinstimmen.
Um eine abstrakte Validität zu etablieren, ist es sehr schwierig, ein unabhängiges Kriterium zu finden, das außerhalb der Methodik liegt. In der Geschichte der Psychodiagnostik in den frühen Stadien verließ man sich daher auf das instinktive Konzept, das der Test misst:
- Eine Methode g alt als gültig, wenn sie einfach "offensichtlich" war.
- Der Gültigkeitsnachweis basierte auf der Überzeugung des Prospektors, dass seine Technologie "den Testee verstehen" könne.
- Das Schema wurde nur als gültig angesehen, weil die Theorie hinter der Technologie "ziemlich gut" war.
Als nächstes begann die Suche nach wissenschaftlich begründeten Beweisen. Anzumerken ist hier, dass die unmerkliche Anhäufung eines Arsenals von Technologien mit einem bereits begründeten und bekanntenGültigkeit. Wenn ein Psychodiagnostiker ein Schema zur Bewertung einer Qualität erstellt und bekannt ist, dass andere, gültige Technologien auf die gleiche Bewertung abzielen, können Sie die Korrelation untersuchen, die Ergebnisse nach der Methode eines anderen und Ihrer eigenen Methode vergleichen.
Wenn der Korrelationskoeffizient zu hoch ist, hat das generierte Schema eine beeindruckende abstrakte Gültigkeit. Wenn Sie nicht sicher sind, was genau eine Technologie auswertet, vergleichen Sie die Ergebnisse dafür mit den Ergebnissen für die gültigen Schemata einer anderen Person, die benachbarte (verdächtige) Eigenschaften erkennen. Erweisen sich die Korrelationswerte als unerwartet groß, kann daraus geschlossen werden, dass die Methode nicht das erwartete schätzt.
Wenn es also bereits andere Schemata gibt, die darauf abzielen, genau dieselben oder verwandte Normen zu messen, können wir Diskriminanz- und Konvergenzvalidität bestimmen.
Nuancen
Also, was ist Validierung? In einfachen Worten, dies ist eine Überarbeitung des Produkts, um zu sehen, wie es den erklärten Eigenschaften entspricht. Das heißt, bis dahin wird jede Smartphone-Validierung nicht bestehen. Bis die Kunden sicherstellen, dass sie über die Kamera und den Speicherplatz verfügen, für die sie bereit sind zu zahlen.
Das Validierungskriterium ist ein Maß für die psychische Qualität, das unabhängig und direkt von dem zu validierenden Test ist und auf das das psychodiagnostische Schema abzielt.
Aktuelle Validität - ein Merkmal des Tests, das seine Fähigkeit widerspiegelt, auf der Grundlage eines diagnostischen Merkmals, das Gegenstand der Untersuchung ist, zwischen Subjekten zu unterscheidenMethode.
Die Wettbewerbsvalidität wird durch die Korrelation des erstellten Tests mit anderen geschätzt, deren Validität relativ zum gemessenen Parameter festgelegt wird. Die unterschiedliche Validität lässt sich am Beispiel von Interessentests erläutern.