Glossar
Hier finden Sie alle wichtigen Begrifflichkeiten im Zusammenhang mit Individualdiagnostik.
Das Ausmaß, in dem Personen einen Test als fair, angemessen und sinnvoll empfinden. Ist die Akzeptanz nicht gegeben, führt dies aufgrund mangelnder Motivation häufig zum Überspringen von Aufgaben. Dadurch kommt es zu einer Verzerrung des Testergebnisses, was sich wiederum ungünstig auf die Validität auswirkt. Die Akzeptanz gehört zu den Nebengütekriterien.
Das Maß, in dem nach Einschätzung von Laien (z. B. Sorgeberechtigten) die Aufgaben/ der Inhalt bzw. das Ergebnis eines eines Tests mit dem zu messenden Merkmal übereinstimmen. Die Validität wird also vom bloßen Augenschein her als gegeben eingeschätzt. Es werden keine Kennwerte bestimmt. Sie ist Teil der Validität.
Außerunterrichtliche Lernhilfe: eine Fördermaßnahme für Kinder mit besonderen Schwierigkeiten im Bereich Lesen und/oder Rechtschreiben oder im Bereich Rechnen. AUL kann beantragt werden, wenn schulische Fördermaßnahmen (integrierte und additive Sprachförderung) nicht ausreichen. Grundlage für die Beantragung sind (sehr schwache) Testergebnisse aus zwei Testungen mit einem geeigneten individualdiagnostischen Verfahren, die im Lesen oder Rechnen mit einem mindestens sechsmonatigem Abstand, im Rechtschreiben mit einem vier- bis achtmonatigem Abstand durchgeführt wurden, sowie die Ergebnisse eines Intelligenztests. Zusätzlich wird die Darlegung der bisherigen Förderung benötigt. Außerdem muss mindestens sechs Monate lang ein Nachteilsausgleich gewährt worden sein (für Rechnen jedoch längstens bis zum Ende der Jahrgangsstufe 4). Der Antrag wird von den Sorgeberechtigten über die Schulleitung bei der BSB gestellt. Im Falle einer Antragstellung erstellt die Schule eine formgebundene Stellung
Das Maß, in dem ein Test eindeutige und hilfreiche Ergebnisse liefert, die zuverlässige Rückschlüsse auf die Eigenschaften erlauben, die gemessen werden sollen (z. B. basale Kompetenzen im Kopfrechnen). Die Aussagekraft eines Tests steht in bestimmter Hinsicht in einem engen Zusammenhang mit der Generalisierbarkeit.
Der Grad, zu dem die Bewertung eines Tests unabhängig von der Person ist, die den Test auswertet. Auswertungsobjektivität ist gegeben, wenn verschiedene Personen ein Verfahren auswerten und zu demselben Ergebnis kommen. Die Auswertungsobjektivität ist ein Teil der Objektivität und gehört zu den Nebengütekriterien.
Ein Vergleichsmaßstab, der hilft, die Testergebnisse einer Person zu interpretieren.
Kennwert der der internen Konsistenz. Der Wertebereich liegt normalerweise zwischen 0 und 1 und sollte möglichst nicht unter 0.6 liegen. Werte über 0.7 werden als akzeptabel angesehen, Werte über 0.8 als gut und Werte über 0.9 als exzellent.
Ein statistisches Maß dafür, wie gut ein Test zwischen verschiedenen Konstrukten unterscheiden kann. Wenn ein Test zur Erfassung basaler mathematischer Kompetenzen beispielsweise eine niedrige Übereinstimmung mit einem Verfahren zum Leseverständnis aufweist, spricht das für eine hohe diskriminante Validität. Das bedeutet, für das Lösen der Mathematikaufgaben werden nur wenige sprachliche Kompetenzen benötigt. Häufig werden zur Prüfung der diskriminanten Validität Korrelationen gerechnet. Wie gering der Korrelationskoeffizient für eine gute diskriminante Validität sein sollte, ist Interpretationssache. Grundsätzlich sollte er aber unter 0.7 liegen.
Das Maß, in dem ein Test standardisiert (d.h. es gibt Durchführungsanleitungen, Testleitungsskripte usw.) durchgeführt wird. Durchführungsobjektivität ist gegeben, wenn verschiedene Personen dasselbe Verfahren anleiten können und gleiche Resultate erreicht werden. Die Durchführungsobjektivität ist ein Teil der Objektivität und gehört zu den Nebengütekriterien.
Ein statistisches Maß, das zeigt, wie stark der Unterschied oder die Veränderung eines Testergebnisses ist. Es wird häufig zur Verdeutlichung der praktischen Relevanz von Unterschieden zwischen Testergebnissen herangezogen.
Erinnerungseffekte können zu einer Verzerrung der Testergebnisse führen, da Personen, die den Test zum zweiten Mal machen, sich an vorherige Antworten erinnern könnten. Dies kann zu einer künstlichen Verbesserung der Reliabilitätskoeffizienten führt
Die systematische Erfassung und die begründete Bewertung von Prozessen oder Ergebnissen, um deren Wirksamkeit zu bestimmen.
Das Maß, in dem die Testergebnisse nur von der zu messenden Eigenschaft beeinflusst werden und nicht von der Zugehörigkeit zu einer bestimmten ethnischen, soziokulturellen oder geschlechtsspezifischen Gruppe. Die Fairness gehört zu den Nebengütekriterien.
Eine statistische Methode, die verwendet wird, um die nicht beobachtbaren Strukturen oder Dimensionen (Faktoren) zu finden, die hinter einer Gruppe Items stehen. Faktorenanalysen können auch das Vorhandensein unterschiedlicher (Sub)skalen empirisch abbilden. Zum Beispiel liegen Items in einem Rechtschreibtest zur Messung orthographischer Korrektheit auf einem Faktor und Items zur grammatikalischen Korrektheit liegen auf einem anderen Faktor.
Das Ausmaß, in dem die vorliegenden Ergebnisse (insbesondere aus der Normierung) auf das „Universum zulässiger Beobachtungen[1]“ (die Grundgesamtheit oder Population) verallgemeinert werden können. Dies bedeutet, dass die zahlenmäßige, strukturelle und inhaltliche Repräsentativität der Grundgesamtheit gegeben sein muss. Die Generalisierbarkeit steht in einem engen Zusammenhang mit der Reliabilität und der Validität.
Siehe auch Population: Die gesamte Gruppe von Personen, über die man in einer Untersuchung Aussagen machen möchte. Zum Beispiel wären bei einer Studie zur Lesekompetenz von deutschen Viertklässlern alle Viertklässler in Deutschland die Grundgesamtheit.
Grundlegende Kriterien zur Beurteilung der Qualität eines Tests/ Verfahrens und dessen Ergebnissen. Es gibt drei allgemeingültige Hauptgütekriterien und weitere Nebengütekriterien. Objektivität, Reliabilität und Validität. Darüber hinaus gibt es Nebengütekriterien, unter anderem: Normierung, Unverfälschbarkeit, Nützlichkeit, Akzeptanz, Fairness, Ökonomie und Zumutbarkeit.
Das Maß der inhaltlichen Übereinstimmung der Aufgaben mit dem zu messenden Merkmal (z. B. Rechtschreibkompetenzen). Die Inhaltsvalidität wird z. B. Expert*innenmeinungen (meist theoriegeleitet) oder Curricula/ Rahmenlehrplänen abgeglichen. Es werden keine Kennwerte bestimmt. Sie ist Teil der Validität.
Ein Maßstab, der die aktuellen Ergebnisse einer Person mit seinen eigenen früheren Ergebnissen vergleicht. Es steht die Lern-/ Leistungsentwicklung im Vordergrund.
Unstandardisierte Methoden zur Beurteilung von Schulleistungen, oft durch Beobachtungen und mündliche/ schriftliche Befragungen. Informelle Verfahren beziehen sich auf die Entwicklung von Personen und nicht auf das Erreichen von z. B. bestimmten vorgegebenen Kompetenzstufen oder dem Vergleich mit entsprechenden Normstichproben. Informelle Verfahren sind meist der qualitativen Diagnostik zuzuordnen.
Ein statistisches Maß dafür, wie gut die einzelnen Aufgaben eines Verfahrens mit dem gesamten Verfahren bzw. einzelnen Skalen des Verfahrens zusammenpassen. Der bekannteste Kennwert für die interne Konsistenz ist Cronbachs Alpha. Der Wertebereich liegt normalerweise zwischen 0 und 1. Je "breiter"" bzw. vielschichtiger das zu messende Merkmal ist, desto geringer wird die interne Konsistenz ausfallen. Die interne Konsistenz ist Teil der Reliabilität.
Der Grad, zu dem unabhängig von der auswertenden Person die gleichen Schlüsse aus den Testergebnissen gezogen werden. Wiederholte Interpretation der Testdaten sollte zum gleichen Ergebnis führen. Die Interpretationsobjektivität ist ein Teil der Objektivität und gehört zu den Nebengütekriterien.
Einzelne Fragen/ Aufgaben in einem Verfahren.
Ein statistisches Maß dafür, wie schwierig eine einzelne Aufgabe (Item) in einem Test ist. Die Itemschwierigkeit lässt sich z. B. berechnen aus dem Anteil der Personen, die eine bestimmte Frage oder Aufgabe richtig beantwortet haben. Je mehr Personen ein Item im Sinne des zu messenden Merkmals beantwortet (= „gelöst“) haben, desto leichter ist das Item.
Eine Korrelation misst, wie stark zwei Merkmale (z. B. Testleistung und Schulnote) zusammenhängen. Ein positiver Zusammenhang bedeutet, dass hohe Werte des einen Merkmals mit hohen Werten des anderen Merkmals einhergehen. Ein negativer Zusammenhang bedeutet, dass hohe Werte des einen Merkmals mit niedrigen Werten des anderen Merkmals verbunden sind. Ein Wert nahe 0 zeigt an, dass es keinen Zusammenhang gibt. Die Stärke des Zusammenhangs wird durch den Korrelationskoeffizienten (r) ausgedrückt, der zwischen -1 und +1 liegt.
Das statistische Maß dafür, ob ein Test tatsächlich das Merkmal misst, das gemessen werden soll, aber nicht direkt beobachtbar ist (z. B. Intelligenz = latentes Konstrukt; Körpergröße = direkt beobachtbar = manifest). Für nicht direkt beobachtbare Merkmale müssen Items entwickelt werden, die das dahinter liegende Konstrukt erfassen können. Die Basis für die Konstruktvalidität bilden theoriegeleitete Erwartungen. Konstruktvalidität lässt sich z. B. mit einer Faktorenanalyse prüfen oder indem Zusammenhänge (Korrelationen) mit anderen konstruktverwandten (konvergente Validität) oder -fremden (divergente/ diskriminante Validität) diagnostischen Verfahren berechnet werden.
Ein statistisches Maß dafür, wie gut die Ergebnisse in einem diagnostischen Verfahren mit den Ergebnissen eines anderen diagnostischen Verfahrens übereinstimmen, das dasselbe Konstrukt messen soll. Wenn ein Mathematiktest zu basalen Kompetenzen beispielsweise hohe Übereinstimmungen mit einem anderen diagnostischen Verfahren zur Messung basaler mathematischer Kompetenzen zeigt, spricht das für eine hohe konvergente Validität. Häufig werden zur Prüfung der konvergenten Validität Korrelationen berechnet. Ob die Übereinstimmung (= Korrelationskoeffizient) hoch ist, ist Interpretationssache. Grundsätzlich lässt sich aber folgende Faustregel anwenden: Werte unter .50 weisen auf eher schwache Zusammenhänge hin. Werte zwischen 0.50 und 0.70 gelten als moderate und Werte über 0.70 als starke Zusammenhänge.
Ein Maßstab, der die Ergebnisse einer Person mit einem festgelegten Kriterium vergleicht (z. B. Regelstandards).
Ein unabhängiges Maß, in dem die Ergebnisse eines Tests mit einem externen Kriterium übereinstimmen (z. B. Schulnoten). Das externe Kriterium liegt außerhalb des eigentlichen Testbereichs, ist aber relevant für die Ergebnisse. Häufig werden Korrelationskoeffizienten angegeben. Es lassen sich zwei Arten der Kriteriumsvalidität unterschieden: die konkurrente Validität misst gleichzeitig den Zusammenhang zwischen dem aktuellen Ergebnis des diagnostischen Verfahrens und dem erhobenen Kriterium. Bei der prognostischen Validität wird geprüft, ob ein diagnostisches Verfahren zukünftige Leistungen vorhersagen kann.
Der mittlere Wert in einer geordneten Liste von Testergebnissen. Das heißt, die eine Hälfte von Testpunkten ist immer kleiner als der Median und die andere Hälfte ist größer.
Der Durchschnitt aller Testergebnisse, berechnet als Summe der Werte geteilt durch die Anzahl der Werte.
Maßnahmen, die Schüler*innen mit (besonderen) Schwierigkeiten im Lesen, Rechtschreiben oder Rechnen gewährt werden können, wenn die Ergebnisse in den entsprechenden Diagnoseverfahren unter den jeweiligen Grenzwerten liegen (Lesen und Rechnen ≤ 10, Rechtschreiben ≤ 15) und eine innerschulische Förderung (inner- und außerhalb des Unterrichts) von mindestens 6 Monaten stattgefunden hat. Diese Maßnahmen können beispielsweise in Form von Zeitverlängerungen oder zusätzlichen Hilfsmitteln umgesetzt werden.
Zusätzliche Kriterien zur Beurteilung der Qualität eines Tests, wie Normierung, Unverfälschbarkeit, Nützlichkeit, Akzeptanz, Fairness, Ökonomie und Zumutbarkeit.
Der Prozess, bei dem mit einer meist großen Anzahl an Personen ein Test durchgeführt wird und auf dieser Grundlage standardisierte Werte (Normwerte wie Prozentränge, T-Werte usw.) für bestimmte Testergebnisse (Rohwerte) ermittelt werden können. Dadurch können künftig individuelle Ergebnisse mit denen einer Referenzgruppe verglichen und interpretiert werden.
Tabellen, in denen Rohwerte mit Normwerten (z. B. T-Werten, IQ-Werten, PISA-Skala, Prozenträngen) verglichen werden können und ihre Bedeutung interpretierbar gemacht werden kann.
Standardisierte Werte, die den Vergleich von individuellen Testergebnissen mit einer Referenzgruppe aus der Normierung ermöglichen.
Das Ausmaß, in dem ein Test praktisch relevant (praktischer Nutzen) und hilfreich ist, um eine vorliegende diagnostische Fragestellung zu beantworten. Die Nützlichkeit eines Tests gehört zu den Nebengütekriterien.
Das Maß, in dem die Testergebnisse unabhängig von der Person sind, die den Test durchführt, auswertet oder die Ergebnisse interpretiert.
Die Effizienz eines Tests in Bezug auf den Aufwand und die Kosten im Vergleich zum diagnostischen Nutzen.
Ein statistisches Maß dafür, wie zuverlässig ein Test ist, indem die Ergebnisse zweier gleichwertiger Versionen desselben Tests verglichen werden. Empirisch geprüft wird dies durch die Berechnung von Reliabilitätskoeffizienten. Wenn Personen zwei Parallelversionen eines Mathematiktests machen, die dieselben Fähigkeiten messen sollen, und ihre Ergebnisse in beiden Tests ähnlich sind, dann hat der Test eine hohe Paralleltest-Reliabilität. Dies zeigt, dass der Test unabhängig von der Version zuverlässige Ergebnisse liefert. Die Paralleltest-Reliabilität ist Teil der Reliabilität.
Der Prozess vor der Normierung, bei dem ein neues Testverfahren oder eine neue Version eines bestehenden Verfahrens an einer kleineren Gruppe von Personen ausprobiert wird. Auf diese Weise können mögliche Probleme identifiziert und behoben werden und es kann sichergestellt werden, ob der Test wie beabsichtigt funktioniert, bevor er offiziell verwendet wird.
Siehe auch Grundgesamtheit: Die gesamte Gruppe von Personen, über die man in einer Untersuchung Aussagen machen möchte. Zum Beispiel wären bei einer Studie zur Lesekompetenz von deutschen Viertklässlern alle Viertklässler in Deutschland die Grundgesamtheit.
Ein statistisches Maß dafür, wie gut die Ergebnisse eines Tests zukünftige Leistungen oder Verhaltensweisen vorhersagen können. Sie ist ein Teil der Validität.
Ein statistisches Maß dafür, wie die Leistung einer Person im Vergleich zur Normierungsstichprobe (Referenzgruppe) einzuordnen ist. Der Prozentrang gibt an, wie viel Prozent der Referenzgruppe gleich gut oder schlechter abgeschnitten haben. Beispielsweise bedeutet ein Prozentrang von 85, dass 85 % der Personen in der Referenzgruppe gleich gut oder schlechter abgeschnitten haben und nur 15% besser. Prozentränge helfen dabei, individuelle Testergebnisse in einen größeren Zusammenhang zu stellen und leicht verständlich zu interpretieren.
Ein Ansatz, bei dem detaillierte, beschreibende Informationen gesammelt werden, oft durch Interviews oder Beobachtungen. Er hilft, einen tieferen Einblick in die Denk- und Verhaltensweisen sowie Gefühle von Personen zu bekommen. Ein Beispiel für eine qualitative Herangehensweise wäre eine Lehrkraft, die in einem Gespräch mit einem Kind mathematische Fehlvorstellungen identifizieren möchte, indem das Kind während der Lösung einer Aufgabe seine Gedanken schildert.
Ein Ansatz, bei dem messbare, numerische Informationen gesammelt werden, oft durch standardisierte Testverfahren oder Fragebögen. Er hilft, präzise und objektive Aussagen über bestimmte Merkmale zu treffen. Die diagnostischen Verfahren, bei denen am Ende mit Rohpunktwerten und Normwerten gerechnet wird, fallen in die quantitative Diagnostik.
Ein statistisches Maß dafür, wie zuverlässig und konsistent ein Test ist. Ein Test ist reliabel, wenn er bei wiederholten Durchführungen unter gleichen Bedingungen gleiche oder sehr ähnliche Ergebnisse liefert. Der statistische Kennwert heißt Reliabilitätskoeffizient und hat einen Wertebereich von 0 bis 1. Die Werte sollten in der Regel über 0.70 liegen. Ein Wert ab 0.8 gilt als gut und ein Wert ab 0.9 spricht für eine sehr hohe Reliabilität. Es gibt verschiedene Arten von Reliabilität: interne Konsistenz, Paralleltest-Reliabilität, Retest-Reliabilität und Split-Half-Reliabilität.
Das statistische Maß für die Stabilität eines Tests über die Zeit hinweg. Wird ein Testverfahren mehrmals hintereinander durchgeführt, sollten möglichst ähnliche Ergebnisse zu beobachten sein. Empirisch geprüft wird dies durch die Berechnung von Reliabilitätskoeffizienten. Wird derselbe Test in zu großen zeitlichen Abständen durchgeführt und ein Kind erhält in der Zwischenzeit zusätzlich Fördermaßnahmen, sollten sich die Ergebnisse natürlich verändert haben. Auch für diesen Fall gibt es komplexe statistische Methoden, um trotzdem die Retest-Reliabilität berechnen zu können. Wird ein Test in einem zu geringen Abstand hintereinander durchgeführt, kann die Höhe der Retest-Reliabilität durch sogenannte Erinnerungseffekte verzerrt sein. Die Retest-Reliabilität ist Teil der Reliabilität.
Der ursprüngliche, unnormierte Punktwert, den eine Person in einem Test erzielt. Meistens ist es die Summe die richtigen Antworten. Der Rohwert gibt noch keine Hinweise darauf, wie gut oder schlecht ein individuelles Ergebnis ist.
Ein Verfahren zur systematischen, schnellen und effizienten Untersuchung von meist größeren Personengruppen, um bestimmte Merkmale bzw. Probleme frühzeitig zu erkennen. Es dient dazu, Personen zu identifizieren, bei denen ein weiterführender diagnostischer oder interventioneller Bedarf besteht. Screenings sind meist weniger zeitaufwändig als eine umfassende Diagnostik.
Das Maß, in dem ein Testverfahren tatsächlich positive Fälle (Personen mit dem gesuchten Merkmal, z. B. Dyskalkulie) als positiv erkennt oder identifiziert. Ein Test mit hoher Sensitivität hat eine niedrige Rate an falsch negativen Ergebnissen, das heißt, er erkennt die meisten Personen korrekt, die tatsächlich das gesuchte Merkmal haben. Die Sensitivität ist ein wichtiger Gegenpart zur Spezifität in der Bewertung der diagnostischen Genauigkeit eines Testverfahrens.
Skalen oder Subskalen in einem (komplexeren) diagnostischen Verfahren sind verschiedene Dimensionen, die verwendet werden, um spezifische Merkmale einer Person zu untersuchen. Das bedeutet, dass es unterschiedliche Sets von Items gibt, die den verschiedenen Dimensionen zugeordnet sind und Merkmalsausprägungen auf diesen Skalen präzise erfassen. Skalen zur Bewertung der Rechtschreibkompetenz von Kindern könnten z. B. orthographische Korrektheit und grammatikalische Korrektheit sein. Skalen hängen eng mit Faktoren bzw. Faktorenanalysen zusammen.
Ein Maßstab, der die Ergebnisse einer Person mit denen einer Referenzgruppe vergleicht (z. B. die Leistung einer Schülerin im Vergleich zur durchschnittlichen Leistung der Klasse). Auch der Vergleich mit der Normierungsstichprobe kann als soziale Bezugsnorm betrachtet werden. Bei einer ausreichend großen Stichprobe nähert sich die Verteilung der Ergebnisse denen einer Population an. Auf dieser Grundlage können Normwerte bestimmt und Zielkriterien festgelegt werden, um zu einer kriterialen Bezugsnorm überzugehen.
Das Maß, in dem ein Testverfahren nur wenige falsch positive Ergebnisse liefert. Damit wird sichergestellt, dass Personen nicht fälschlicherweise als positiv (z. B. Dyskalkulie liegt vor) identifiziert werden, wenn sie das Merkmal tatsächlich nicht besitzen. Die Spezifität bildet damit eine ergänzende Komponente zur Sensitivität, um die diagnostische Genauigkeit eines Testverfahrens einzuschätzen.
Das statistische Maß für die Zuverlässigkeit eines Tests, bei dem der Test in zwei Hälften geteilt und deren Ergebnisse verglichen werden. Empirisch geprüft wird dies durch die Berechnung von Reliabilitätskoeffizienten. Die Split-Half-Reliabilität ist Teil der Reliabilität.
Das statistische Maß dafür, wie stark die Testwerte einer Gruppe um deren Durchschnitt streuen. Zum Beispiel hat der T-Wert einen Mittelwert = 50 und eine Standardabweichung = 10. Eine Standardabweichung bedeutet, dass etwa 68 % der Personen in diesem Bereich liegen, also einen T-Wert von 40 bis 60 haben. Zwei Standardabweichungen bedeuten, dass 95 % der Personen einen T-Wert von 30 bis 70 haben.
Eine Gruppe von Personen, die Teil einer größeren Population ist (= Grundgesamtheit, z. B. alle Kinder aus der 4. Klasse in Deutschlands Großstädten) und an einer Untersuchung teilnimmt. Idealerweise repräsentiert die Stichprobe die Zielgruppe des Testverfahrens in z. B. Klassenstufe, Geschlecht und Schulform.
Eine standardisierte Maßeinheit, die verwendet wird, um Testergebnisse zu interpretieren und miteinander vergleichen zu können. Ein T-Wert von 50 liegt genau im Durchschnitt der Referenzgruppe. Die Standardabweichung des T-Werts ist 10. Das bedeutet, dass ein T-Wert von unter 40 auf eine deutlich schlechtere Leistung hindeutet und ein T-Wert von über 60 auf eine deutlich bessere Leistung. Liegt ein T-Wert sogar unter 30, kann von einer extremen
Das Maß, in dem eine einzelne Frage (Item) zwischen Personen mit hohen und niedrigen Gesamtwerten bzw. Fähigkeiten oder Kompetenzen unterscheidet trennt.
Das Ausmaß, in dem ein Test das misst, was er messen soll. Validität ist entscheidend, um sicherzustellen, dass die durch Testverfahren gewonnenen Informationen aussagekräftig sind und deshalb für fundierte Entscheidungen im Unterricht und in der Förderung von Kindern verwendet werden können. Es gibt unterschiedliche Arten von Validität: Augenscheinvalidität, Inhaltsvalidität, Konstruktvalidität (mit diskriminanter und konvergenter Validität) und Kriteriumsvalidität (mit konkurrenter und prädiktiver Validität).
Ein detaillierter fachlicher Bericht, der von sonderpädagogischem Fachpersonal erstellt wird und Informationen zu individuellen Lern- und entwicklungsständen sowie -bedürfnissen (z.B. kognitiv, emotional, sozial, motorisch, schulisch) von Kindern und Jugendlichen enthält. Dem Gutachten geht eine umfassende Diagnostik voraus, in der u.a. Informationen aus Testverfahren, Beobachtungen und Gesprächen mit Sorgeberechtigten eingeholt werden. Aus dem Gutachten lassen sich anschließend gezielte Fördermaßnahmen und Unterstützungsangebote ableiten.
Ein außergewöhnlich hohes Niveau an (häufig) intellektueller Leistungsfähigkeit, das deutlich über dem Durchschnitt liegt. In Intelligenztests erreichen Personen mit Hochbegabung mindestens einen Prozentrang von 97,7, was einem IQ-Quotienten (Normwert) von 130 entspricht. Hochbegabung kann jedoch auch in anderen Bereichen auftreten (z. B. sozial, kreativ, psychomotorisch). Personen mit Hochbegabung benötigen spezielle Förderung, damit ihr Potenzial optimal ausgeschöpft und ihre individuellen Entwicklungsbedürfnisse berücksichtigt werden.
Sprachförderung in zusätzlicher Lernzeit. Der Anspruch auf additive Sprachförderung wird nach §28a HmbSG über Ergebnisse von standardisierten Diagnoseverfahren zugewiesen und di eTeilnahme an der Förderung ist bei Unterschreitung des entsprechenden Prozentranges (i.d.R. ≤ 10) obligatorisch.
Diagnostische Testverfahren werden unter festgelegten Bedingungen durchgeführt, ausgewertet und die Ergebnisse interpretiert (vgl. Objektivität und Normierung). Dadurch ist gewährleistet, dass die Ergebnisse aus Testverfahren zuverlässig (vgl. Reliabilität) und vergleichbar sind.
Das Maß, in dem ein Test so konstruiert ist, dass die Ergebnisse nicht durch die Art und Weise, wie Personen antworten, absichtlich verfälscht oder verzerrt werden können. Besonders in der psychologischen Diagnostik kann es vorkommen, dass Personen versuchen, ihre Antworten an gesellschaftliche Erwartungen anzupassen (soziale Erwünschtheit). Die Gefahr einer Verzerrung steigt, wenn der Zweck des Tests oder das zu messende Merkmal leicht erkennbar sind (hohe Augenscheinvalidität). In der Kompetenzdiagnostik ist die Gefahr der Verzerrung in der Regel geringer, da die Bewertung meist auf objektiven Kriterien basiert. Die Unverfälschbarkeit zählt zu den Nebengütekriterien und ist wichtig für die Verlässlichkeit der Testergebnisse.
Das Maß, in dem die Anforderungen eines Tests akzeptabel und durchführbar sind, ohne eine übermäßige oder unverhältnismäßige Belastung darzustellen. Die Zumutbarkeit umfasst z. B. die Testdauer und den allgemeinen Aufwand, der mit der Testung verbunden ist. Aber auch eine durchgehend zu hohe Schwierigkeit der Testaufgaben kann die Zumutbarkeit eines Tests beeinträchtigen.