Rolf Schoch1 Andreas Kühn2

Intuition wichtiger als Wissenschaft?

Kennzahlenvergleich über die Verbreitung und Anwendung
von Instrumenten für die Personalselektion

Für jede Unternehmung ist es von grösster Wichtigkeit, aus einer Vielzahl von Stellenbewerbern und -bewerberinnen den oder die "Bestgeeignete(-n)" zu finden und einzustellen. Im Selektionsprozess sollten die für die Stellenbesetzung entscheidenden Eigenschaften der Kandidaten(-innen) möglichst objektiv, zuverlässig und gültig ermittelt werden. Im Rahmen des i.bench:HRM® (Kennzahlenvergleich) untersuchten wir, welche Verfahren und Instrumenten für die Personalauswahl heute – und wie oft – in den Unternehmungen tatsächlich angewendet werden.

1. Problemstellung und Zielsetzung

Die Auswahl von Stellenbewerbern nimmt heute einen grossen Teil der Arbeitszeit der Mitarbeitenden in einer grösseren HR-Abteilung in Anspruch. Über die mit diesen Neuanstellungen verbundenen direkten und indirekten Kosten liegen bisher noch keine Angaben vor; man kann jedoch davon ausgehen, dass sie sehr hoch sind. Dementsprechend sollte die wichtige, verantwortungsvolle und komplexe Aufgabe der optimalen Selektion neuer Mitarbeitender so effizient und treffsicher wie nur möglich ausgeführt werden können.

Wie aber finden die Verantwortlichen beispielsweise die gesuchten, hoch qualifizierten Kaderleute, die Marketing- oder Computerspezialisten, Chefsekretärinnen, Sachbearbeiter oder anderen Mitarbeitenden aus der Vielzahl von Bewerbungen heraus? Fehlentscheide bei Neuanstellungen kosten bekanntlich Zeit und sehr viel Geld und müssen deshalb möglichst vermieden werden. Für die Personalselektion existiert heute in Wissenschaft und Praxis eine Fülle sehr unterschiedlicher Verfahren und Instrumente. Das Ziel unserer aktuellen Online-Umfrage bei den Leitern von HRM-Abteilungen bestand darin, zu untersuchen, welche davon heute in welcher Häufigkeit in den Unternehmungen verwendet oder eben nicht verwendet werden.

2. Untersuchungsplan und Erhebungsmethodik

Die erwähnte Umfrage wurde im Rahmen des webbasierten HR-Kennzahlenvergleichs "i.bench:HRM"® realisiert, den die Firma know.ch St. Gallen 2006 in Zusammenarbeit mit ZGP/FEP bereits zum zweiten Mal durchführte. Teilnehmer waren 66 Firmen der Maschinen- und Metallindustrie, aus Banken, Versicherungen, Gewerbe-, Handels- und anderen Dienstleistungsunternehmen sowie öffentlichen Institutionen. Deren Grösse liegt zwischen 100 und 8'000 Mitarbeitenden, mit einem Durchschnitt um 700. Den umfangreichen Online-Fragebogen mit insgesamt 120 Fragen konnten wir dieses Jahr erstmals durch ein neues Kapitel über die Anwendung von Instrumenten und Verfahren für die Auswahl von externen Stellenbewerbern ergänzen. Die befragten HRM-Verantwortlichen hatten bei jedem der vorgegebenen Selektionsinstrumente anzugeben, ob es in der eigenen Unternehmung "regelmässig", "selten" oder "nie" eingesetzt wird.

3. Untersuchungsergebnisse

Die Grafik 1 zeigt sämtliche neun in der Umfrage erfassten Gruppen von Instrumenten und Verfahren zur Personalselektion im Überblick und in der Reihenfolge der Häufigkeit ihrer regelmässigen Verwendung.

Grafik 1:
Anwendung von Instrumenten zur Personalselektion – Gesamtüberblick

Gemäss unserer Umfrage werden diese bei den Teilnehmerfirmen in sehr unterschiedlicher Häufigkeit eingesetzt: Die Spannweite reicht von 100 % regelmässig, d.h. in allen Firmen, bis zu wenigen 3 %. Im Folgenden unterscheiden wir zwischen informellen, nichtstandardisierten Verfahren einerseits und formellen, standardisierten, wissenschaftlichen fundierten, andererseits.

3.1 Informelle, nichtstandardisierte Verfahren

Nach der Häufigkeit der Nennung stehen zwei Verfahren, die von sämtlichen Teilnehmern angewandt werden, mit sehr grossem Abstand an der Spitze. Es sind dies: Arbeitszeugnisse/Lebenslauf/Referenzen prüfen (100 % regelmässig) sowie Bewerberauswahlgespräche/Anstellungsinterviews (100 % regelmässig). Diese beiden gehören im Selektionsprozess zur Routine, zum allgemeinen Standard einer HR-Abteilung. Diese Instrumente erfüllen wohl die Mindestanforderung an eine einigermassen systematische und objektive Kandidatenauswahl. Eine Neueinstellung eines/einer externen Stellenbewerbers(-in) ohne diese Selbstverständlichkeiten kann man sich (ausser in ganz speziellen Fällen) schwer vorstellen. Das Lesen und Prüfen der schriftlichen Bewerbungsunterlagen mit den üblichen Beilagen eines/einer Kandidaten(-in) erfüllt in der Regel die Funktion einer Vorauswahl auf der ersten Stufe des Selektionsprozesses. In allen Fällen gibt es dann auch das persönliche Gespräch mit dem/der Bewerber/-in. An dieses können sich später – je nach Ergebnis – weitere, stärker formalisierte und standardisierte Beurteilungsverfahren anschliessen.

Die Gründe für die weitest mögliche Verbreitung der beliebten Vorstellungsgespräche sind wohl: Diese Verfahren sind einfach, plausibel und relativ kostengünstig anzuwenden. Sie können (scheinbar) mit eigenen Kräften und dem vorhandenen Know-how bewältigt werden. Und sie sind sowohl bei den Arbeitgeberfirmen wie auch bei den Stellenbewerbern beliebt und allgemein akzeptiert, besitzen also eine hohe "soziale Validität" (Akzeptanz).

Allerdings ist hinlänglich bekannt und gut dokumentiert, dass bei persönlichen Interviews eine Vielzahl von potentiellen Fehlerquellen bestehen: Die Art, die Zahl, die Reihenfolge und die Formulierung der Fragestellungen und der Antwortalternativen, ferner Einstellungen, Verhalten, Rollenerwartungen und sogar objektive demografische Merkmale wie Alter und Geschlecht der Befragungsperson und nicht zuletzt auch die Person des Befragten selbst können die Ergebnisse des Interviews beeinflussen und unter Umständen verzerren und verfälschen. Bekannt sind z.B. Beurteilungsfehler des Interviewers, wie z.B. "halo-effekt", zu strenge oder zu milde Beurteilungen. Auf der anderen Seite führen Antwortfehler des Befragten, wie mangelhafte Erinnerung, bewusstes "Schönreden", Übertreibungen, "soziale Erwünschtheit" und "Ja-Sage-Tendenz" zu Verfälschungen.
Bewerbergespräche können in sehr unterschiedlichem Grad der Standardisierung und Strukturierung durchgeführt werden. Allgemein gelten freie und unstrukturierte Interviews als besonders anfällig für falsche Schlussfolgerungen, und sie haben geringe prognostische Validität (Voraussagegültigkeit) für den späteren Erfolg an der Stelle. Empfohlen werden deshalb zumindest strukturierte Interviews anhand eines standardisierten Fragebogens.

Graphologische Gutachten/Handschriftenanalysen verwenden nur 9 % der befragten Unternehmen regelmässig. Vor 11 Jahren hatten noch 68 % der befragten ZGP-Mitgliederfirmen angegeben, graphologische Gutachten zu verwenden (Thom/Zaugg 1995). Früher fast Standard in vielen Firmen, scheinen sie heute in ihrer Anwendungshäufigkeit rückläufig zu sein. Immerhin 37 % verwenden sie noch gelegentlich oder selten. Gründe für die Verwendung in der Praxis sind vor allem: Graphologische Gutachten sind relativ kostengünstig; da sie an externe Experten vergeben werden, erfordert die Anwendung von der Unternehmung kein Fachwissen; sie machen keine direkte persönliche Auseinandersetzung mit den Kandidaten notwendig; die Bewerber können den Test kaum verfälschen oder beeinflussen; ein Teil der Verantwortung kann auf den Graphologen abgeschoben werden (Alibifunktion); da der Graphologe nicht am Entscheidungsprozess teilnimmt, kann sein Urteil je nach Bedarf übergangen oder überbetont werden. Diese Instrumente werden heute von der wissenschaftlichen Eignungsdiagnostik und Personalpsychologie kritisch beurteilt. Ihre Objektivität, Gültigkeit (Validität) und Zuverlässigkeit (Reliabilität) werden in Frage gestellt und ihre Unabhängigkeit vom subjektiven Ermessen des/der Gutachters/-in wird bezweifelt. Kritiker bemängeln die fehlende theoretische Fundierung. Von den Bewerbern werden graphologische Gutachten im Allgemeinen nicht gerade geschätzt, da das ganze Verfahren intransparent ist und ihnen die Beurteilungskriterien und die Analyse-Ergebnisse vielfach nicht mitgeteilt werden.


3.2 Formelle, standardisierte Verfahren

a) Psychologische Tests

In der Psychodiagnostik versteht man heute unter einem Test: "ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrer empirisch abgrenzbarer Persönlichkeitsmerkmale, mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung" (Lienert 1998). Es handelt sich somit um Instrumente, mit deren Hilfe man psychometrisch vergleichbare und gültige Informationen über Verhalten und Erleben einzelner Personen erhält. "Messen" impliziert hier immer auch "Vergleichen". Das heisst, die von einer Person im Test erreichten Werte werden mit denjenigen anderer Menschen verglichen, die in ihrer Summe die Normwerte, also Durchschnittswerte in den jeweiligen Bereichen, bilden.

Was macht einen guten Test aus? Die Hauptgütekriterien sind Objektivität, Reliabilität und Validität. In letzter Zeit wird zunehmend als viertes Kriterium auch noch "Soziale Validität", d.h. die Akzeptanz durch die Getesteten, genannt. Von Bedeutung sind ferner auch Praktikabiliät und Kosten. Objektivität bedeutet, dass die Testergebnisse von der untersuchenden Person und ihrer subjektiven Sichtweise unabhängig sind. Verschiedene Untersucher sollen beim gleichen Bewerber zu gleichen Ergebnissen gelangen. Man unterscheidet zwischen Durchführungs-, Auswertungs- und Interpretationsobjektivität. Die Reliabilität (Zuverlässigkeit, Verlässlichkeit) der Ergebnisse oder eines Tests bedeutet, dass bei wiederholen Messungen des gleichen Sachverhalts übereinstimmende Ergebnisse (Konsistenz) erzielt werden. Validität (Gültigkeit) eines Tests ist dann gegeben, wenn er diejenigen Persönlichkeitsmerkmale oder Verhaltensweisen, die er zu messen oder vorherzusagen vorgibt, auch tatsächlich misst oder vorherhersagt.

Was ist ein geeigneter Test? Um aus dem vorhandenen Bestand an seriösen Verfahren eine gute Auswahl zu treffen, ist vorerst eine Arbeits- und Tätigkeitsanalyse der zu besetzenden Stelle und die Ableitung von Anforderungsprofilen notwendig. Die danach ausgewählten Instrumente sollten so spezifisch wie nur möglich die Fähigkeiten und Persönlichkeitsmerkmale messen, die zur Ausübung der fraglichen Tätigkeit wichtig sind oder in Zukunft wichtig sein werden. Für die Auswahl von Testverfahren ist somit erstens die Frage entscheidend: Welche Konstrukte sollen überhaupt mit dem Instrument gemessen werden? Hier sind die Korrelationen zwischen Testergebnissen und Indikatoren des beruflichen Erfolgs entscheidend. Und zweitens: Welcher Test ist von seiner psychometrischen Qualität und sozialen Akzeptanz her geeignet, die diagnostischen Fragestellungen zu beantworten?


b) Persönlichkeitstests

Gemäss unserer Umfrage stechen bei diesen Verfahren psychologische Persönlichkeitstests hervor (Grafik 1). Nach eigenen Angaben verwendet fast ein Fünftel aller Teilnehmerfirmen solche Tests oder Fragebogen. Gut ein Zehntel nennt Leistungs- und Fähigkeitstests. Zu den wissenschaftlich abgesicherten Tests gehören zum Beispiel das Freiburger Persönlichkeitsinventar (FPI), der 16-Persönlichkeitsfaktoren-Test (16 PF), der Myers-Briggs-Typenindikator (MBTI). Als ein weiteres Beispiel von in der Praxis häufig verwendeten Instrumenten sei hier das BIP Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung genannt. Das BIP ist ein mehrdimensionaler Persönlichkeitstest. Sein Ziel ist nach den Autoren die standardisierte Erfassung des Selbstbildes eines Testkandidaten in Hinblick auf relevante Beschreibungsdimensionen aus dem Berufsleben. Das Inventar ist, im Unterschied zu den meisten anderen Instrumenten, speziell für Anwendungen im Personalmanagement – für Personalauswahl und -platzierung, für Trainings- und Coachingmassnahmen, Feedbackprozesse sowie Karriereberatung – entwickelt worden.
Psychologische Intelligenztests werden nur von 3 % eingesetzt. Ein bekanntes Beispiel eines solchen Tests ist der Intelligenz-Struktur-Test I-S-T 2000 von Amthauer. Dieser deutschsprachige Test beruht auf mehreren Theorien zur Intelligenz (u.a. Cattell 1987, Vernon 1950 und Thurstone 1941) und der aktuellen Intelligenzforschung. Folgende Konstrukte (Strukturen) sollen gemessen werden: Verbale Intelligenz: Fähigkeit zum Umgang mit sprachlichem Material im Rahmen des schlussfolgernden Denkens. Numerische Intelligenz: Rechenfertigkeit und Fähigkeit, logische Beziehungen zwischen Zahlen herzustellen. Figurale Intelligenz: Fähigkeit im Umgang mit figural-bildhaften, zwei- und dreidimensionalem Material. Der Gesamtwert aus verbaler, numerischer und figuraler Intelligenz ergibt die Fähigkeit zum formallogischen, schlussfolgernden Denken. Der Vergleichswert heisst dann IQ.


c) Projektive psychologische Tests

verwenden gemäss unserer Umfrage ebenfalls rund 3 % der Teilnehmerfirmen regelmässig und 9 % selten. Dreiviertel aller Befragten verwenden sie gar nie. 12 % wissen es nicht oder kennen diese Instrumente nicht. Unter einem projektiven Test versteht man in der Psychologie einen Persönlichkeitstest, bei dem die Versuchsperson auf mehrdeutige Stimuli reagieren und dabei verborgene Emotionen und interne Konflikte enthüllen soll. Dies unterscheidet sie von "objektiven Tests", bei denen die Antworten nach einem einheitlichen Auswertungsschema (z.B. multiple choice) als Standard und nicht nach persönlichem Ermessen des Testers analysiert werden. Bei diesen Verfahren muss die Testperson verbale oder grafische Darstellungen deuten oder gestalten. Bekannte Beispiele sind der Thematic Apperception Test TAT (nach Murray, 1943) und der Rorschach-Test nach Hermann Rorschach, einem Schweizer Psychiater. Bei diesem wird der Bewerber nach der Bedeutung von zehn unregelmässigen, unstrukturierten Tintenklecksbildern gefragt. Die Antworten werden dann in formaler und inhaltlicher Weise analysiert. Aus seinen Beschreibungen, was er in den Klecksen sieht, wird auf verborgene seelische Kräfte oder Schwächen oder eben "das Unbewusste" geschlossen. Diese Verfahren haben heute an Popularität verloren. Die Tests können nur wirksam sein, wenn der Experte die Antworten richtig interpretiert. Da so viel von seiner subjektiven Beurteilung abhängt, werden diese Tests teilweise als unwissenschaftlich abgelehnt. Dennoch setzen selbst renommierte Personalberatungen die Tests bei der Auswahl von Managern ein. Dies, obwohl sie eigentlich zur Persönlichkeits- und Neurosendiagnostik von erwachsenen Personen, aber auch von Kindern ab vier Jahren, dienen.


d) Assessments und Assessment Centres (AC)

Etwa jedes achte Unternehmen unter den Teilnehmern der Online-Umfrage verwendet diese regelmässig, weitere drei Viertel selten (Grafik 1). Es sind dies multiple diagnostische Verfahren, d.h. sie umfassen mehrere und verschiedenartige Verfahren und Instrumente zur Messung berufsrelevanter Personenmerkmale, d.h. von anforderungsbezogenen Verhaltensweisen und Eigenschaften. Es können einer oder mehrere Beobachter und einer oder mehrere Stellenbewerber daran teilnehmen. Zielgruppen sind hauptsächliche Führungskräfte. AC werden zur Ermittlung von Fachwissen, aber auch von Führungs- und Sozialkompetenz sowie von Persönlichkeit eingesetzt. Kommunikations- und Motivationsfähigkeit, Problemlösungsverhalten, Innovationspotenzial, Konfliktfähigkeit, Durchsetzungsvermögen eines/einer Bewerbers/-in, ebenso wie dessen/deren Dynamik, Fähigkeit zum Teamwork und zur Ressourcennutzung, lassen sich mit einem Assessment umfassender beurteilen, als mit einem traditionellen Interview. Ein seriöses Assessment erfordert geschulte und erfahrene, interne und/oder externe Fachleute als Beobachter (Assessoren), die eine Vielfalt von verschiedenen Techniken und Tests einsetzen. Übliche Techniken zur Leistungsmessung sind z.B. Präsentationen, Rollenspiele, Fallstudien, Gruppendiskussionen, Postkorb, Führungsaufgaben. An Tests kommen fast alle schon erwähnten Arten, also Berufseignungs-, Intelligenz-, Leistungs-, Persönlichkeitstests und andere zum Einsatz.

Zusammenfassung und Schlussfolgerungen

Von der Vielzahl von Verfahren und Instrumenten, die für die Personalauswahl im Prinzip zur Verfügung stehen, wird nur ein ganz geringer Teil in der Unternehmungspraxis tatsächlich und regelmässig eingesetzt. Es sind dies gerade die eher intuitiven, informellen und nichtstandardisierten, welche teilweise mit methodischen Mängeln behaftet sind. Wissenschaftlich fundierte, formelle und standardisierte Instrumente, wie z.B. Persönlichkeits- oder Intelligenztests, haben demgegenüber in der Schweiz, auch im Vergleich zum Ausland, heute (noch) einen schweren Stand.

Literatur

Lienert, G. (1998):
Testaufbau und Testanalyse. Weinheim: Beltz Verlag

Thom, Norbert/Zaugg, Robert (1995):
Spezialisierung und Differenzierung der Personalbeschaffung und -auswahl. Universität Bern, Institut für Personal und Organisation.

Dr.oec.HSG Rolf Schoch ist Inhaber/Geschäftsführer des Instituts WISO DR. SCHOCH+ PARTNER WIRTSCHAFTS- UND SOZIALFORSCHUNG in Horgen/Zürich
Andreas Kühn, lic.oec.HSG, ist Geschäftsführender Partner von know.ch Wissens- und Informationsmanagement in St. Gallen