HireVue AI : Comment l'algorithme évalue réellement votre entretien
L'IA de HireVue n'évalue plus votre visage. Elle évalue la transcription de ce que vous dites par rapport à une grille de compétences. Voici comment cela fonctionne et comment atteindre la bande supérieure.
L'IA de HireVue n'évalue pas vos expressions faciales. Elle le faisait, jusqu'en 2021. Après trois années de critiques académiques, une plainte auprès de la FTC et la propre validation interne de l'entreprise montrant que l'analyse faciale n'apportait rien à la précision prédictive, HireVue a retiré tous les signaux visuels du modèle. Ce que l'algorithme évalue aujourd'hui, c'est la transcription de ce que vous avez dit, comparée à une grille de compétences que l'employeur a construite pour le poste.
Cet article décrit ce que l'IA actuelle de HireVue évalue réellement, comment fonctionne le pipeline de transcription vers le score, ce que voit le recruteur de l'autre côté, et ce que les candidats peuvent faire pour obtenir un score dans la bande supérieure étant donné un système qui ne se soucie plus du contact visuel ou du sourire.
Points rapides à retenir
- L'IA de HireVue évalue le texte transcrit de vos réponses, pas votre visage, votre ton de voix ou votre langage corporel. L'analyse faciale a été retirée en 2021.
- Un modèle de traitement du langage naturel compare votre transcription à une grille de compétences que l'équipe de recrutement a configurée pour le poste spécifique. La plupart des postes mesurent 5 à 7 compétences.
- Les candidats sont placés dans des bandes Supérieure, Moyenne ou Inférieure par rapport aux autres candidats pour le même poste. Le tableau de bord que voit le recruteur est par compétence, pas un nombre unique.
- La même grille de compétences est appliquée à chaque candidat, ce qui est la base de l'argument de HireVue "élimine le biais de l'intervieweur".
- Le plus grand levier de notation est la spécificité sur le sujet. Les réponses génériques obtiennent un score dans la bande moyenne même lorsqu'elles sont livrées avec confiance. Les réponses spécifiques, ancrées dans des situations (la méthode STAR), obtiennent un score dans la bande supérieure.
- La qualité d'enregistrement importe car elle affecte la qualité de la transcription. Un mauvais audio conduit à des transcriptions brouillées et une notation incomplète.
- L'IA ne "décide" pas si vous avancez. Elle produit une liste classée qu'un recruteur humain examine ensuite. Environ 60 à 80 pour cent des candidats notés par HireVue reçoivent toujours un examen humain avant toute décision d'embauche.
Ce que HireVue mesurait autrefois (et pourquoi cela a cessé)
Jusqu'en janvier 2021, l'évaluation vidéo de HireVue notait quatre choses : le contenu de la parole (mots transcrits), les signaux vocaux (hauteur, rythme, énergie), les signaux faciaux (taux de sourire, contact visuel, micro-expressions) et les modèles de langage. La plateforme commercialisait cela comme "20 000 points de données par entretien de 30 minutes". L'argument était que la vision par machine et l'analyse de la parole pouvaient capter des signaux subtils que les intervieweurs humains manquent.
L'argument s'est heurté à trois problèmes. Les chercheurs académiques ont montré que la notation par signaux faciaux discriminait les candidats à la peau plus foncée (détection de points de repère plus médiocre), les candidats portant des lunettes, les candidats avec des expressions neurodivergentes et les candidats avec des accents régionaux sur le modèle audio. L'Electronic Privacy Information Center a déposé une plainte auprès de la FTC en 2019. Et l'audit interne de HireVue, mené par O'Neil Risk Consulting, a constaté que la notation par signaux faciaux n'ajoutait presque rien à la validité prédictive déjà capturée par le modèle de langage.
En janvier 2021, HireVue a annoncé avoir retiré entièrement l'analyse visuelle du modèle. Le moteur de notation actuel ingère l'audio, le transcrit en texte à l'aide de la reconnaissance automatique de la parole, et note le texte. La partie vidéo de l'enregistrement existe toujours, car les recruteurs la regardent, mais elle n'alimente pas le score de l'IA.
Ce que l'IA évalue en 2026
Le modèle 2026 est un pipeline de traitement du langage naturel qui prend la transcription de votre réponse audio et produit un score par compétence. Les compétences ne sont pas génériques. Elles sont définies par l'employeur lorsque l'évaluation est construite pour un poste spécifique.
Une grille de poste typique pourrait mesurer : Orientation Client, Résolution de Problèmes, Travail d'Équipe, Résilience, Communication, Initiative et Adaptabilité. L'équipe de recrutement sélectionne les compétences dans une bibliothèque HireVue et la plateforme construit des questions d'entretien conçues pour obtenir des réponses qui démontrent chacune d'elles.
Par compétence, le modèle a été entraîné sur les transcriptions de personnes hautement performantes et peu performantes précédentes dans le même poste dans des entreprises avec suffisamment de volume d'embauche pour produire un ensemble d'entraînement. Le modèle produit un score de 1 à 5 sur chaque compétence, puis les agrège avec la pondération définie par l'employeur.
Le diagramme ci-dessous montre où l'IA s'arrête et commence maintenant.

Le modèle ne regarde pas les mots de remplissage ("euh", "hum"), la grammaire, l'accent ou si vous avez dit quelque chose d'intelligent. Il regarde si votre réponse contient les types de modèles de contenu que les personnes hautement performantes dans ce poste spécifique tendent à produire lorsqu'on leur pose cette question spécifique. Les réponses sur "diriger un projet difficile" obtiennent un score plus élevé lorsqu'elles décrivent un projet spécifique avec un obstacle spécifique et une résolution spécifique que lorsqu'elles décrivent le leadership de manière abstraite, car c'est ce que montrent les transcriptions d'entraînement.
Comment le pipeline de transcription affecte votre score
Avant que le modèle de langage ne voie quoi que ce soit, la reconnaissance automatique de la parole (ASR) convertit votre audio en texte. Si l'ASR échoue ou produit une transcription brouillée, le modèle de langage évalue des ordures. Il existe quatre façons dont les candidats nuisent accidentellement à la qualité de leur transcription :
La première est un mauvais microphone. Les microphones intégrés d'ordinateur portable avec le ventilateur en marche produisent un audio bruyant. L'ASR moderne est robuste, mais les candidats qui utilisent un microphone à pince ou USB obtiennent des transcriptions plus propres que ceux qui utilisent un ordinateur portable dans un café.
La deuxième est la parole trop rapide. Les systèmes ASR deviennent nettement pires au-dessus de 180 mots par minute. Les candidats anxieux accélèrent. La transcription perd des mots. Le score baisse avec. Un rythme mesuré de 150 mots par minute se lit proprement.
La troisième est un accent régional lourd sur un modèle ASR mal entraîné. HireVue utilise un ASR multirégional, mais l'anglais avec accent espagnol latino-américain ou les accents anglais indiens prononcés peuvent toujours produire 5 à 10 pour cent d'erreurs de transcription supplémentaires. Parler légèrement plus lentement et énoncer les terminaisons des mots compense cela.
La quatrième est de parler hors micro. Les candidats qui tournent la tête en gesticulant réduisent le niveau audio. Gardez la tête pointée vers la caméra et le microphone tout le temps.
La grille de compétences, décodée
Une évaluation HireVue pour un poste en contact avec le client pourrait demander : "Parlez-moi d'une fois où vous avez transformé un client frustré en client satisfait." Cette question est mappée à deux compétences : Orientation Client et Résolution de Problèmes.
Une réponse de bande supérieure pour Orientation Client contient : description spécifique du client, une frustration spécifique (avec un nombre ou une durée), une action d'écoute ou d'empathie spécifique, et un résultat spécifique qui a récupéré la relation. Une réponse de bande supérieure pour Résolution de Problèmes contient : un énoncé clair du problème, une approche structurée, une action sous contraintes et un résultat mesurable.
Une réponse de bande moyenne contient des affirmations générales ("Je suis très orienté client") sans spécificités, ou des spécificités sans résolution.
Une réponse de bande inférieure est hors sujet ("Le service client est important parce que..."), trop courte pour être notée, ou fondamentalement non réactive.
| Compétence | Signal bande supérieure | Signal bande moyenne | Signal bande inférieure |
|---|---|---|---|
| Orientation Client | Client spécifique, problème spécifique, résolution spécifique, résultat récupéré | Affirmations génériques d'empathie, pas de spécificités | Hors sujet, définit le service client de manière abstraite |
| Résolution de Problèmes | Problème énoncé, approche structurée, action sous contraintes, résultat mesurable | Étapes sans contraintes, résultat vague | Pas de structure, juste un récit |
| Travail d'Équipe | Nomme l'équipe, votre contribution spécifique, gestion des conflits, résultat conjoint | "J'ai travaillé avec mon équipe pour..." sans spécificités | Parle uniquement de soi, pas de mention de l'équipe |
| Résilience | Revers spécifique, reconnaissance émotionnelle, action de récupération, leçon appliquée plus tard | "J'ai rebondi" sans contexte | "Je n'échoue jamais" ou déni du revers |
| Communication | Message adapté à l'audience, vérification de clarté, résultat confirmant que le message est passé | Répète le message, pas d'adaptation à l'audience | Hors sujet ou décousu, pas d'audience claire |
| Initiative | Action non sollicitée, besoin identifié, navigation des ressources, résultat | "Je vais toujours au-delà" sans exemple | A demandé la permission, attendu les instructions |
| Adaptabilité | Changement spécifique, réponse émotionnelle nommée, comportement d'adaptation, compétence apprise | "Je suis flexible" sans instance | A résisté au changement |
La grille est la même que celle qu'un intervieweur humain utiliserait de manière informelle. La différence est que l'IA l'applique de manière cohérente à chaque candidat dans le même poste.
Ce que voit le recruteur
Après que votre entretien soit noté, le recruteur ouvre un tableau de bord qui montre un placement de bande (Supérieure / Moyenne / Inférieure) et un score par compétence de 1 à 5. Ils voient également la vidéo, la transcription et la ventilation question par question.
La vue du tableau de bord ci-dessous montre ce qu'un recruteur voit par compétence.

La plupart des recruteurs ne regardent pas chaque vidéo. Le flux de travail standard est de revoir les candidats de la bande supérieure en entier et de faire des vérifications ponctuelles d'un échantillon de la bande moyenne. La bande inférieure est généralement déprioritée ou rejetée, selon le volume. Environ 60 à 80 pour cent des candidats notés par HireVue reçoivent toujours un examen humain avant toute décision finale, mais atterrir dans la bande supérieure double approximativement la probabilité qu'un humain regarde réellement votre vidéo.
Comment obtenir un score dans la bande supérieure
Trois réflexes pratiques élèvent le score moyen HireVue suffisamment pour faire passer la plupart des candidats de la bande moyenne à la bande supérieure.
Le premier est le modèle STAR, appliqué plus serré que le conseil général. Situation en 1 phrase, Task en 1 phrase, Action en 2 à 3 phrases avec des spécificités (nombre, durée, contrainte), Result en 1 à 2 phrases avec un résultat mesurable. La réponse complète tient en 90 secondes, ce qui est la durée que la plupart des invites HireVue permettent. Les réponses longues et décousues obtiennent un score inférieur aux serrées car elles enterrent le contenu à fort signal.
Le second est de nommer la compétence sans dire son nom. Si la question porte sur la résilience, ne dites pas "cela montre ma résilience". Au lieu de cela, décrivez explicitement un revers, l'émotion que vous avez ressentie, l'action de récupération et la leçon. Le nom de la compétence est pour la grille, pas pour le candidat.
Le troisième est de lire la question pour la compétence implicite. "Parlez-moi d'un collègue difficile" se mappe à Travail d'Équipe et Communication. "Parlez-moi d'une fois où vous avez manqué une échéance" se mappe à Résilience et Initiative. Deux minutes de recherche sur le poste avant l'entretien vous indiquent quelles 5 à 7 compétences figurent sur la grille, et quelle compétence chaque question cible probablement.
Modèles de pratique qui construisent les bons réflexes
Un plan de préparation de 5 jours fait passer la plupart des candidats de la bande moyenne à la bande supérieure.
Jour 1 : Identifiez les 5 à 7 compétences probables pour le poste à partir de l'offre d'emploi et des cadres de compétences pour des postes similaires. Écrivez une définition d'une ligne de chacune.
Jour 2 : Écrivez une histoire au format STAR par compétence. Deux paragraphes chacune. Situations réelles, chiffres réels, résultats réels.
Jour 3 : Enregistrez-vous répondant à chacune des 7 questions probables en 90 secondes. Rejouez-le. Vérifiez si la forme STAR est audible.
Jour 4 : Réenregistrez. Resserrez Situation et Task à une phrase chacune. Étirez Action avec un détail concret de plus.
Jour 5 : Une légère séance de pratique dans l'expérience candidat officielle de HireVue. Dormez. Passez l'évaluation réelle avec les réflexes installés.
Les candidats qui passent de la bande moyenne à la supérieure n'apprennent pas de nouveau contenu. Ils resserrent la structure pour que la grille de l'IA puisse détecter le signal.
Connexe sur PrepClubs
- Pilier. Vue d'ensemble de HireVue. La ventilation complète des produits d'évaluation, d'entretien et de jeux de HireVue.
- Pratique approfondie. Pack de pratique HireVue avec Pass Guarantee. Entretiens simulés complets avec ventilation de notation. 39 $ une seule fois. Pass Guarantee.
- Format d'entretien. Entretien HireVue : Format, Questions et Comment Réussir. Le parcours complet de l'entretien vidéo à la demande.
- Pilier de marque. HireVue en 2026 : Évaluation, Entretien, Jeux et Entreprises. Ce que font les quatre produits HireVue.
- Entreprises. Entreprises qui utilisent HireVue. Ventilation par industrie de la base d'employeurs de HireVue.
Pratiquez sur PrepClubs
Pratiquez le modèle STAR contre des invites HireVue simulées avec des retours.
L'IA évalue le contenu de la transcription par rapport à une grille de compétences, donc la pratique à plus fort levier est de livrer des réponses structurées STAR serrées aux invites que la plateforme utilise réellement. PrepClubs exécute des entretiens simulés de style HireVue avec des invites mappées au même cadre de 7 compétences, plus une lecture avec des retours structurés sur la clarté de Situation, Task, Action et Result. 39 $ une seule fois. Pass Guarantee.
Commencer la pratique gratuite HireVue
FAQ
HireVue analyse-t-il toujours mon visage ?
Non. L'analyse faciale a été retirée du modèle de notation en janvier 2021 après que la validation interne a montré qu'elle n'ajoutait aucune précision prédictive et que la recherche externe a montré qu'elle introduisait un biais contre plusieurs groupes de candidats. Le recruteur peut toujours regarder votre vidéo, mais l'IA ne l'évalue pas.
Que note réellement l'IA de HireVue ?
Le texte transcrit de vos réponses audio, comparé à une grille de compétences définie par l'employeur pour le poste spécifique. La sortie est un score par compétence de 1 à 5, plus un placement de bande de Supérieure, Moyenne ou Inférieure par rapport aux autres candidats pour le même poste.
Le choix des mots ou la grammaire affectent-ils mon score ?
Pas directement. Les mots de remplissage, les légères erreurs grammaticales et l'accent ne pénalisent pas le score. Ce que le modèle recherche, ce sont des modèles de contenu : avez-vous décrit une situation spécifique, avez-vous décrit une action spécifique, avez-vous décrit un résultat mesurable. Les réponses structurées de manière serrée obtiennent un score plus élevé que les fluides mais vagues.
Un recruteur humain examinera-t-il toujours mon entretien ?
Dans la plupart des cas, oui. Environ 60 à 80 pour cent des candidats notés par HireVue reçoivent un examen humain avant toute décision finale. Atterrir dans la bande supérieure double approximativement la probabilité qu'un humain regarde réellement votre vidéo complète plutôt que de simplement jeter un coup d'œil au score.
Puis-je refaire un entretien HireVue ?
La politique de reprise est définie par l'employeur, pas par HireVue. La plupart des employeurs n'autorisent que la première tentative. Une petite minorité autorise une deuxième tentative si l'enregistrement avait un défaut technique. Traitez la première séance comme votre seule.
Parler plus vite ou plus lentement aide-t-il ?
Plus lentement aide. La qualité de transcription ASR baisse au-dessus de 180 mots par minute. Un rythme mesuré de 140 à 160 mpm produit la transcription la plus propre et vous donne le temps de livrer réellement la structure STAR dans la fenêtre de 90 secondes que la plupart des invites HireVue permettent.
Quelle est l'activité de préparation à plus fort levier ?
Écrire une histoire au format STAR par compétence probable, puis vous enregistrer en livrant chacune en moins de 90 secondes. L'acte mécanique de parler l'histoire à voix haute, de l'écouter et de la resserrer pour la deuxième prise installe le réflexe structurel que la grille de l'IA est conçue pour détecter.
HireVue est-il légalement autorisé à utiliser l'IA pour me noter ?
Oui, avec des réserves. Illinois (Artificial Intelligence Video Interview Act, en vigueur depuis 2020) et Maryland exigent le consentement explicite du candidat et la divulgation que l'IA est utilisée. New York City Local Law 144 exige des audits de biais de tout outil automatisé de décision d'emploi. HireVue se conforme dans les trois juridictions, et l'écran de consentement au début de l'entretien est le mécanisme formel.
FAQ

