Pourquoi l'IA n'est pas prête à me remplacer ?

Je dois bien avouer que l'avancée de la technologie m’effraie ces derniers temps. Je ne suis pas contre, bien sûr, mais bon, mon métier est tout de même en ligne de mire, on ne va pas se mentir. Pourtant, je pense avoir encore un peu le temps, discutons de quelques points qui me font dire cela.

L'ANONYMISATION DANS LES TRANSCRIPTIONS

Le plus gros point qui me vient en tête, au-delà des erreurs de compréhension de l'IA, c'est l'anonymisation des transcriptions en mot à mot ou en épuré.

 

J'ai de très nombreuses missions où l'on me demande d'anonymiser pour ne pas reconnaître les personnes interviewées. Vous savez de quoi je parle.

 

J'ai principalement deux demandes pour l'anonymisation :

🥝 Soit remplacer simplement par un X avec entre crochets une indication. Exemple : « Josette est allée à l’hôpital de X [CHU] » ;

🥝 Soit introduire un codage avec référence sur un fichier à part. Exemple : « Josette est allée à l’hôpital SL [hôpital] ».  L’hôpital étant celui de Saint-Louis et son codage se trouve sur un autre fichier Word avec d'autres anonymisations (villes, personnes, hôpitaux, entreprises où travaillent les personnes, etc.).

 

Évidemment, ce type de tâche ne peut être fait que par l'humain, je n'ai pas besoin de plus expliciter.

LA Compréhension de l'IA DANS LES transcriptions EN mot à mot

Si je vous dis : « Il n’est pas venu, comme on le pensait » et « Il n’est pas venu comme on le pensait ». Vous voyez la différence ? La virgule, on est d'accord, mais celle-ci est très importante. Alors que dans le premier exemple, on va dire qu'il n'est pas venu, comme on le pensait, cela va plutôt signifier : c'est exactement ce à quoi nous nous attendions, il n'est pas venu. Alors que si l'on retire la virgule, la phrase prend un autre sens : Il est venu, mais pas comme on le pensait, par exemple avec quelqu'un d'autre. Une simple virgule peut changer complètement le sens d'une phrase.

 

Aujourd'hui, la ponctuation fait souvent défaut, mais pourtant, à l'écrit, elle a une importance cruciale et c'est là tout l'intérêt de l'humain : l'humain, lui, va pouvoir retranscrire l'intonation que la personne interviewée va mettre, le ressenti, on va pouvoir matérialiser des blancs, des hésitations, tout cela, l'IA ne le fait pas alors que la personne qui va analyser ces écrits aura besoin de cette ponctuation pour restituer au mieux les dires de la personne. Bien interpréter les dires et qu'il n'y ait pas de confusion possible.

l'IA ne va pas réduire votre temps de travail et ça peut même être l'inverse

Eh non, ce n'est pas parce que l'IA va mettre 5 minutes à mettre par écrit votre enregistrement de 1 heure que votre travail s'arrête là ! Et justement, ce dernier point regroupe finalement les deux précédents, car oui, il va falloir tout reprendre, tout relire (avec le son) pour que l'écrit représente la bonne restitution du support écrit. Et pour avoir déjà essayé à plusieurs reprises, croyez-moi, cela ne gagne pas plus de temps que de faire transcrire par un professionnel.

 

Je n'ai pas fait ces tests à la légère, j'ai pris des enregistrements que j'avais l'habitude de saisir, avec des personnes récurrentes, exemple : procès-verbal de conseil d'arrondissement. Les intervenants, à force, je les connais par cœur, donc je sais combien de temps je mets pour transcrire 5 minutes (5 minutes étant mon repère pour la totalité d'un fichier). Sur ce PV en question, lors de mes essais, au mieux de la qualité de l'IA, pour la totalité du fichier qui va durer environ 2 heures, j'ai gagné 10 minutes. 10 minutes maximum ! C'est ABSOLUMENT dérisoire ! Ça ne vaut absolument pas le coup.

Et dernier petit point bonus, toujours pour avoir tenté l'expérience, j'ai une dernière remarque lorsque je corrige : le cerveau passe naturellement au-dessus de certaines fautes (de langage ou de ponctuation). Pourquoi ? Déjà, j'en avais parlé une fois, mais si je vous mets cet exemple que l'on peut voir absolument partout : « Seleuemnt 55 porsnenes sur cnet en snot cpalabes », je sais déjà que vous l'avez lu du premier coup sans vous poser de question ou très peu. Sur la correction d'une transcription audio faite par IA, c'est exactement pareil !

 

Il y a déjà des incohérences, c'est normal, mais là où l'humain va le signaler, l'IA, elle, va bredouiller un truc qui ne voudra rien dire. D'ailleurs, n'essayez même pas avec des noms scientifiques issus de la nature environnante, c'est une catastrophe, vous irez plus vite à taper à la main !

 

C'est au moment de la correction que je remarque ça et là je me dis : ouh là, là, je vois celle-ci, mais vu tout ce qu'il y a, il est quand même fort probable qu'il y en ait d'autres et qui ont échappé à ma vigilance.

Je ne dis pas que l'humain fait du sans faute à 100%, selon moi c'est impossible, mais dans tous les cas, la phrase reste compréhensible alors que faire une simple correction de l'humain sur l'IA, on oublie parfois une virgule mal placée ou encore inexistante, il manque un mot, car on a voulu corriger une phrase, c'est le drame, ça ne veut plus rien dire et vous serez obligé de retrouver le passage audio pour compléter la phrase, car on ne peut pas faire "au pif".

 

Tout ça pour dire que l'IA, c'est sympa, mais pour certaines choses, il faut encore laisser l'humain faire si vous voulez une bonne qualité sur la restitution de vos transcriptions audio.

Écrire commentaire

Commentaires: 0
LinkedIn transctriptrice audio
Email transcriptrice audio

Tous droits réservés