Morningkill a écrit : ↑lun. avr. 20, 2026 10:34 am
Mais, au final, si tu avais du faire le travail sans IA, ca aurait été plus fatigant ou pas pour toi ? plus couteux en temps ou pas ?
J'aurai pas cru par contre l'IA que savait gérer ce type de travail
J'aurais pu tout taper à la main, ce qui aurait été plus coûteux en temps encore. Je tape très vite, mais pas encore assez, et c'est une tache pénible. Ensuite, j'ai du du mal à reconnaître certains mots à cause de la graphie et j'aurais dû faire des recherches et m'interrompre. Le problème vient des o, des a et des o', pour lesquels on ne peut pas établir une équivalence stricte (certains o sont devenus des a, d'autres non). Les j ne sont pas toujours évidents non plus. Pour d'autres lettres, c'est plus facile.
Ensuite, les OCR classiques ne fonctionnaient pas et produisaient beaucoup d'erreurs, même après un paramétrage serré, la faute à la basse qualité de certaines photos, prises dans de mauvaises conditions. En nettoyant le résultat d'un OCR, cela m'aurait pris un mois et demi je pense. Je me suis bien emmerdé, mais le gain est substantiel.
Inversement, un LLM peut très bien déduire les mots, mais il faut lui donner plein de contraintes pour éviter les hallucinations. Mon protocole comportait une bonne vingtaine de lignes de consignes, dont une liste de noms propres récurrents, l'injonction à ne pas améliorer les phrases ou moderniser la langue, la préservation des mots empruntés à d'autres langues. Il fallait le répéter toutes les vingt-trente pages, le LLM ayant tendance à n'en faire qu'à sa tête au bout d'un certain temps. Je le nourrissais aussi du texte corrigé pour qu'il aille au plus proche de ce que je voulais. Donc oui, c'est possible et c'est un gain de temps, mais faut vraiment être derrière, page par page.
Ensuite, j'ai donné l'intégralité du texte à DeepL, qui a fourni un truc à peu près compréhensible et sensé, et j'ai fait une version à deux colonnes, que j'ai ensuite débarrassée de ses bêtises, comme des traductions de pseudonymes en noms communs (on ajoute trois jours de travail). Sans être la panacée, c'est une aide pour me repérer vite dans le document et l'étudier dans sa globalité. Ensuite, quand un passage m'intéresse vraiment et que je veux le citer, je le retraduis intégralement à la main.
À la main, je peux traduire des documents entiers, mais je tourne à 10-15 pages par jour en fonction de la difficulté de la langue. C'est plutôt élevé, mais ça reste lent. L'avantage, c'est que j'en retire une connaissance très intime du document, du point de vue du contenu comme de la langue, et que je ne rate rien.
C'est possible pour des documents de plusieurs dizaines de pages mais pas pour un document de 600 pages dont j'avais besoin de prendre connaissance rapidement et dont le déchiffrement fin m'aurait bien pris deux mois, deux mois et demi.
L'autre option est de faire une lecture cursive, sans traduire et en prenant des notes, mais je sais que j'ai tendance à laisser passer des petites choses dans ce cas-là. Le gain de temps par rapport à cette solution n'est pas si évident et mérite d'être réfléchi. Pour 600 pages, en russe, où je suis fluent, ça me prend deux semaines (gain marginal), en ouzbek, où je suis juste compétent, entre trois et quatre (gain de 50% avec un texte complet en prime).