La légende Unix qui ne nous doit rien continue de réparer le code AWK sous-jacent
Un professeur de Princeton, trouvant du temps pour lui dans une accalmie universitaire estivale, a envoyé un e-mail à un vieil ami il y a quelques mois. Brian Kernighan a dit bonjour, a demandé comment se passait leur visite aux États-Unis et a envoyé des centaines de lignes de code qui pourraient ajouter le support Unicode à AWK, un outil d’analyse de texte qu’il a aidé à construire pour Unix aux Bell Labs en 1977.
« J’ai pas mal testé cela, mais des tests supplémentaires sont clairement nécessaires », a écrit Kernighan dans un e-mail publié comme une sorte de pseudo-engagement sur le référentiel onetrueawk par le mainteneur de longue date Arnold Robbins. « Une fois que j’aurai compris comment… j’essaierai de soumettre une pull request. J’aimerais mieux comprendre git, mais malgré votre aide, je n’ai toujours pas la bonne compréhension, donc cela peut prendre un certain temps.
Kernighan est le « K » dans AWK , un langage d’extraction et de contrôle à usage spécial qui était la clé des fonctions de pipeline Unix et de l’interopérabilité entre les systèmes. Une awk
fonctionnalité en cours d’exécution (AWK est un langage, awk
une commande pour l’appeler) est essentielle à la fois à la spécification standard UNIX et à la certification IEEE POSIX en termes d’interopérabilité. Il existe d’innombrables variantes de awk
, mais « One True AWK », parfois connu sous le nom de nawk
, est une version basée sur le livre de Kernighan de 1985, The AWK Programming Language et ses contributions ultérieures.
Kernighan est également le « K » dans « K&R C », le livre fondateur de 1978 The C Programming Language qu’il a co-écrit avec Dennis Ritchie, qui reste avec les programmeurs, mentalement et sous forme de papier battu. Les racines de Xi sont bien plus profondes. Kernighan a formé C aux Bell Labs et a convaincu son créateur Dennis Ritchie de collaborer sur un livre pour diffuser les connaissances. Ce livre a engendré « le seul véritable style d’accolade », le débat sans fin qui l’accompagne et la structure qui sous-tend tout langage de programmation moderne.
Kernighan a également nommé Unix et a été le premier à démontrer l’exemple de code « Hello, world ». Il a parlé avec Richard Jensen d’Ars Technica de 50 ans d’histoire d’Unix.
Le référentiel onetrueawk, où Kernighan est apparu fin mai, est un endroit relativement calme avec 21 contributeurs, 46 utilisateurs GitHub qui regardent et des commits apparaissant tous les quelques mois. Comme l’a noté The Register , le correctif Unicode de Kernighan est devenu connu principalement parce qu’il a été mentionné dans une interview avec le professeur sur la chaîne YouTube de Computerphile .
« Il a toujours été embarrassant qu’AWK ne fonctionne qu’avec une entrée ASCII, ou peut-être 8 bits, mais ne gère pas vraiment du tout Unicode », a déclaré Kernighan au professeur Balesford. « Il y a quelques mois, j’ai passé du temps à travailler (rires) avec un programme incroyablement ancien. Je l’ai en ce moment où il gère réellement l’entrée et la sortie UTF-8, vous pouvez donc avoir des expressions régulières qui, vous savez, récupèrent des caractères japonais et d’autres choses.
Kernighan, maintenant âgé de 80 ans, mentionne avec désinvolture dans une interview qu’il a également corrigé quelque chose de « rapide et sale » pour permettre à AWK de traiter les fichiers CSV.
Laisser un commentaire