IEML : Métalangage de l’économie de l’information
finalités et structure
Par Pierre Lévy
Prof. à l’Université d’Ottawa (dept Communications)
Chaire de Recherche du Canada en Intelligence Collective
Membre de l’Académie des Sciences (Société Royale) du Canada
I Introduction
ieml (Information Economy Meta Language) est une langue artificielle conçue pour être simultanément manipulable de manière optimale par les ordinateurs et capable d’exprimer les nuances sémantiques et pragmatiques des langues naturelles. Sa conception a répondu à trois problèmes interdépendants : celui de l’adressage sémantique des données du cyberespace, celui de la coordination des recherches en sciences de l’homme et de la société, et enfin celui de la gouvernance distribuée de l’intelligence collective au service du développement humain. L’adressage sémantique du flot océanique des documents numériques et la coordination des sciences sociales ne prennent d’ailleurs tout leur sens qu’en fonction de l’objectif ultime d’ieml, qui est de contribuer à la gouvernance bien informée du développement humain. Puisqu’ieml est un métalangage de description de l’économie de l’information, j’exposerai d’abord ce qu’il faut entendre par « économie de l’information », puis ce que signifie dans le cas présent le terme de « métalangage ».
L’économie de l’information
L’économie de l’information est un concept inclusif qui déborde largement le cadre de l’économie monétaire. Il désigne l’écosystème métastable et évolutif des flux de données significatives qui sont produits, entretenus et transformés au sein d’une population humaine. On peut employer le terme d’intelligence collective pour désigner cet objet, à condition de comprendre l’intelligence - non pas comme le contraire de la sottise - mais comme une dynamique auto-entretenue et interdépendante de fonctions cognitives (perception, mémoire, apprentissage, communication, coordination des actions...) à l’échelle d’une communauté. Puisque les informations produites, stockées, échangées et interprétées par les sociétés humaines sont de plus en plus codées sous forme numérique et que leur circulation tend à converger dans le même réseau interconnecté, il devient possible d’observer l’économie de l’information de manière beaucoup plus fine et intégrée que cela n’était possible avant l’existence des ordinateurs. Mais une mesure simplement quantitative des flux d’information (ou même de leur valeur monétaire) est évidemment insuffisante pour autoriser une pleine compréhension de l’économie de l’information. La communauté des chercheurs doit donc disposer d’instruments d’observation et d’analyse propres à identifier (1) les qualités sémantiques des données entreposées sur les serveurs et échangées dans les réseaux - ce que les données représentent - ainsi que (2) leur pertinence pragmatique - l’effet et l’usage des données en contexte. ieml veut précisément remplir cette fonction de repérage et d’analyse scientifique de la signification et des effets contextuels de l’information.
Le métalangage Une écriture idéographique de type scientifique
Le mot « métalangage » contenu dans le nom « ieml » condense plusieurs sens. ieml appartient d’abord à la catégorie très générale des systèmes de signes culturels, ou des systèmes de symboles. Il s’agit donc d’une convention - ou d’un artefact - et non d’un objet naturel.
C’est un méta-langage : un langage sur le langage, ou au sujet du langage. Il est spécialement conçu pour indexer et qualifier des données et des phénomènes qui sont déjà de nature symbolique.
Parmi tous les métalangages possibles, il s’agit d’un système de notation scientifique de la signification dont la structure combinatoire autorise une vaste gamme de manipulations automatiques. Bien que ses expressions puissent être prononcées (puisqu’elles sont notées au moyen de caractères alphabétiques), ieml n’est pas une langue naturelle et n’a pas vocation à remplacer ou à simuler les langues naturelles telles que le français, l’anglais, le russe, le mandarin ou l’arabe. C’est une écriture scientifique, ou un système de notation raisonné, élaboré en vue de maximiser les possibilités de calcul par les ordinateurs.
ieml est une écriture idéographique dont chaque symbole représente un concept. Il faut savoir que, pendant la quinzaine d’années que j’ai consacrée à ce projet avant sa publication, j’ai travaillé en manipulant des icônes afin d’être influencé le moins possible par les langues naturelles que je connaissais. Ce n’est qu’au cours des derniers mois de ma recherche que j’ai remplacé les icônes par des lettres de l’alphabet latin afin de faciliter la saisie par le clavier des ordinateurs. ieml est donc - en principe - indépendant des langues naturelles.
Structure combinatoire et articulée
Comme de nombreux autres systèmes de signes, ieml est structuré par plusieurs niveaux d’articulation. Pour bien saisir le système d’articulation d’ieml, il peut être utile de le comparer à celui des langues naturelles. Je vais donc commencer par rappeler l’articulation des langues naturelles avant d’exposer celle d’ieml.
Niveaux d’articulation des langues naturelles
Le premier niveau d’articulation des langues naturelles est le phonème (les phonèmes sont les sons élémentaires des langues). Généralement, les phonèmes n’ont pas de signification en eux-mêmes.
Le deuxième niveau d’articulation est le morphème (racines des mots et marqueurs de cas, de genre, de nombre, etc.). Les morphèmes sont composés de phonèmes. Ils constituent la première unité d’articulation signifiante des langues.
Le troisième niveau d’articulation est celui du mot, composé de morphèmes. Les mots ne sont perceptibles que dans l’écriture. Pour une culture sans écriture, la distinction entre mot et morphème n’aurait pas de sens.
Le quatrième niveau d’articulation est la phrase, composée de mots. La phrase est le premier niveau d’articulation à comporter, outre une signification, une référence. Le mot « arbre » n’est ni vrai ni faux, il ne fait qu’indiquer un concept. Seule la phrase « l’arbre a poussé » se réfère à un événement actuel et possède donc la capacité d’être vraie ou fausse (puissance sémantique) et d’intervenir activement dans un contexte (puissance pragmatique).
Le cinquième niveau d’articulation est le discours, ou le texte, qui est composé de phrases, etc.
Examinons maintenant les niveaux d’articulation successifs d’ieml.
Niveaux d’articulation et structure combinatoire d’ieml
1) Cinq éléments primitifs constituent le premier niveau d’articulation. Il s’agit du virtuel U, de l’actuel A, du signe S, de l’être B et de la chose T, dont les sens seront détaillés et expliqués dans la dernière partie de ce texte. Les cinq éléments sont regroupés en deux ensembles premiers ou pôles :
le pôle pragmatique de l’action, qui comprend les éléments virtuel et actuel
le pôle sémantique de la représentation, qui comprend les éléments signe, être et chose.
Contrairement au cas des langues naturelles, le premier niveau d’articulation d’ieml est déjà signifiant.
2) Le second niveau d’articulation, celui des événements, est formé de 25 (soit 52 ) couples orientés d’éléments, ou flux d’information entre éléments. Contrairement au cas des langues naturelles, toutes les combinaisons deux à deux entre les premières unités d’articulation sont des unités valides et signifiantes du deuxième niveau d’articulation. Comme on le verra plus loin en détail, la signification d’une combinaison d’éléments résulte de la combinaison de la signification de ces éléments. Par exemple, la relation orientée U ? U (virtuel vers virtuel) signifie « réfléchir », la relation orientée U ? A (virtuel vers actuel) signifie « agir », la relation orientée A ? U (actuel vers virtuel) signifie « percevoir », etc. L’explication complète se trouve dans la troisième partie de ce texte.
Alphabet des événements ieml
3) Le troisième niveau d’articulation, celui des relations, est formé de 625 (soit 252) couples orientés d’événements, ou flux d’information entre éléments. Ici encore, toutes les combinaisons sont valides et signifiantes. De plus, comme cela a déjà été signalé, la signification des relations résulte en principe de la signification des événements qui les composent.
4) Le quatrième niveau d’articulation, celui des idées, est formé par des relations simples, ainsi que par des paires orientées ou des triplets ordonnés de relations. Il existe 240 millions d’idées possibles (soit 625 + 6252 + 6253). Un peu plus d’un millier seulement ont été décrites et identifiées au 1er mai 2006. Le chantier de construction, nécessairement collectif, est donc ouvert.
5) Finalement, le cinquième niveau d’articulation, celui des phrases est formé par des idées simples ou par des paires ou encore par des triplets ordonnés d’idées. Il existe un nombre astronomique de phrases possibles, de l’ordre de 1025. Voir ci-dessous un diagramme mettant en évidence la structure d’une phrase ieml, avec l’exemple bo soko, qui signifie en ieml « langage de l’intelligence collective ». Dans ce diagramme, les étoiles * marquent les rôles vides au sein d’une structure qui est exactement la même pour toutes les phrases ieml. Chaque phrase remplit plus ou moins cette structure selon sa composition particulière.
En somme, les éléments (1er niveau), événements (2ème niveau), relations (3ème niveau), idées (4ème niveau) et phrases (5ème niveau) d’ieml sont des idéogrammes de cinq niveaux de complexité emboîtés, tous construits de manière régulière et combinatoire.
Afin d’éviter toute confusion avec le niveau particulier des idées, je propose d’appeler les idéogrammes d’ieml : des glyphes. Le mot « glyphe » connote évidemment les hiéroglyphes de l’ancienne écriture égyptienne (qui étaient d’ailleurs de nature mixte, partiellement idéographiques et phonétiques).
En règle générale
Tous les symboles d’ieml sont composés à partir de symboles d’un niveau d’articulation inférieur, jusqu’aux symboles simples, ou non composés, que sont les éléments.
La signification d’une combinaison de symboles résulte de la combinaison des significations des symboles combinés.
Adressage numérique
Chaque glyphe ieml est associé de manière fixe à un ensemble de nombres qui constitue son adresse numérique particulière. L’adresse numérique des glyphes est formée de degrés sur des échelles. Le principe des échelles d’ieml est expliqué plus en détail dans la dernière partie de ce texte, mais il me faut le mentionner dès maintenant afin de justifier la prétention d’ieml à rendre la signification mesurable et les distances sémantiques calculables. Un élément, par exemple, est associé à deux degrés, chacun des deux degrés marquant une position particulière sur une échelle différente. Une phrase est associée à une combinaison de 200 degrés situés sur 200 échelles distinctes distribuées sur 5 niveaux. Chaque échelle représente une dimension d’analyse particulière de la signification du glyphe.
Primitives, glyphes et graphes
Finalement, les glyphes (ou idéogrammes) d’ieml peuvent être assemblés en « textes » de quantité innombrable, appelés graphes. Les graphes d’ieml peuvent prendre trois formes principales, elles-mêmes combinables : les séries (ordres linéaires de glyphes), les arbres (ordres hiérarchiques ou généalogiques de glyphes) et les matrices (ordres cartésiens de glyphes croisant des rangées et des colonnes). Les graphes peuvent servir à décrire ou à indexer des documents et des phénomènes de toutes sortes, à exprimer des idées, des théories, des classifications, etc.
Propriétés dynamiques
La cohérence systématique d’ieml, son adressage numérique et son support informatique en font une écriture dynamique aux propriétés remarquables. Les graphes ieml pourront notamment servir de « briques » élémentaires pour la modélisation et la simulation d’économies de l’information aux règles variées.
A partir de la sélection et de la combinaison de critères simples, il est facile de générer et de réordonner automatiquement des graphes complexes.
Des « distances sémantiques » entre des graphes peuvent être calculées automatiquement à partir de leur adresse numérique selon une large palette de critères et une quantité indéfinie de points de vue.
Chaque graphe ou ensemble de graphes peut jouer alternativement trois rôles distincts.
1) Un graphe ieml peut d’abord jouer le rôle d’objet à analyser, de texte à lire et à interpréter. ?2) Ensuite, un graphe ieml peut jouer le rôle de grille de lecture, d’outil d’interprétation ou d’analyse. En d’autres termes, un graphe ieml est capable d’afficher des données sur d’autres graphes selon la perspective cognitive qu’il représente. Le fait capital que chaque graphe puisse se poser comme un centre de référence et de contrôle de l’espace sémantique reflète un des principes fondateurs de ce métalangage : à un même niveau de composition, aucun concept n’est plus important qu’un autre et tous peuvent être considérés comme des centres virtuels. ?3) Un graphe ieml peut encore jouer le rôle d’instrument de composition d’autres graphes. Les matrices peuvent servir de claviers. Les listes ordonnées et les arbres peuvent servir de dictionnaires ou de classifications permettant de sélectionner judicieusement des concepts.
Des premières intuitions à ieml.org
Dès la fin des années 70 du XX° siècle, je pressentais que les ordinateurs deviendraient le support de technologies intellectuelles qui allaient profondément transformer et augmenter nos manières de penser et de communiquer. Ma formation initiale est en philosophie, en histoire et plus généralement en sciences humaines, que j’ai étudiées à Paris entre 1975 et 1985. J’ai subi particulièrement l’influence des écoles historique et anthropologique française et j’ai certainement été marqué par l’effervescence philosophique qui régnait à Paris au tournant des années 70 et 80 du XX° siècle. Cela ne m’a pas empêché de m’abreuver aussi à d’autres sources (positivistes, analytiques, anglo-saxonnes, orientales...). Parallèlement, je me suis intéressé aux débuts de l’informatique et de l’intelligence artificielle ainsi qu’aux rapports entre théorie de l’information, sciences cognitives et biologie. J’ai dépouillé les conférences Macy, lu les travaux de Turing, Shannon, Wiener, Von Neuman, McCulloch et Von Foerster. J’ai suivi à la trace les pionniers de l’intelligence augmentée que furent Douglas Engelbart, Joseph Licklidder ou Theodore Nelson. J’ai observé avec passion la naissance de l’informatique personnelle et de l’Internet. En 1990, soit trois ans avant que le Web ne devienne chose publique grâce au génie de Tim Berners Lee, je publiais un livre, Les Technologies de l’intelligence, qui analysait la signification philosophique et culturelle de la convergence des réseaux d’ordinateurs avec les réseaux hypertextuels. Mon travail sur l’hypothèse d’une Idéographie Dynamique (ouvrage publié en 1991) et l’invention avec Michel Authier d’un système informatisé de visualisation des dynamiques collectives de savoir (les Arbres de connaissances, 1992) manifestaient déjà certaines des intuitions fondamentales qui allaient mener à la conception d’ieml. Dès la fin des années 80 je pensais que, pour exploiter pleinement les possibilités inédites de manipulation de symboles ouvertes par le cyberespace, nous avions besoin d’une technologie intellectuelle qui relie hypertextuellement tous les concepts possibles dans un réseau calculable... mais sans accorder de privilège particulier à aucun d’entre eux. En d’autres termes, il fallait étendre la forme « P2P » (dont on ne parlait pas encore à l’époque, mais qui était implicite dans la structure de l’Internet et des hypertextes) aux relations entre les concepts. Afin de respecter cette neutralité et cette « égalité des droits » conceptuelle, le moteur génératif du nouvel instrument de pensée à support numérique ne pouvait être que l’analyse logique de la signification elle-même. De la sorte, aucun concept ne pourrait être exclu ou marginalisé. La lecture d’un article de François Rastier m’a mis alors sur la voie de la triade sémiotique (signe S, être B , chose T) comme fondement possible du métalangage à venir. Mes travaux ultérieurs sur l’intelligence collective (1994) et le virtuel (1995) m’ont permis de raffiner mes premières hypothèses et de complexifier la triade sémiotique par la dyade pragmatique (virtuel U, actuel A). Mais ce n’est que grâce à l’obtention d’une Chaire de Recherche du Canada à l’Université d’Ottawa que j’ai pu me consacrer à temps plein, entre 2002 et 2006, aux plans détaillés et à la fondation d’ieml.
Le site http://www.ieml.org publiera les différentes versions augmentées et successives du métalangage. Il proposera également de télécharger les logiciels à source ouverte qui l’instrumentalisent et publiera des comptes rendus et des études scientifiques de son utilisation. Avec le temps, une communauté de développeurs et d’utilisateurs pourra s’organiser et se doter des moyens de collaboration adéquats (wikis, partage de données P2P en temps réel...).
Mais au moment où s’inaugure ce site, en mai 2006, seul existe le noyau du langage ieml. Son dictionnaire permet certes déjà de décrire une vaste gamme d’idées et de phénomènes, mais il est limité à quelques centaines d’unités lexicales. Les outils d’édition et d’indexation automatique qui permettent de l’utiliser sont à l’état de prototypes ou de projets. En 2006, ieml n’est donc encore qu’un programme de recherche scientifique. Sa croissance et ses succès futurs dépendent de l’engagement et de la collaboration d’un grand nombre de partenaires : laboratoires de recherche publics et privés, gouvernements, agences internationales, entreprises et communautés utilisatrices.
Je vais maintenant développer les raisons qui m’ont poussé à la conception d’ieml, puis décrire plus en détail dans la troisième partie de ce texte la structure fondamentale esquissée dans l’introduction.



