Aller au contenu
Tous les POC
live

Le cerveau juridique

Un graphe de connaissance qui transforme un corpus juridique en réseau navigable : on voit l’ensemble d’un coup et on suit les liens entre les notions, au lieu de lire article par article. Démo live sur la Loi 25.

  • Python
  • SQLite + FTS5
  • LLM (génération des fiches et concepts)
  • d3.js (graphe force-directed)
  • Données publiques — LégisQuébec

Le problème

Sur un dossier qui dure — une transaction, une enquête, une réforme réglementaire — la difficulté n’est pas de lire un document, c’est de tenir l’ensemble dans sa tête. Les notions se répondent d’un bout à l’autre du corpus : une obligation ici renvoie à une exception là, un même concept revient sous trois formulations dans cinquante pages. La lecture linéaire, document par document, perd ces fils. Au bout d’un moment, personne n’a plus la carte complète.

Ce que j’ai bâti

J’ai repris une idée des bases de connaissance personnelles (personal knowledge management) — ces systèmes où l’on relie ses notes pour faire émerger une pensée en réseau plutôt qu’en liste. Les gens s’en servent pour leur veille, pour une recherche qui s’étale sur des mois, pour leur vie tout court. Je l’ai appliquée à un corpus juridique : chaque article devient une fiche, les notions deviennent des concepts, et l’IA tisse les liens entre eux. Le résultat est un graphe navigable où l’on voit la structure d’un coup d’œil et où l’on suit les connexions de proche en proche.

C’est un peu comme déléguer une partie de son cerveau : le modèle lit tout, résume chaque pièce et fait les rapprochements logiques entre des éléments qui ne se croiseraient jamais à la lecture. Reste à l’avocat le travail de jugement — mais sur une matière déjà cartographiée.

Comment

Sur l’exemple public ici, j’ai pris la Loi 25 (P-39.1 modernisée), un texte ouvert et libre de droits. Le pipeline ingère les 155 articles, génère une fiche FR par article, en extrait les concepts et les normalise (avec alias bilingues, une seule clé canonique par notion, jamais de doublon), puis tisse les liens fiche↔fiche et fiche↔concept. Le tout est indexé en plein texte et rendu dans un graphe force-directed : 237 concepts, 864 liens. La démo tourne sur des données pré-calculées — aucun appel à un modèle en direct.

Le corpus est une loi parce que c’est public. Mais le moteur est indifférent au contenu : on peut imaginer le même graphe sur un dossier ou un ensemble de dossiers — une data room de M&A, une vigie juridique sur un sujet suivi dans le temps, du compliance monitoring où l’on veut voir comment une nouvelle obligation se rattache à l’existant.

Les limites

  • Démo sur données publiques uniquement, et sur un seul corpus cohérent.
  • Les fiches et les liens sont générés par un modèle : utiles pour s’orienter, jamais à prendre pour argent comptant. Un lien « apparenté » suggère une parenté, il ne la prouve pas.
  • Pas de pondération de l’autorité ni du temps : le graphe est une carte, pas un classement ni une analyse.
  • Version vitrine : on peut l’outiller davantage — contrôle plus fin du tissage, notes personnelles ancrées à un endroit précis, validation humaine des liens, mises à jour incrémentales.

Note déontologique

Tout repose sur le texte officiel d’une loi publique (LégisQuébec) ; zéro donnée d’employeur, de client ou confidentielle. C’est un outil de vue d’ensemble et de repérage, pas un avis juridique. Comme tout contenu produit par un modèle de langage, les fiches et les rapprochements peuvent comporter des erreurs : la vérification à la source reste la règle avant tout usage.

Voir

La démo est live : explorez le graphe des 155 articles, cliquez un nœud pour ouvrir sa fiche et ses concepts, suivez les liens, ou cherchez un terme.