openglossa / GitHub ↗

citer.


le droit suisse, traduit sans inventer.

Termbase & mémoire de traduction juridique suisse — DE / FR / IT · open source (depuis 2026)

OpenGlossa agrège la terminologie et les textes parallèles du droit fédéral suisse — Fedlex, TERMDAT, Tribunal fédéral — en une base citable, exposée via un serveur MCP.

Une base terminologique et une mémoire de traduction qui ancrent chaque résultat dans une source officielle citable, pour traduire le droit suisse sans rien inventer.

Avis Les sorties d'OpenGlossa ne constituent pas le texte légal officiel faisant foi. Toujours vérifier contre la source officielle (n° RS + article Fedlex, ou référence ATF/BGE).

(01)

Recherche

Recherche dans la mémoire de traduction (extrait officiel du Code des obligations, SR 220). Chaque résultat est cité — article + lien ELI Fedlex. Exécutée dans votre navigateur ; le serveur MCP ajoute la recherche sémantique (LaBSE).

(02)

Évaluation

Term hit-rate@3 sur 15 requêtes tenues à l'écart : le terme officiel attendu apparaît-il dans les segments récupérés ?

0.00
sans ancrage
0.60
lexical
0.73
vectoriel · hashing
0.93
vectoriel · LaBSE
(03)

Téléchargements

Extrait de démonstration (CO / SR 220, source officielle Fedlex, citée).

openglossa_demo.tmx Mémoire de traduction, TMX 1.4 (validée DTD).
TMX
openglossa_demo.jsonl Segments parallèles avec provenance.
JSONL
glossary_deepl_de-fr.csv Glossaire DeepL DE→FR (couples extraits, à relire).
CSV
translation_unit.schema.json JSON Schema d'une unité de traduction.
Schema

Formats complets (TBX, Parquet, toutes paires) : openglossa build-exports.

(04)

Schéma

Modèles pydantic v2 à provenance obligatoire — aucun enregistrement sans source citable.

TermRecord Entrée terminologique centrée concept (≈ termEntry TBX).
concept
TranslationUnit Segment parallèle aligné (≈ tu TMX).
segment
TermCandidate Couple de termes extrait, en file de revue.
candidat
(05)

Licences

Fedlex (RS)Lois fédérales DE/FR/IT — texte + métadonnées RDF
Réutilisation, citation requise
réutilisable
Tribunal fédéral (SLDS)Regestes trilingues (ATF/BGE)
CC-BY-4.0
réutilisable
TERMDAT (LINDAS)Terminologie officielle multilingue
OGD — redistribution à confirmer
live / dérivés

Détails : LICENSING.md, ATTRIBUTIONS.md. Code Apache-2.0 · données CC-BY-4.0.

(06)

Connexion MCP

Serveur MCP distant (Streamable HTTP) — cinq outils, réponses toujours citées. Branche-le sur Cursor, Claude Desktop ou tout client MCP.

Endpoint https://openglossa.vercel.app/mcp

Configuration client (Cursor ~/.cursor/mcp.json ou Claude Desktop) :

{
  "mcpServers": {
    "openglossa": {
      "url": "https://openglossa.vercel.app/mcp"
    }
  }
}

Client en stdio uniquement ? Faites le pont avec npx mcp-remote https://openglossa.vercel.app/mcp.

Outils

lookup_term(query, src_lang, tgt_lang, domain?)
search_parallel(text, src_lang, tgt_lang, k)
verify_translation(src_term, tgt_term, src_lang, tgt_lang)
get_official_text(eli_or_citation, lang)
suggest_glossary(text, src_lang, tgt_lang)

Pipeline & serveur local

pip install -e ".[all]"
openglossa ingest-fedlex --articles --rs 220 --max-articles 200
openglossa build-index --encoder labse        # recherche sémantique
openglossa build-exports                       # TBX / TMX / CSV / JSONL / Parquet
python -m openglossa.mcp.server                # serveur MCP