Skip to content

Documents

Les documents sont les éléments individuels indexés par Hestyna : articles Confluence, pages Notion, messages Slack, tickets Jira, etc.

Cycle de vie

  1. Ingestion : l’intégration récupère le contenu brut (texte, HTML, métadonnées).
  2. Nettoyage : normalisation (en-têtes, puces, tableaux), retrait des contenus sensibles si vous avez configuré des règles de masquage.
  3. Découpage : transformation en sections courtes avec recouvrement pour préserver le contexte.
  4. Indexation : calcul des embeddings et stockage dans l’index associé.
  5. Citation : lors d’une réponse, l’assistant affiche le titre et le lien du document.

Timeline d’un document

Champs clés

ChampRôle
document_idIdentifiant unique (ex. ID de page Confluence).
titleIntitulé affiché dans les citations.
bodyContenu nettoyé, texte ou HTML autorisé.
summaryRésumé généré automatiquement (utile pour les agents).
languageLangue détectée ou forcée.
tagsMétadonnées libres (service, produit, région).

Bonnes pratiques

  • Nettoyez à la source : corrigez les documents Confluence/Notion pour éviter de propager des erreurs.
  • Structurez les titres : les citations utilisent les titres pour inspirer confiance.
  • Automatisez les mises à jour : un webhook ou une automation peut relancer l’ingestion après chaque publication.
  • Utilisez les tags : facilitez le filtrage (ex. {"audience": "manager"}).

Gestion des versions

  • Hestyna conserve la dernière version ingérée. Modifiez et resynchronisez pour remplacer.
  • Les index gardent trace de la date de mise à jour (last_synced_at).
  • Pour l’audit, exportez la table des documents depuis Connaissance → Export.

Retrait de contenu

  1. Localisez le document dans Connaissance → Documents.
  2. Cliquez sur Retirer pour rendre le document inactif immédiatement.
  3. Planifiez une resynchronisation pour supprimer définitivement du moteur.

En pratique :

Produit par l’équipe Hestyna