{"id":2085,"date":"2026-03-14T11:23:55","date_gmt":"2026-03-14T10:23:55","guid":{"rendered":"https:\/\/askem.eu\/?p=2085"},"modified":"2026-03-14T11:23:56","modified_gmt":"2026-03-14T10:23:56","slug":"construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm","status":"publish","type":"post","link":"https:\/\/askem.eu\/en\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/","title":{"rendered":"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM"},"content":{"rendered":"<h2 class=\"wp-block-heading\">Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM<\/h2>\n\n\n\n<p>Les portails de donn\u00e9es ouvertes comme CKAN regorgent de jeux de donn\u00e9es pr\u00e9cieux \u2014 CSV, JSON, PDF, m\u00e9tadonn\u00e9es descriptives. Mais interroger ces donn\u00e9es reste souvent fastidieux&nbsp;: il faut conna\u00eetre le bon jeu de donn\u00e9es, le bon champ, le bon filtre. Et si un assistant IA pouvait r\u00e9pondre directement \u00e0 vos questions en s&rsquo;appuyant sur ces donn\u00e9es&nbsp;? C&rsquo;est exactement ce que permet un pipeline <strong>RAG<\/strong> (Retrieval-Augmented Generation).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Qu&rsquo;est-ce que le RAG&nbsp;?<\/h3>\n\n\n\n<p>Le RAG est une architecture qui enrichit les r\u00e9ponses d&rsquo;un mod\u00e8le de langage (LLM) en lui fournissant du contexte issu de documents externes au moment de la requ\u00eate. Plut\u00f4t que de se fier uniquement \u00e0 ce que le mod\u00e8le a appris lors de son entra\u00eenement, le RAG va chercher les passages les plus pertinents dans une base documentaire, puis les injecte dans le prompt envoy\u00e9 au LLM. Le r\u00e9sultat&nbsp;: des r\u00e9ponses factuelles, sourc\u00e9es et \u00e0 jour.<\/p>\n\n\n\n<p>Cette approche r\u00e9sout deux probl\u00e8mes majeurs des LLM&nbsp;: les hallucinations (le mod\u00e8le invente des faits) et l&rsquo;obsolescence (le mod\u00e8le ne conna\u00eet pas les donn\u00e9es r\u00e9centes). En connectant un LLM \u00e0 un portail de donn\u00e9es ouvertes, on obtient un assistant capable de r\u00e9pondre avec les chiffres r\u00e9els, les derni\u00e8res mises \u00e0 jour, et les sources v\u00e9rifiables.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Architecture d&rsquo;un pipeline RAG pour l&rsquo;open data<\/h3>\n\n\n\n<p>Un pipeline RAG typique pour des donn\u00e9es ouvertes se compose de quatre \u00e9tapes principales.<\/p>\n\n\n\n<p><strong>1. Ingestion des donn\u00e9es.<\/strong> Les jeux de donn\u00e9es sont r\u00e9cup\u00e9r\u00e9s depuis l&rsquo;API CKAN (action <code>package_search<\/code>, <code>datastore_search<\/code>) ou t\u00e9l\u00e9charg\u00e9s directement. Les fichiers CSV sont pars\u00e9s, les PDF sont extraits via OCR si n\u00e9cessaire, et les m\u00e9tadonn\u00e9es (titre, description, organisation, date de mise \u00e0 jour) sont conserv\u00e9es comme contexte additionnel.<\/p>\n\n\n\n<p><strong>2. D\u00e9coupage et vectorisation.<\/strong> Les documents sont d\u00e9coup\u00e9s en chunks (fragments) de taille contr\u00f4l\u00e9e \u2014 typiquement 500 \u00e0 1000 tokens avec un chevauchement de 100 \u00e0 200 tokens. Chaque chunk est ensuite transform\u00e9 en vecteur (embedding) \u00e0 l&rsquo;aide d&rsquo;un mod\u00e8le comme <code>sentence-transformers\/all-MiniLM-L6-v2<\/code> ou, pour le fran\u00e7ais, <code>camembert-base<\/code>. Ces vecteurs capturent le sens s\u00e9mantique du texte.<\/p>\n\n\n\n<p><strong>3. Stockage dans une base vectorielle.<\/strong> Les embeddings sont index\u00e9s dans une base vectorielle comme ChromaDB, Qdrant ou pgvector (extension PostgreSQL). Le choix de pgvector est particuli\u00e8rement int\u00e9ressant si votre infrastructure utilise d\u00e9j\u00e0 PostgreSQL pour CKAN \u2014 un seul moteur de base de donn\u00e9es pour tout g\u00e9rer.<\/p>\n\n\n\n<p><strong>4. Requ\u00eate et g\u00e9n\u00e9ration.<\/strong> Lorsqu&rsquo;un utilisateur pose une question, celle-ci est vectoris\u00e9e avec le m\u00eame mod\u00e8le d&#8217;embedding, puis compar\u00e9e aux vecteurs stock\u00e9s pour retrouver les chunks les plus proches (recherche par similarit\u00e9 cosinus). Ces chunks sont inject\u00e9s dans le prompt du LLM, qui g\u00e9n\u00e8re une r\u00e9ponse contextualis\u00e9e et sourc\u00e9e.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exemple concret&nbsp;: un assistant pour les donn\u00e9es territoriales<\/h3>\n\n\n\n<p>Imaginons un portail open data r\u00e9gional contenant des jeux de donn\u00e9es sur les transports, la qualit\u00e9 de l&rsquo;air, les \u00e9quipements publics et le budget des collectivit\u00e9s. Avec un pipeline RAG, un citoyen pourrait poser des questions comme&nbsp;:<\/p>\n\n\n\n<p> \u00ab&nbsp;Quel est le budget d&rsquo;investissement de la m\u00e9tropole pour 2025&nbsp;?&nbsp;\u00bb<\/p>\n\n\n\n<p> \u00ab&nbsp;Quelles sont les lignes de bus les plus fr\u00e9quent\u00e9es&nbsp;?&nbsp;\u00bb<\/p>\n\n\n\n<p> \u00ab&nbsp;Comment a \u00e9volu\u00e9 la qualit\u00e9 de l&rsquo;air dans le centre-ville ces trois derni\u00e8res ann\u00e9es&nbsp;?&nbsp;\u00bb<\/p>\n\n\n\n<p>L&rsquo;assistant irait chercher les donn\u00e9es pertinentes dans la base vectorielle, les transmettrait au LLM, et fournirait une r\u00e9ponse claire avec la source exacte (nom du jeu de donn\u00e9es, date de derni\u00e8re mise \u00e0 jour, lien vers le portail).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Stack technique recommand\u00e9e<\/h3>\n\n\n\n<p>Pour un d\u00e9ploiement auto-h\u00e9berg\u00e9 et souverain, voici une stack coh\u00e9rente&nbsp;: <strong>CKAN<\/strong> comme source de donn\u00e9es, <strong>Python<\/strong> avec LangChain ou LlamaIndex pour l&rsquo;orchestration du pipeline, <strong>pgvector<\/strong> pour le stockage vectoriel (r\u00e9utilisant le PostgreSQL existant), <strong>Ollama<\/strong> pour ex\u00e9cuter un LLM en local (Mistral, Llama 3 ou un mod\u00e8le fine-tun\u00e9 pour le fran\u00e7ais), et un mod\u00e8le d&#8217;embedding open source h\u00e9berg\u00e9 localement.<\/p>\n\n\n\n<p>L&rsquo;avantage de cette approche&nbsp;: aucune donn\u00e9e ne quitte votre infrastructure. Les donn\u00e9es ouvertes restent sur vos serveurs, le LLM tourne en local, et les embeddings sont stock\u00e9s dans votre propre base PostgreSQL. C&rsquo;est un point crucial pour les collectivit\u00e9s et organisations publiques soumises \u00e0 des contraintes de souverainet\u00e9 num\u00e9rique.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Bonnes pratiques pour un RAG efficace<\/h3>\n\n\n\n<p>La qualit\u00e9 d&rsquo;un pipeline RAG d\u00e9pend largement de la qualit\u00e9 de l&rsquo;ingestion. Quelques recommandations&nbsp;: nettoyer les donn\u00e9es avant l&rsquo;indexation (supprimer les lignes vides, normaliser les encodages), enrichir chaque chunk avec ses m\u00e9tadonn\u00e9es (source, date, organisation productrice), mettre en place une synchronisation r\u00e9guli\u00e8re avec l&rsquo;API CKAN pour refl\u00e9ter les mises \u00e0 jour des jeux de donn\u00e9es, et tester la pertinence des r\u00e9sultats avec un jeu de questions-r\u00e9ponses de r\u00e9f\u00e9rence.<\/p>\n\n\n\n<p>Il est \u00e9galement important de g\u00e9rer les cas limites&nbsp;: que faire quand aucun document pertinent n&rsquo;est trouv\u00e9&nbsp;? Le LLM doit \u00eatre instruit de r\u00e9pondre honn\u00eatement qu&rsquo;il n&rsquo;a pas trouv\u00e9 l&rsquo;information plut\u00f4t que d&rsquo;inventer une r\u00e9ponse. Un seuil de similarit\u00e9 minimum (par exemple 0.7) permet de filtrer les r\u00e9sultats trop \u00e9loign\u00e9s de la question.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Perspectives<\/h3>\n\n\n\n<p>Le RAG appliqu\u00e9 aux donn\u00e9es ouvertes ouvre des perspectives consid\u00e9rables pour la d\u00e9mocratie num\u00e9rique&nbsp;: rendre les donn\u00e9es publiques v\u00e9ritablement accessibles \u00e0 tous, sans comp\u00e9tence technique pr\u00e9alable. Coupl\u00e9 \u00e0 un MCP server (Model Context Protocol), ce pipeline peut \u00eatre expos\u00e9 comme un outil pour des agents IA, permettant \u00e0 des syst\u00e8mes multi-agents d&rsquo;interroger automatiquement les donn\u00e9es publiques dans le cadre de workflows plus complexes.<\/p>\n\n\n\n<p>L&rsquo;enjeu n&rsquo;est plus de publier des donn\u00e9es ouvertes, mais de les rendre r\u00e9ellement utilisables. Le RAG est une des cl\u00e9s pour y parvenir.<\/p>","protected":false},"excerpt":{"rendered":"<p>Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM Les portails de donn\u00e9es ouvertes comme CKAN regorgent de jeux de donn\u00e9es pr\u00e9cieux \u2014 CSV, JSON, PDF, m\u00e9tadonn\u00e9es descriptives. Mais interroger ces donn\u00e9es reste souvent fastidieux&nbsp;: il faut conna\u00eetre le bon jeu de donn\u00e9es, le bon champ, le bon filtre. Et si un [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":2086,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ocean_post_layout":"","ocean_both_sidebars_style":"","ocean_both_sidebars_content_width":0,"ocean_both_sidebars_sidebars_width":0,"ocean_sidebar":"","ocean_second_sidebar":"","ocean_disable_margins":"enable","ocean_add_body_class":"","ocean_shortcode_before_top_bar":"","ocean_shortcode_after_top_bar":"","ocean_shortcode_before_header":"","ocean_shortcode_after_header":"","ocean_has_shortcode":"","ocean_shortcode_after_title":"","ocean_shortcode_before_footer_widgets":"","ocean_shortcode_after_footer_widgets":"","ocean_shortcode_before_footer_bottom":"","ocean_shortcode_after_footer_bottom":"","ocean_display_top_bar":"default","ocean_display_header":"default","ocean_header_style":"","ocean_center_header_left_menu":"","ocean_custom_header_template":"","ocean_custom_logo":0,"ocean_custom_retina_logo":0,"ocean_custom_logo_max_width":0,"ocean_custom_logo_tablet_max_width":0,"ocean_custom_logo_mobile_max_width":0,"ocean_custom_logo_max_height":0,"ocean_custom_logo_tablet_max_height":0,"ocean_custom_logo_mobile_max_height":0,"ocean_header_custom_menu":"","ocean_menu_typo_font_family":"","ocean_menu_typo_font_subset":"","ocean_menu_typo_font_size":0,"ocean_menu_typo_font_size_tablet":0,"ocean_menu_typo_font_size_mobile":0,"ocean_menu_typo_font_size_unit":"px","ocean_menu_typo_font_weight":"","ocean_menu_typo_font_weight_tablet":"","ocean_menu_typo_font_weight_mobile":"","ocean_menu_typo_transform":"","ocean_menu_typo_transform_tablet":"","ocean_menu_typo_transform_mobile":"","ocean_menu_typo_line_height":0,"ocean_menu_typo_line_height_tablet":0,"ocean_menu_typo_line_height_mobile":0,"ocean_menu_typo_line_height_unit":"","ocean_menu_typo_spacing":0,"ocean_menu_typo_spacing_tablet":0,"ocean_menu_typo_spacing_mobile":0,"ocean_menu_typo_spacing_unit":"","ocean_menu_link_color":"","ocean_menu_link_color_hover":"","ocean_menu_link_color_active":"","ocean_menu_link_background":"","ocean_menu_link_hover_background":"","ocean_menu_link_active_background":"","ocean_menu_social_links_bg":"","ocean_menu_social_hover_links_bg":"","ocean_menu_social_links_color":"","ocean_menu_social_hover_links_color":"","ocean_disable_title":"default","ocean_disable_heading":"default","ocean_post_title":"","ocean_post_subheading":"","ocean_post_title_style":"","ocean_post_title_background_color":"","ocean_post_title_background":0,"ocean_post_title_bg_image_position":"","ocean_post_title_bg_image_attachment":"","ocean_post_title_bg_image_repeat":"","ocean_post_title_bg_image_size":"","ocean_post_title_height":0,"ocean_post_title_bg_overlay":0.5,"ocean_post_title_bg_overlay_color":"","ocean_disable_breadcrumbs":"default","ocean_breadcrumbs_color":"","ocean_breadcrumbs_separator_color":"","ocean_breadcrumbs_links_color":"","ocean_breadcrumbs_links_hover_color":"","ocean_display_footer_widgets":"default","ocean_display_footer_bottom":"default","ocean_custom_footer_template":"","osh_disable_topbar_sticky":"default","osh_disable_header_sticky":"default","osh_sticky_header_style":"default","osh_sticky_header_effect":"","osh_custom_sticky_logo":0,"osh_custom_retina_sticky_logo":0,"osh_custom_sticky_logo_height":0,"osh_background_color":"","osh_links_color":"","osh_links_hover_color":"","osh_links_active_color":"","osh_links_bg_color":"","osh_links_hover_bg_color":"","osh_links_active_bg_color":"","osh_menu_social_links_color":"","osh_menu_social_hover_links_color":"","ocean_post_oembed":"","ocean_post_self_hosted_media":"","ocean_post_video_embed":"","ocean_link_format":"","ocean_link_format_target":"self","ocean_quote_format":"","ocean_quote_format_link":"post","ocean_gallery_link_images":"on","ocean_gallery_id":[],"footnotes":""},"categories":[16,17],"tags":[],"class_list":["post-2085","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai","category-data","entry","has-media"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.3 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM - askem<\/title>\n<meta name=\"description\" content=\"ASKEM BUREAU D&#039;\u00c9TUDES ET DE FORMATION NUM\u00c9RIQUE. Nous vous assistons dans la transformation num\u00e9rique de vos outils, services et organisations tout en pla\u00e7ant l\u2019humain au c\u0153ur de notre d\u00e9marche d\u2019accompagnement.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/askem.eu\/en\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM - askem\" \/>\n<meta property=\"og:description\" content=\"ASKEM BUREAU D&#039;\u00c9TUDES ET DE FORMATION NUM\u00c9RIQUE. Nous vous assistons dans la transformation num\u00e9rique de vos outils, services et organisations tout en pla\u00e7ant l\u2019humain au c\u0153ur de notre d\u00e9marche d\u2019accompagnement.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/askem.eu\/en\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/\" \/>\n<meta property=\"og:site_name\" content=\"askem\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/fb.me\/askem.eu\" \/>\n<meta property=\"article:published_time\" content=\"2026-03-14T10:23:55+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2026-03-14T10:23:56+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:auto\/h:auto\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2026\/03\/sujet-askem-2026-03-14.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1200\" \/>\n\t<meta property=\"og:image:height\" content=\"1200\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"askemadmin\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"askemadmin\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/\"},\"author\":{\"name\":\"askemadmin\",\"@id\":\"https:\\\/\\\/askem.eu\\\/#\\\/schema\\\/person\\\/8bbee74ab9a977d56bf4826662e9d2e9\"},\"headline\":\"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM\",\"datePublished\":\"2026-03-14T10:23:55+00:00\",\"dateModified\":\"2026-03-14T10:23:56+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/\"},\"wordCount\":1020,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\/\\/askem.eu\\/wp-content\\/uploads\\/2026\\/03\\/sujet-askem-2026-03-14.png\",\"articleSection\":[\"AI\",\"Data\"],\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/\",\"url\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/\",\"name\":\"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM - askem\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\/\\/askem.eu\\/wp-content\\/uploads\\/2026\\/03\\/sujet-askem-2026-03-14.png\",\"datePublished\":\"2026-03-14T10:23:55+00:00\",\"dateModified\":\"2026-03-14T10:23:56+00:00\",\"description\":\"ASKEM BUREAU D'\u00c9TUDES ET DE FORMATION NUM\u00c9RIQUE. Nous vous assistons dans la transformation num\u00e9rique de vos outils, services et organisations tout en pla\u00e7ant l\u2019humain au c\u0153ur de notre d\u00e9marche d\u2019accompagnement.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#primaryimage\",\"url\":\"https:\\/\\/askem.eu\\/wp-content\\/uploads\\/2026\\/03\\/sujet-askem-2026-03-14.png\",\"contentUrl\":\"https:\\/\\/askem.eu\\/wp-content\\/uploads\\/2026\\/03\\/sujet-askem-2026-03-14.png\",\"width\":1200,\"height\":1200},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/askem.eu\\\/2026\\\/03\\\/14\\\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Accueil\",\"item\":\"https:\\\/\\\/askem.eu\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/askem.eu\\\/#website\",\"url\":\"https:\\\/\\\/askem.eu\\\/\",\"name\":\"askem\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/askem.eu\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/askem.eu\\\/#organization\",\"name\":\"Askem\",\"url\":\"https:\\\/\\\/askem.eu\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\\\/\\\/askem.eu\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\/\\/mlpi0fxo3sth.i.optimole.com\\/cb:3obA.c61\\/w:760\\/h:480\\/q:mauto\\/f:best\\/https:\\/\\/askem.eu\\/wp-content\\/uploads\\/2020\\/10\\/logoGalaxieAskem3.png\",\"contentUrl\":\"https:\\/\\/mlpi0fxo3sth.i.optimole.com\\/cb:3obA.c61\\/w:760\\/h:480\\/q:mauto\\/f:best\\/https:\\/\\/askem.eu\\/wp-content\\/uploads\\/2020\\/10\\/logoGalaxieAskem3.png\",\"width\":760,\"height\":480,\"caption\":\"Askem\"},\"image\":{\"@id\":\"https:\\\/\\\/askem.eu\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/fb.me\\\/askem.eu\",\"https:\\\/\\\/linkedin.com\\\/company\\\/askem-eu\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/askem.eu\\\/#\\\/schema\\\/person\\\/8bbee74ab9a977d56bf4826662e9d2e9\",\"name\":\"askemadmin\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a202f744ee3a4b6fdbe2ceb57fd84c72559337791a276662270d8d2fb7842e3f?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a202f744ee3a4b6fdbe2ceb57fd84c72559337791a276662270d8d2fb7842e3f?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/a202f744ee3a4b6fdbe2ceb57fd84c72559337791a276662270d8d2fb7842e3f?s=96&d=mm&r=g\",\"caption\":\"askemadmin\"},\"sameAs\":[\"https:\\\/\\\/askem.eu\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM - askem","description":"ASKEM BUREAU D'\u00c9TUDES ET DE FORMATION NUM\u00c9RIQUE. Nous vous assistons dans la transformation num\u00e9rique de vos outils, services et organisations tout en pla\u00e7ant l\u2019humain au c\u0153ur de notre d\u00e9marche d\u2019accompagnement.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/askem.eu\/en\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/","og_locale":"en_US","og_type":"article","og_title":"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM - askem","og_description":"ASKEM BUREAU D'\u00c9TUDES ET DE FORMATION NUM\u00c9RIQUE. Nous vous assistons dans la transformation num\u00e9rique de vos outils, services et organisations tout en pla\u00e7ant l\u2019humain au c\u0153ur de notre d\u00e9marche d\u2019accompagnement.","og_url":"https:\/\/askem.eu\/en\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/","og_site_name":"askem","article_publisher":"https:\/\/fb.me\/askem.eu","article_published_time":"2026-03-14T10:23:55+00:00","article_modified_time":"2026-03-14T10:23:56+00:00","og_image":[{"width":1200,"height":1200,"url":"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:auto\/h:auto\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2026\/03\/sujet-askem-2026-03-14.png","type":"image\/png"}],"author":"askemadmin","twitter_card":"summary_large_image","twitter_misc":{"Written by":"askemadmin","Est. reading time":"5 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#article","isPartOf":{"@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/"},"author":{"name":"askemadmin","@id":"https:\/\/askem.eu\/#\/schema\/person\/8bbee74ab9a977d56bf4826662e9d2e9"},"headline":"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM","datePublished":"2026-03-14T10:23:55+00:00","dateModified":"2026-03-14T10:23:56+00:00","mainEntityOfPage":{"@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/"},"wordCount":1020,"commentCount":0,"publisher":{"@id":"https:\/\/askem.eu\/#organization"},"image":{"@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#primaryimage"},"thumbnailUrl":"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:auto\/h:auto\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2026\/03\/sujet-askem-2026-03-14.png","articleSection":["AI","Data"],"inLanguage":"en-US","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/","url":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/","name":"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM - askem","isPartOf":{"@id":"https:\/\/askem.eu\/#website"},"primaryImageOfPage":{"@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#primaryimage"},"image":{"@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#primaryimage"},"thumbnailUrl":"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:auto\/h:auto\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2026\/03\/sujet-askem-2026-03-14.png","datePublished":"2026-03-14T10:23:55+00:00","dateModified":"2026-03-14T10:23:56+00:00","description":"ASKEM BUREAU D'\u00c9TUDES ET DE FORMATION NUM\u00c9RIQUE. Nous vous assistons dans la transformation num\u00e9rique de vos outils, services et organisations tout en pla\u00e7ant l\u2019humain au c\u0153ur de notre d\u00e9marche d\u2019accompagnement.","breadcrumb":{"@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/"]}]},{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#primaryimage","url":"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:auto\/h:auto\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2026\/03\/sujet-askem-2026-03-14.png","contentUrl":"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:auto\/h:auto\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2026\/03\/sujet-askem-2026-03-14.png","width":1200,"height":1200},{"@type":"BreadcrumbList","@id":"https:\/\/askem.eu\/2026\/03\/14\/construire-un-pipeline-rag-pour-exploiter-les-donnees-ouvertes-avec-un-llm\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Accueil","item":"https:\/\/askem.eu\/"},{"@type":"ListItem","position":2,"name":"Construire un pipeline RAG pour exploiter les donn\u00e9es ouvertes avec un LLM"}]},{"@type":"WebSite","@id":"https:\/\/askem.eu\/#website","url":"https:\/\/askem.eu\/","name":"askem","description":"","publisher":{"@id":"https:\/\/askem.eu\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/askem.eu\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Organization","@id":"https:\/\/askem.eu\/#organization","name":"Askem","url":"https:\/\/askem.eu\/","logo":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/askem.eu\/#\/schema\/logo\/image\/","url":"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:760\/h:480\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2020\/10\/logoGalaxieAskem3.png","contentUrl":"https:\/\/mlpi0fxo3sth.i.optimole.com\/cb:3obA.c61\/w:760\/h:480\/q:mauto\/f:best\/https:\/\/askem.eu\/wp-content\/uploads\/2020\/10\/logoGalaxieAskem3.png","width":760,"height":480,"caption":"Askem"},"image":{"@id":"https:\/\/askem.eu\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/fb.me\/askem.eu","https:\/\/linkedin.com\/company\/askem-eu"]},{"@type":"Person","@id":"https:\/\/askem.eu\/#\/schema\/person\/8bbee74ab9a977d56bf4826662e9d2e9","name":"askemadmin","image":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/secure.gravatar.com\/avatar\/a202f744ee3a4b6fdbe2ceb57fd84c72559337791a276662270d8d2fb7842e3f?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/a202f744ee3a4b6fdbe2ceb57fd84c72559337791a276662270d8d2fb7842e3f?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/a202f744ee3a4b6fdbe2ceb57fd84c72559337791a276662270d8d2fb7842e3f?s=96&d=mm&r=g","caption":"askemadmin"},"sameAs":["https:\/\/askem.eu"]}]}},"_links":{"self":[{"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/posts\/2085","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/comments?post=2085"}],"version-history":[{"count":1,"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/posts\/2085\/revisions"}],"predecessor-version":[{"id":2087,"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/posts\/2085\/revisions\/2087"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/media\/2086"}],"wp:attachment":[{"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/media?parent=2085"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/categories?post=2085"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/askem.eu\/en\/wp-json\/wp\/v2\/tags?post=2085"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}