# Guide d'accès aux sites de presse (testé mai 2026) ## Sites fonctionnels avec web_extract (Tier 1) | Site | URL | Notes | |---|---|---| | France Info | franceinfo.fr | OK — articles complets | | Radio France | radiofrance.fr | OK — articles et podcasts | | HuffPost FR | huffingtonpost.fr | OK — articles complets | | Le Parisien | leparisien.fr | OK — articles complets | | L'Humanité | humanite.fr | OK — articles complets (partiellement paywallé) | | Boursorama | boursorama.com | OK — actualités économiques | | Atlantico | atlantico.fr | Partiel — résumé seulement, paywall strict | | INSEE | insee.fr | OK — données et communiqués | | Legifrance | legifrance.gouv.fr | OK — textes officiels | | Assemblée nationale | assemblee-nationale.fr | OK | | Sénat | senat.fr | OK | | Élysée | elysee.fr | OK | | Gouvernement | gouv.fr | OK | ## Sites BLOQUÉS avec web_extract (Tier 2/3) — utiliser browser | Site | Blocage | Solution | |---|---|---| | Le Monde | CAPTCHA Cloudflare | `browser` → accès au premier extrait | | Le Figaro | Paywall + anti-bot | `browser` → accès partiel | | Libération | DataDome | `browser` → accès partiel | | Mediapart | Paywall strict | Snippet SearXNG + URL seule | | Les Echos | Paywall | `browser` → accès partiel | | Usine Digitale | DataDome | `browser` → accès partiel | | L'Obs / Nouvel Obs | Paywall | `browser` → accès partiel | | Le Monde diplomatique | Paywall | `browser` → accès partiel | ## Recommandation générale 1. **Toujours commencer par SearXNG** (hd.elm.re) pour identifier les articles 2. **Tenter `web_extract` en premier** — si le contenu est vide ou contient un CAPTCHA, basculer sur `browser` 3. **Pour les sites paywallés** : extraire le maximum du snippet SearXNG + métadonnées (titre, date, auteur) et signaler "réservé abonnés" 4. **Ne jamais inclure une URL non vérifiée** — toujours tester avec `browser_navigate` dernière étape ## Requêtes SearXNG optimisées par thème ```bash # Politique française récente "exclusif" OR "révélé" OR "scoop" site:lemonde.fr OR site:mediapart.fr OR site:liberation.fr OR site:lefigaro.fr # Géopolitique "exclusive" OR "leaked" OR "scoop" site:reuters.com OR site:ft.com OR site:bbc.com OR site:aljazeera.net # Institutionnel "décret" OR "nomination" OR "censuré" site:legifrance.gouv.fr OR site:elysee.fr OR site:gouv.fr # Économie "INSEE" OR "confiance des ménages" OR "chômage" site:insee.fr OR site:lesechos.fr OR site:bfmtv.com ```