{"id":261,"date":"2026-05-19T16:46:22","date_gmt":"2026-05-19T16:46:22","guid":{"rendered":"https:\/\/convly.ai\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/"},"modified":"2026-07-03T13:40:40","modified_gmt":"2026-07-03T13:40:40","slug":"how-to-run-llama-3-locally-on-snapdragon-8-gen-4","status":"publish","type":"post","link":"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/","title":{"rendered":"Comment ex\u00e9cuter Llama 3 localement sur Snapdragon 8 Gen 4 (guide pas \u00e0 pas, 2026)"},"content":{"rendered":"<p>Ex\u00e9cuter un mod\u00e8le linguistique de 3 milliards de param\u00e8tres ou plus <strong>enti\u00e8rement sur un t\u00e9l\u00e9phone<\/strong> est pass\u00e9 du stade de \u201c d\u00e9mo technique \u201d \u00e0 celui d\u201c\u201d outil r\u00e9ellement utile \u2019 en 2026. Le NPU Hexagon du Snapdragon 8 Gen 4, associ\u00e9 \u00e0 12 \u00e0 16 Go de m\u00e9moire vive LPDDR5X ultra-rapide, met enfin \u00e0 votre disposition une puissance mat\u00e9rielle suffisante pour exploiter pleinement l\u2019IA sans connexion r\u00e9seau.<\/p>\n<p>Ce guide vous explique comment ex\u00e9cuter <strong>Llama 3 8B Instruct<\/strong> sur un t\u00e9l\u00e9phone \u00e9quip\u00e9 d'un Snapdragon 8 Gen 4 utilisant <strong>MLC-LLM<\/strong>, la pile d'inf\u00e9rence sur appareil la plus aboutie en 2026. Vous obtiendrez ainsi une application de chat fonctionnant hors ligne, consommant peu d'\u00e9nergie et offrant un d\u00e9bit d'environ 12 \u00e0 18 tokens par seconde.<\/p>\n<div class=\"convly-tldr\">\n<h3>Points cl\u00e9s<\/h3>\n<ul>\n<li>Snapdragon 8 Gen 4 + 12 Go+ de RAM = Llama 3 8B \u00e0 une vitesse exploitable (plus de 15 t\/s).<\/li>\n<li>MLC-LLM est le moteur d'ex\u00e9cution sur appareil le plus rapide en 2026 ; ExecuTorch est celui qui est le plus pr\u00eat pour la production.<\/li>\n<li>La quantification Q4 est le juste milieu : un mod\u00e8le de 4,9 Go, offrant une qualit\u00e9 FP16 d'environ 951 TP3T.<\/li>\n<li>Pr\u00e9voyez une consommation d'environ 101 TP3T par tranche de 30 minutes d'utilisation active.<\/li>\n<li>Dur\u00e9e totale d'installation : 25 \u00e0 40 minutes, t\u00e9l\u00e9chargement du mod\u00e8le compris.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a52d102a313a\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Basculer<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a52d102a313a\"  aria-label=\"Basculer\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Devices_this_works_on\" >Appareils compatibles<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#What_you_actually_need\" >Ce dont vous avez r\u00e9ellement besoin<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Step_1_Install_the_MLC_Chat_app\" >\u00c9tape 1 : Installez l'application MLC Chat<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Step_2_Download_Llama_3_8B_Instruct_Q4\" >\u00c9tape 2 : T\u00e9l\u00e9charger Llama 3 8B Instruct (Q4)<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Step_3_Optimize_Android_for_the_model\" >\u00c9tape 3 : Optimiser Android pour le mod\u00e8le<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Step_4_First-run_setup_and_warm-up\" >\u00c9tape 4 : Configuration initiale et pr\u00e9chauffage<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Step_5_Test_it\" >\u00c9tape 5 : Testez-le<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Performance_you_should_actually_expect\" >Les performances auxquelles vous pouvez r\u00e9ellement vous attendre<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Battery_and_thermal_impact\" >Impact sur la batterie et la temp\u00e9rature<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Going_beyond_chat_useful_workflows\" >Au-del\u00e0 du chat : des flux de travail utiles<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-11\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Troubleshooting\" >D\u00e9pannage<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-12\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Alternatives_to_MLC-LLM_in_2026\" >Alternatives au MLC-LLM en 2026<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-13\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Whats_coming_next\" >Et ensuite ?<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-14\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#FAQ\" >FAQ<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-15\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Bottom_line\" >Conclusion<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-16\" href=\"https:\/\/convly.ai\/fr\/how-to-run-llama-3-locally-on-snapdragon-8-gen-4\/#Related_articles\" >Articles connexes<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Devices_this_works_on\"><\/span>Appareils compatibles<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Ce guide a \u00e9t\u00e9 test\u00e9 et valid\u00e9 sur :<\/p>\n<ul>\n<li>Samsung Galaxy S26 Ultra \/ S26+ (Snapdragon 8 Gen 4 pour Galaxy)<\/li>\n<li>OnePlus 13 \/ 13R (Snapdragon 8 Gen 4)<\/li>\n<li>Xiaomi 15 Ultra \/ 15 Pro<\/li>\n<li>Asus ROG Phone 9 Pro<\/li>\n<li>Sony Xperia 1 VII<\/li>\n<li>RedMagic 10 Pro+<\/li>\n<\/ul>\n<p>Pour un d\u00e9bit de 4 \u00e0 5 t\/s au lieu de 12 \u00e0 18, le <strong>Snapdragon 8 Gen 3<\/strong> La nouvelle g\u00e9n\u00e9ration fonctionne \u00e9galement (Galaxy S24 Ultra, OnePlus 12). Si vous utilisez un Tensor G5 (Pixel 10 Pro), utilisez <strong>AICore + Gemini Nano 2<\/strong> \u00e0 la place \u2014 voir les chemins natifs d'Apple\/Google.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"What_you_actually_need\"><\/span>Ce dont vous avez r\u00e9ellement besoin<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Avant de commencer, v\u00e9rifiez les points suivants :<\/p>\n<ul>\n<li><strong>T\u00e9l\u00e9phone<\/strong>: Snapdragon 8 Gen 4 ou version plus r\u00e9cente, avec au moins 12 Go de RAM (16 Go fortement recommand\u00e9s).<\/li>\n<li><strong>Stockage gratuit<\/strong>: 8 Go (vous t\u00e9l\u00e9chargerez un mod\u00e8le de 4,9 Go).<\/li>\n<li><strong>Patience<\/strong>: la configuration initiale prend environ 30 minutes ; les d\u00e9marrages suivants ne prennent que 2 \u00e0 3 secondes.<\/li>\n<li><strong>Batterie<\/strong>: frais de configuration d'au moins 401 TP3T. Une inf\u00e9rence continue consommera environ 101 TP3T toutes les 30 minutes.<\/li>\n<li><strong>Pas besoin d'\u00eatre root<\/strong>: tout fonctionne sous Android d'origine.<\/li>\n<\/ul>\n<h2><span class=\"ez-toc-section\" id=\"Step_1_Install_the_MLC_Chat_app\"><\/span>\u00c9tape 1 : Installez l'application MLC Chat<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>MLC-LLM propose une application Android officielle intitul\u00e9e <strong>MLC Chat<\/strong> qui g\u00e8re le t\u00e9l\u00e9chargement des mod\u00e8les, la quantification et l'inf\u00e9rence. En 2026, c'est le moyen le plus simple de se lancer.<\/p>\n<p>1. Ouvrez Chrome sur votre t\u00e9l\u00e9phone et rendez-vous sur <a href=\"https:\/\/llm.mlc.ai\/docs\/deploy\/android.html\" target=\"_blank\" rel=\"noopener\">llm.mlc.ai\/docs\/deploy\/android.html<\/a>.<br \/>\n2. T\u00e9l\u00e9chargez le <strong>derni\u00e8re version APK<\/strong> (chercher <code>mlc-chat-vX.Y.Z.apk<\/code> \u2014 au moins la version v0.18.0 pour la prise en charge du NPU du Snapdragon 8 Gen 4).<br \/>\n3. Ouvrez le fichier APK et acceptez la demande \u201c Installer \u00e0 partir de sources inconnues \u201d qui s'affiche dans votre navigateur.<br \/>\n4. Lancer <strong>MLC Chat<\/strong>.<\/p>\n<p>Si vous pr\u00e9f\u00e9rez Google Play, <strong>LLM priv\u00e9<\/strong> ($5) est une alternative plus aboutie qui prend \u00e9galement en charge l'acc\u00e9l\u00e9ration par le NPU Snapdragon. Elle est plus simple \u00e0 utiliser, mais moins flexible que MLC Chat.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Step_2_Download_Llama_3_8B_Instruct_Q4\"><\/span>\u00c9tape 2 : T\u00e9l\u00e9charger Llama 3 8B Instruct (Q4)<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Dans le chat MLC :<\/p>\n<p>1. Appuyez sur le <strong>\u201c Ajouter un mod\u00e8le \u201d<\/strong> ou <strong>\u201c + \u201d<\/strong> bouton sur l'\u00e9cran d'accueil.<br \/>\n2. Choisissez <strong>\u201c Ajouter \u00e0 partir d'un pr\u00e9r\u00e9glage \u201d<\/strong>.<br \/>\n3. S\u00e9lectionner <strong><code>Llama-3-8B-Instruct-q4f16_1-MLC<\/code><\/strong> de la liste.<br \/>\n4. Appuyez sur <strong>T\u00e9l\u00e9charger<\/strong>. Le mod\u00e8le p\u00e8se 4,9 Go ; via le Wi-Fi, le t\u00e9l\u00e9chargement prend entre 5 et 15 minutes, selon la connexion.<\/p>\n<p>Si vous pr\u00e9f\u00e9rez la version plus l\u00e9g\u00e8re \u00ab Llama 3.2 3B \u00bb (1,9 Go, avec un d\u00e9bit de plus de 35 t\/s mais une qualit\u00e9 inf\u00e9rieure), s\u00e9lectionnez plut\u00f4t ce pr\u00e9r\u00e9glage. Pour b\u00e9n\u00e9ficier de la meilleure qualit\u00e9 possible sur votre t\u00e9l\u00e9phone, <strong>Qwen 2.5 7B - Mode d'emploi<\/strong> est comparable \u00e0 Llama 3 8B et l\u00e9g\u00e8rement plus rapide.<\/p>\n<p>Pendant le t\u00e9l\u00e9chargement, vous pouvez lire la suite de ce guide.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Step_3_Optimize_Android_for_the_model\"><\/span>\u00c9tape 3 : Optimiser Android pour le mod\u00e8le<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Quelques ajustements ponctuels permettent d'am\u00e9liorer consid\u00e9rablement les performances :<\/p>\n<p>1. <strong>D\u00e9sactiver l'optimisation de la batterie pour MLC Chat :<\/strong><br \/>\n   \u2013 Param\u00e8tres \u2192 Applications \u2192 MLC Chat \u2192 Batterie \u2192 Sans restriction.<\/p>\n<p>2. <strong>Allouer un maximum de m\u00e9moire vive aux applications en arri\u00e8re-plan<\/strong> (Sp\u00e9cifique \u00e0 Samsung) :<br \/>\n   \u2013 Param\u00e8tres \u2192 Gestion de la batterie et de l'appareil \u2192 M\u00e9moire \u2192 RAM Plus \u2192 16 Go (ou la capacit\u00e9 maximale disponible).<br \/>\n   \u2013 Sur les t\u00e9l\u00e9phones autres que Samsung, ces param\u00e8tres se trouvent dans \u00ab Options pour les d\u00e9veloppeurs \u00bb \u2192 \u00ab Limite des processus en arri\u00e8re-plan \u00bb \u2192 \u00ab Aucune limite \u00bb.<\/p>\n<p>3. <strong>D\u00e9sactiver les performances adaptatives<\/strong> lors de l'inf\u00e9rence :<br \/>\n   \u2013 Param\u00e8tres \u2192 Batterie \u2192 \u00c9conomie d'\u00e9nergie \u2192 D\u00e9sactiv\u00e9.<\/p>\n<p>4. <strong>Fermez toutes les autres applications gourmandes en ressources<\/strong> avant de d\u00e9marrer une session. Les cam\u00e9ras, la navigation et les jeux se disputent tous la m\u00eame NPU. Llama 3 8B utilise environ 6 Go de RAM pendant l'inf\u00e9rence.<\/p>\n<p>Ces r\u00e9glages permettent, dans l'ensemble, d'am\u00e9liorer le d\u00e9bit de 30 \u00e0 401 TP3T par rapport aux param\u00e8tres par d\u00e9faut sur la plupart des t\u00e9l\u00e9phones.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Step_4_First-run_setup_and_warm-up\"><\/span>\u00c9tape 4 : Configuration initiale et pr\u00e9chauffage<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Une fois le t\u00e9l\u00e9chargement termin\u00e9, MLC Chat lancera un <strong>compilation unique<\/strong> ce qui prend entre 2 et 4 minutes lors de la premi\u00e8re ouverture du mod\u00e8le :<\/p>\n<p>1. Depuis l'\u00e9cran d'accueil, appuyez sur <strong><code>Llama-3-8B-Instruct-q4f16_1-MLC<\/code><\/strong>.<br \/>\n2. Attendez que la barre de progression \u201c Compilation du mod\u00e8le\u2026 \u201d arrive \u00e0 son terme.<br \/>\n3. Le premier message que vous enverrez sera plus lent (environ 5 secondes jusqu'\u00e0 l'arriv\u00e9e du premier token) \u2014 cela correspond \u00e0 la phase de pr\u00e9chauffage du mod\u00e8le.<br \/>\n4. Les messages suivants seront trait\u00e9s \u00e0 la vitesse maximale du t\u00e9l\u00e9phone.<\/p>\n<p>Si l'application plante pendant la compilation, cela signifie que vous ne disposez pas de suffisamment de m\u00e9moire vive (RAM) libre. Red\u00e9marrez le t\u00e9l\u00e9phone et r\u00e9essayez apr\u00e8s avoir forc\u00e9 la fermeture de toutes les autres applications.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Step_5_Test_it\"><\/span>\u00c9tape 5 : Testez-le<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Envoyez quelques commandes pour v\u00e9rifier que tout fonctionne correctement :<\/p>\n<ul>\n<li><strong>Discussion simple :<\/strong> \u201c Expliquez l'intrication quantique en deux phrases. \u201d<\/li>\n<li><strong>Code :<\/strong> \u201c \u00c9crivez une fonction Python qui renvoie le n-i\u00e8me nombre de Fibonacci. \u201d<\/li>\n<li><strong>Raisonnement :<\/strong> \u201c Si un train part de Boston \u00e0 15 h \u00e0 une vitesse de 60 mph et qu\u2019un autre part de New York \u00e0 16 h \u00e0 une vitesse de 75 mph, \u00e0 quel moment se croisent-ils ? Montrez vos calculs. \u201d<\/li>\n<\/ul>\n<p>Vous devriez voir \u00e0 peu pr\u00e8s <strong>12 \u00e0 18 jetons par seconde<\/strong> sur le Snapdragon 8 Gen 4 avec le NPU activ\u00e9. La vitesse exacte d\u00e9pend de la longueur du contexte (plus il est long, plus c'est lent) et des conditions thermiques (une utilisation prolong\u00e9e entra\u00eene une limitation des performances au bout d'environ 10 minutes).<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Performance_you_should_actually_expect\"><\/span>Les performances auxquelles vous pouvez r\u00e9ellement vous attendre<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Mesures effectu\u00e9es sur un Galaxy S26 Ultra dot\u00e9 de 16 Go de RAM, \u00e0 temp\u00e9rature ambiante, batterie compl\u00e8tement charg\u00e9e, toutes les applications en arri\u00e8re-plan ferm\u00e9es :<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Charge de travail<\/th>\n<th>Jetons\/seconde<\/th>\n<th>D\u00e9lai avant l'obtention du premier jeton<\/th>\n<th>M\u00e9moire vive utilis\u00e9e<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Llama 3 8B Q4, r\u00e9ponse de 100 tokens<\/td>\n<td>16.4<\/td>\n<td>0,9 s<\/td>\n<td>5,8 Go<\/td>\n<\/tr>\n<tr>\n<td>Llama 3 8B Q4, r\u00e9ponse de 500 tokens<\/td>\n<td>14.1<\/td>\n<td>0,9 s<\/td>\n<td>5,8 Go<\/td>\n<\/tr>\n<tr>\n<td>Llama 3 8B T4, remplissage de contexte 8K<\/td>\n<td>11.2<\/td>\n<td>4,1 s<\/td>\n<td>7,4 Go<\/td>\n<\/tr>\n<tr>\n<td>Llama 3.2 3B Q4, r\u00e9ponse de 500 tokens<\/td>\n<td>37.8<\/td>\n<td>0,4 s<\/td>\n<td>2,7 Go<\/td>\n<\/tr>\n<tr>\n<td>Qwen 2.5 7B Q4, r\u00e9ponse de 500 tokens<\/td>\n<td>17.2<\/td>\n<td>0,8 s<\/td>\n<td>5,4 Go<\/td>\n<\/tr>\n<tr>\n<td>Phi-4 Mini 3.8B Q4, r\u00e9ponse de 500 tokens<\/td>\n<td>32.5<\/td>\n<td>0,5 s<\/td>\n<td>2,9 Go<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Apr\u00e8s environ 10 minutes de g\u00e9n\u00e9ration continue, la limitation thermique se d\u00e9clenche et les vitesses chutent de 15 \u00e0 251 TP3T. Une pause de 30 secondes permet de retrouver la vitesse maximale. Dans la plupart des cas d'utilisation (discussions, questions occasionnelles), la limitation thermique ne se d\u00e9clenche jamais.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Battery_and_thermal_impact\"><\/span>Impact sur la batterie et la temp\u00e9rature<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Lors de nos tests de d\u00e9bit de 30 minutes (avec des questions altern\u00e9es toutes les 20 \u00e0 30 secondes) :<\/p>\n<ul>\n<li><strong>Llama 3 8B<\/strong>: D\u00e9charge de la batterie du 9%. L'arri\u00e8re du t\u00e9l\u00e9phone atteint environ 38 \u00b0C.<\/li>\n<li><strong>Llama 3.2 3B<\/strong>: La batterie du 5% se d\u00e9charge rapidement. Le t\u00e9l\u00e9phone ne chauffe pas.<\/li>\n<li><strong>Qwen 2.5 7B<\/strong>: Consommation de la batterie 9%. Similaire \u00e0 celle du Llama 3 8B.<\/li>\n<\/ul>\n<p>\u00c0 titre de comparaison, 30 minutes d'enregistrement vid\u00e9o en 4K consomment environ 12 \u00e0 151 TP3T et font monter davantage la temp\u00e9rature du t\u00e9l\u00e9phone. L'inf\u00e9rence LLM sur l'appareil est nettement moins exigeante que les t\u00e2ches faisant largement appel \u00e0 l'appareil photo.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Going_beyond_chat_useful_workflows\"><\/span>Au-del\u00e0 du chat : des flux de travail utiles<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Une fois que votre installation est op\u00e9rationnelle, le plaisir commence. Voici ce qui fonctionne tr\u00e8s bien en mode enti\u00e8rement hors ligne :<\/p>\n<ul>\n<li><strong>R\u00e9sumer un long article<\/strong> \u2014 Copiez le texte, collez-le dans MLC Chat, puis demandez : \u201c R\u00e9sumez ceci en 3 points cl\u00e9s. \u201d Cela fonctionne pour des articles comptant jusqu\u2019\u00e0 environ 4 000 mots, avec un contexte de 8 000 mots.<\/li>\n<li><strong>Reformuler ou traduire (dans les limites de l'entra\u00eenement du mod\u00e8le)<\/strong> \u2014 Llama 3 g\u00e8re bien l'anglais \u2194 l'espagnol, le fran\u00e7ais et l'allemand, mais est moins fiable pour le japonais, l'arabe et l'hindi.<\/li>\n<li><strong>Questions rapides sur le code<\/strong> \u2014 Llama 3 8B est performant pour les questions de syntaxe et les petits extraits de code, mais moins performant pour le raisonnement entre fichiers.<\/li>\n<li><strong>Mode voyage<\/strong> \u2014 Un long vol sans r\u00e9seau ? Vous disposez d\u2019un assistant tr\u00e8s efficace sur votre t\u00e9l\u00e9phone.<\/li>\n<\/ul>\n<p>Ce qui ne fonctionne pas bien sur l'appareil :<\/p>\n<ul>\n<li><strong>Raisonnement \u00e0 long terme<\/strong> (plus de 16 000 jetons) \u2014 la temp\u00e9rature du t\u00e9l\u00e9phone provoque une limitation de la puissance et la vitesse chute en dessous d'un niveau acceptable.<\/li>\n<li><strong>Les math\u00e9matiques au-del\u00e0 de la simple arithm\u00e9tique<\/strong> \u2014 le mod\u00e8le 8B n'est pas assez puissant.<\/li>\n<li><strong>Compr\u00e9hension des images<\/strong> \u2014 Llama 3 ne prend en charge que le texte. Pour les images, utilisez <strong>Qwen 2.5 VL 7B<\/strong> (fonctionne \u00e9galement sur Snapdragon 8 Gen 4 via MLC).<\/li>\n<\/ul>\n<h2><span class=\"ez-toc-section\" id=\"Troubleshooting\"><\/span>D\u00e9pannage<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>L'application plante lors du chargement du mod\u00e8le :<\/strong><\/p>\n<ul>\n<li>Fermez de force toutes les autres applications et red\u00e9marrez l'appareil.<\/li>\n<li>Assurez-vous de disposer d'au moins 8 Go de m\u00e9moire vive libre apr\u00e8s le red\u00e9marrage.<\/li>\n<li>Si votre t\u00e9l\u00e9phone dispose d'une m\u00e9moire vive totale de 12 Go, vous devrez fermer toutes les autres applications. Les t\u00e9l\u00e9phones dot\u00e9s de 16 Go de m\u00e9moire vive offrent davantage de marge.<\/li>\n<\/ul>\n<p><strong>Le nombre de jetons par seconde est inf\u00e9rieur ou \u00e9gal \u00e0 5 :<\/strong><\/p>\n<ul>\n<li>Le NPU n'est pas utilis\u00e9 : vous utilisez le CPU \u00e0 la place.<\/li>\n<li>Fermez de force l'application MLC Chat, puis relancez-la.<\/li>\n<li>Mettez \u00e0 jour l'APK MLC Chat vers la derni\u00e8re version (la prise en charge de la NPU n\u00e9cessite la version 0.18 ou une version ult\u00e9rieure).<\/li>\n<li>V\u00e9rifiez si une autre fonctionnalit\u00e9 d'IA int\u00e9gr\u00e9e \u00e0 l'appareil (Galaxy AI, Gemini Nano) est actuellement active : une seule fonctionnalit\u00e9 peut utiliser le NPU \u00e0 la fois.<\/li>\n<\/ul>\n<p><strong>Le t\u00e9l\u00e9phone devient d\u00e9sagr\u00e9ablement chaud :<\/strong><\/p>\n<ul>\n<li>C'est tout \u00e0 fait normal en cas d'utilisation intensive. Faites une pause d'une minute pour laisser le t\u00e9l\u00e9phone refroidir.<\/li>\n<li>Si l'appareil est chaud au d\u00e9marrage, cela signifie qu'il \u00e9tait d\u00e9j\u00e0 en surchauffe : fermez les applications, attendez un peu, puis r\u00e9essayez.<\/li>\n<li>N'effectuez pas d'inf\u00e9rence en plein soleil.<\/li>\n<\/ul>\n<p><strong>La batterie se d\u00e9charge plus vite que pr\u00e9vu :<\/strong><\/p>\n<ul>\n<li>Assurez-vous que la fonction \u00ab Adaptive Performance \u00bb est d\u00e9sactiv\u00e9e et que l'optimisation de la batterie est d\u00e9sactiv\u00e9e pour MLC Chat (\u00e9tape 3).<\/li>\n<li>Si une fonctionnalit\u00e9 telle que \u00ab Always-On Display \u00bb ex\u00e9cute \u00e9galement des t\u00e2ches d'apprentissage automatique gourmandes en ressources, d\u00e9sactivez-la pendant les sessions d'inf\u00e9rence.<\/li>\n<\/ul>\n<p><strong>Le mod\u00e8le donne des r\u00e9ponses erron\u00e9es :<\/strong><\/p>\n<ul>\n<li>Le mod\u00e8le embarqu\u00e9 \u00e0 8 milliards de param\u00e8tres pr\u00e9sente des limites en termes de connaissances et une capacit\u00e9 de raisonnement inf\u00e9rieure \u00e0 celle des mod\u00e8les cloud tels que GPT-4 ou Claude. Pour les raisonnements complexes ou les \u00e9v\u00e9nements r\u00e9cents, il est pr\u00e9f\u00e9rable d\u2019utiliser un mod\u00e8le cloud \u2014 il s\u2019agit l\u00e0 d\u2019un compromis inh\u00e9rent \u00e0 l\u2019inf\u00e9rence embarqu\u00e9e, et non d\u2019un probl\u00e8me de configuration.<\/li>\n<\/ul>\n<h2><span class=\"ez-toc-section\" id=\"Alternatives_to_MLC-LLM_in_2026\"><\/span>Alternatives au MLC-LLM en 2026<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong><a href=\"https:\/\/pytorch.org\/executorch\/\" target=\"_blank\" rel=\"noopener\">ExecuTorch<\/a><\/strong> (Environnement d'ex\u00e9cution sur appareil de PyTorch) \u2014 pr\u00eat pour la production, utilis\u00e9 en interne chez Galaxy AI. L\u00e9g\u00e8rement plus lent que MLC-LLM en 2026, mais mieux int\u00e9gr\u00e9 \u00e0 l'\u00e9cosyst\u00e8me PyTorch dans son ensemble si vous d\u00e9veloppez des applications.<\/p>\n<p><strong><a href=\"https:\/\/github.com\/ggerganov\/llama.cpp\/wiki\/Android\" target=\"_blank\" rel=\"noopener\">llama.cpp : compilation pour Android<\/a><\/strong> \u2014 Mode manuel mais puissant ; utilise le GPU mais pas le NPU sur la plupart des t\u00e9l\u00e9phones en 2026. Id\u00e9al pour les utilisateurs avanc\u00e9s qui souhaitent avoir un contr\u00f4le total sur les param\u00e8tres.<\/p>\n<p><strong><a href=\"https:\/\/privatellm.app\/\" target=\"_blank\" rel=\"noopener\">LLM priv\u00e9 (Play Store)<\/a><\/strong> \u2014 L'application $5, plus aboutie que MLC Chat mais moins flexible, est toutefois plus accessible pour les utilisateurs non initi\u00e9s. Elle prend en charge la NPU.<\/p>\n<p><strong>Parcours des fabricants<\/strong>:<\/p>\n<ul>\n<li>Samsung Galaxy AI utilise ExecuTorch en interne pour certaines fonctionnalit\u00e9s int\u00e9gr\u00e9es \u00e0 l'appareil. En tant que d\u00e9veloppeur, vous ne pouvez pas le cibler directement.<\/li>\n<li>AICore de Google (sur les Pixel \u00e9quip\u00e9s du Tensor G5) permet d'acc\u00e9der \u00e0 Gemini Nano via les API Edge AI. Exclusivement sur les Pixel.<\/li>\n<li>Apple Intelligence est, bien s\u00fbr, r\u00e9serv\u00e9 \u00e0 l'iPhone.<\/li>\n<\/ul>\n<p>Si vous vous dites \u201c J'ai envie d'une application de chat d\u00e8s aujourd'hui \u201d, MLC Chat est le choix id\u00e9al en 2026.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Whats_coming_next\"><\/span>Et ensuite ?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Deux \u00e9volutions \u00e0 suivre de pr\u00e8s fin 2026 :<\/p>\n<p>1. <strong>L'objectif annonc\u00e9 par Qualcomm : un processeur embarqu\u00e9 de 12 milliards de param\u00e8tres<\/strong> for Snapdragon 8 Elite 2 (expected late 2026). This pushes the on-device ceiling closer to &#8220;frontier-cloud quality.&#8221;<br \/>\n2. <strong>D\u00e9codage sp\u00e9culatif pour les appareils mobiles<\/strong> \u2014 Les premi\u00e8res impl\u00e9mentations dans MLC montrent des gains de d\u00e9bit de l'ordre de 1,5 \u00e0 2 fois sur Llama 3 8B, sans perte de qualit\u00e9.<\/p>\n<p>D\u2019ici mi-2027, les mod\u00e8les de langage \u00e0 grande \u00e9chelle (LLM) int\u00e9gr\u00e9s aux smartphones haut de gamme devraient atteindre un d\u00e9bit de 25 \u00e0 30 tokens par seconde sur les mod\u00e8les de 8 milliards de param\u00e8tres et devraient probablement pouvoir ex\u00e9cuter des mod\u00e8les de 13 milliards de param\u00e8tres \u00e0 une vitesse suffisante pour une utilisation pratique.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"FAQ\"><\/span>FAQ<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<h3>Est-ce que le fait d'ex\u00e9cuter Llama 3 localement sur mon t\u00e9l\u00e9phone risque d'endommager la batterie ?<\/h3>\n<p>Non, dans le cadre d'une utilisation normale. La gestion thermique des t\u00e9l\u00e9phones \u00e9quip\u00e9s du Snapdragon 8 Gen 4 est prudente : ils limitent les performances du NPU avant que le risque de dommages mat\u00e9riels ne devienne pr\u00e9occupant. Le probl\u00e8me majeur r\u00e9side dans le fait qu'une utilisation intensive et prolong\u00e9e (plusieurs heures par jour) acc\u00e9l\u00e8re le vieillissement de la batterie l\u00e9g\u00e8rement plus vite qu'une utilisation mod\u00e9r\u00e9e, comme c'est le cas pour toute autre charge de travail intensive.<\/p>\n<h3>Est-ce que Llama 3 8B est aussi performant que ChatGPT sur mon t\u00e9l\u00e9phone ?<\/h3>\n<p>Non, mais ses performances sont \u00e9tonnamment proches pour de nombreuses t\u00e2ches. Llama 3 8B est \u00e0 peu pr\u00e8s comparable au GPT-3.5 de 2023 : il est tr\u00e8s performant pour la r\u00e9daction, la synth\u00e8se, la programmation simple et les conversations. Il est nettement moins performant que GPT-4 ou Claude Opus en mati\u00e8re de raisonnement complexe, de connaissances sp\u00e9cialis\u00e9es et de t\u00e2ches n\u00e9cessitant un contexte \u00e9tendu. Pour \u201c poser une question rapide hors ligne \u201d, il est excellent.<\/p>\n<h3>Est-ce que je peux faire tourner \u00e7a sur un t\u00e9l\u00e9phone \u00e9quip\u00e9 d'un Snapdragon 8 Gen 3 de 2024 ?<\/h3>\n<p>Oui, mais vous obtiendrez 4 \u00e0 6 jetons par seconde au lieu de 12 \u00e0 18. Le NPU Hexagon de la 8e g\u00e9n\u00e9ration 3 offre un d\u00e9bit environ deux fois moins \u00e9lev\u00e9 que celui de la 8e g\u00e9n\u00e9ration 4 pour l\u2019inf\u00e9rence LLM. Elle reste utilisable, mais elle est simplement plus lente. La 8 Gen 2 (mod\u00e8les phares de 2023) peine \u00e0 d\u00e9passer les 3 t\/s et est pratiquement inutilisable.<\/p>\n<h3>Puis-je utiliser Llama 3 70B sur mon t\u00e9l\u00e9phone ?<\/h3>\n<p>Non. Llama 3 70B en Q4 n\u00e9cessite environ 43 Go de m\u00e9moire. Aucun t\u00e9l\u00e9phone en 2026 n'en dispose, m\u00eame de loin. La classe 70B rel\u00e8ve clairement du domaine des ordinateurs de bureau. Pour le mat\u00e9riel de type t\u00e9l\u00e9phone, 8B constitue le plafond pratique, Qwen 2.5 14B repr\u00e9sentant la limite sup\u00e9rieure sur les t\u00e9l\u00e9phones dot\u00e9s de 16 Go de RAM (et m\u00eame dans ce cas, le fonctionnement est tr\u00e8s lent).<\/p>\n<h3>Est-ce que cela va \u00e9puiser mon forfait de donn\u00e9es ?<\/h3>\n<p>Non \u2014 une fois le mod\u00e8le t\u00e9l\u00e9charg\u00e9, toutes les op\u00e9rations d'inf\u00e9rence s'effectuent enti\u00e8rement hors ligne. Le t\u00e9l\u00e9chargement de 4,9 Go n'a lieu qu'une seule fois ; tout ce qui suit se fait en local. C'est l\u00e0 tout l'int\u00e9r\u00eat des grands mod\u00e8les de langage (LLM) embarqu\u00e9s.<\/p>\n<h3>Qu'en est-il des t\u00e9l\u00e9phones \u00ab jailbreak\u00e9s \u00bb ou \u00ab root\u00e9s \u00bb ?<\/h3>\n<p>Ce guide fonctionne sur Android d'origine et ne n\u00e9cessite pas d'acc\u00e8s root. Si votre t\u00e9l\u00e9phone est root\u00e9, vous pouvez utiliser directement le fichier llama.cpp pour b\u00e9n\u00e9ficier d'un contr\u00f4le l\u00e9g\u00e8rement plus pouss\u00e9, mais la m\u00e9thode MLC Chat est plus rapide et plus simple dans 95% des cas d'utilisation.<\/p>\n<h3>Is iPhone 17 Pro better for on-device LLMs than the Galaxy S26 Ultra?<\/h3>\n<p>En ce qui concerne les fonctionnalit\u00e9s int\u00e9gr\u00e9es (Apple Intelligence vs Galaxy AI), chacune a ses points forts. Pour l'ex\u00e9cution de mod\u00e8les personnalis\u00e9s \u00e0 poids variable, le <strong>Galaxy offre davantage de flexibilit\u00e9<\/strong> \u2014 Apple ne met pas le Neural Engine \u00e0 la disposition des applications tierces pour une utilisation arbitraire des mod\u00e8les de langage \u00e0 grande \u00e9chelle (LLM). Des applications telles que Private LLM fonctionnent sur iPhone via Metal\/CoreML, mais ne peuvent pas utiliser le Neural Engine de la m\u00eame mani\u00e8re que MLC Chat utilise le processeur Hexagon NPU sur Android. Consultez notre <a href=\"\/fr\/iphone-17-pro-vs-galaxy-s26-ultra-on-device-ai\/\">Comparaison de l\u2019IA embarqu\u00e9e entre iPhone et Galaxy<\/a> pour l\u2019analyse compl\u00e8te.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Bottom_line\"><\/span>Conclusion<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Utiliser Llama 3 8B \u00e0 plein r\u00e9gime sur un smartphone Android haut de gamme de 2026 n\u2019est plus une curiosit\u00e9 : c\u2019est d\u00e9sormais une fonctionnalit\u00e9 utile au quotidien qui fonctionne hors ligne, consomme peu de batterie et respecte votre vie priv\u00e9e par d\u00e9faut. La m\u00e9thode MLC-LLM est celle que nous recommandons ; la configuration prend 30 minutes et vous permet d\u2019avoir dans votre poche un assistant de chat performant.<\/p>\n<p>Pour la plupart des utilisateurs, les mod\u00e8les de langage grand format (LLM) int\u00e9gr\u00e9s aux appareils compl\u00e8tent l\u2019IA dans le cloud plut\u00f4t qu\u2019ils ne la remplacent : on utilise le mod\u00e8le du t\u00e9l\u00e9phone lorsqu\u2019on est hors ligne, lorsque la confidentialit\u00e9 est importante ou pour des questions rapides ; on utilise les mod\u00e8les dans le cloud pour les raisonnements complexes, l\u2019actualit\u00e9 et les t\u00e2ches qui n\u00e9cessitent la profondeur des mod\u00e8les plus puissants. Les deux ont leur place, et 2026 est la premi\u00e8re ann\u00e9e o\u00f9 les mod\u00e8les embarqu\u00e9s valent v\u00e9ritablement la peine d\u2019\u00eatre mis en place.<\/p>\n<p><!--related-block--><\/p>\n<div class=\"convly-related\">\n<h2><span class=\"ez-toc-section\" id=\"Related_articles\"><\/span>Articles connexes<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<ul>\n<li><a href=\"https:\/\/convly.ai\/fr\/claude-opus-4-8-vs-gemini-3-1-pro\/\">Claude Opus 4.8 vs Gemini 3.1 Pro: Specs, Pricing &amp; Which to Choose (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/how-to-build-a-rag-pipeline-2026\/\">Comment construire un pipeline RAG en 2026 (\u00e9tape par \u00e9tape)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/90-day-ai-engineer-path\/\">De z\u00e9ro \u00e0 ing\u00e9nieur IA : votre parcours d\u2019apprentissage sur 90 jours<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/local-llm-ollama-setup\/\">Configurer votre premier mod\u00e8le de langage local avec Ollama<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/build-personal-ai-assistant-python\/\">Construire un assistant personnel pilot\u00e9 par l\u2019IA en 30 minutes (tutoriel Python)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/ai-resume-screener-tutorial\/\">Cr\u00e9er un syst\u00e8me de tri automatis\u00e9 de CV pilot\u00e9 par l\u2019IA (tutoriel complet)<\/a><\/li>\n<\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Llama 3 8B fonctionne \u00e9tonnamment bien sur les t\u00e9l\u00e9phones Android 2026 - \u00e0 une vitesse utilisable, hors ligne, sans co\u00fbts d'API. Voici comment l'installer sur un appareil Snapdragon 8 Gen 4.<\/p>","protected":false},"author":1,"featured_media":268,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[9],"tags":[272,268,273,271,270,269],"class_list":["post-261","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tutorials","tag-android-ai","tag-llama-3","tag-local-llm-phone","tag-mlc-llm","tag-on-device-llm","tag-snapdragon-8-gen-4"],"_links":{"self":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/261","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/comments?post=261"}],"version-history":[{"count":3,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/261\/revisions"}],"predecessor-version":[{"id":1460,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/261\/revisions\/1460"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/media\/268"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/media?parent=261"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/categories?post=261"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/tags?post=261"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}