1. Définitions fondatrices de l'IA
La notion d'intelligence artificielle a été définie de multiples façons par ses pionniers. Ces définitions révèlent différentes philosophies sur ce que signifie "être intelligent".
"L'intelligence artificielle est la science et l'ingénierie de la fabrication de machines intelligentes, en particulier de programmes informatiques intelligents."
Marvin Minsky (1968) définit l'IA comme "la science qui consiste à faire faire aux machines des choses qui nécessiteraient de l'intelligence si elles étaient effectuées par des humains." Cette définition est comportementale : elle juge l'intelligence par les résultats, non par les mécanismes internes.
Alan Turing (1950), dans son article fondateur "Computing Machinery and Intelligence", pose la question "Les machines peuvent-elles penser ?" et propose le test d'imitation (Test de Turing) comme critère opérationnel d'intelligence.
On distingue quatre catégories de définitions selon deux axes :
- Axe rationalité vs humanité : imiter l'humain ou agir rationnellement ?
- Axe pensée vs comportement : simuler des processus mentaux ou des actions ?
Ces quatre positions donnent : "Systèmes qui pensent comme les humains", "Systèmes qui agissent comme les humains", "Systèmes qui pensent rationnellement", "Systèmes qui agissent rationnellement."
// Les 4 définitions canoniques de l'IA
1. Penser comme un humain → approche cognitive (neurosciences)
2. Agir comme un humain → Test de Turing (comportemental)
3. Penser rationnellement → logique formelle (Aristote, syllogismes)
4. Agir rationnellement → agent rationnel (Russell & Norvig)
2. Histoire de l'IA : 1950–2026
L'histoire de l'IA est marquée par des cycles d'enthousiasme et de déceptions, souvent appelés "hivers de l'IA".
Les origines (1943–1956)
En 1943, McCulloch et Pitts publient le premier modèle formel de neurone artificiel. En 1950, Alan Turing publie son article fondateur. La conférence de Dartmouth (1956) marque la naissance officielle de l'IA comme discipline avec McCarthy, Minsky, Shannon et Rochester.
L'âge d'or (1956–1974)
Les premiers programmes de démonstration impressionnent : Logic Theorist, General Problem Solver, LISP. Les financements gouvernementaux (DARPA) sont généreux. Les chercheurs sont optimistes sur un AGI imminente.
Premier hiver de l'IA (1974–1980)
Les limites computationnelles et théoriques apparaissent. Le rapport Lighthill (1973) au Royaume-Uni critique les manques de progrès. Les financements s'effondrent.
Les systèmes experts (1980–1987)
Un renouveau s'opère avec les systèmes experts : MYCIN (diagnostic médical), R1/XCON (configuration DEC). L'industrie investit massivement. Le marché LISP machines se développe.
Deuxième hiver (1987–1993)
L'effondrement du marché des machines LISP et des systèmes experts trop coûteux à maintenir provoque un nouveau gel des financements.
Renaissance : apprentissage automatique (1993–2011)
Deep Blue bat Kasparov aux échecs (1997). Le machine learning remplace progressivement l'IA symbolique. Les SVM, les arbres de décision et les réseaux bayésiens dominent.
Révolution Deep Learning (2012–présent)
AlexNet (2012) remporte ImageNet avec un écart historique grâce aux GPU. Word2Vec (2013), GAN (2014), Attention/Transformers (2017), GPT-3 (2020), ChatGPT (2022), GPT-4/Claude/Gemini (2023–2026).
Les LLMs (Large Language Models) atteignent des capacités de raisonnement remarquables. Le débat sur l'AGI est relancé. Des modèles multimodaux traitent texte, image, audio et code de façon intégrée.
3. Types d'IA : faible, forte, ANI/AGI/ASI
La terminologie distingue plusieurs niveaux d'IA selon leur généralité et leurs capacités.
IA Faible (Narrow AI / ANI)
L'IA faible ou ANI (Artificial Narrow Intelligence) est spécialisée dans une tâche précise. Elle peut surpasser l'humain dans son domaine mais est incapable de généraliser. Exemples : reconnaissance faciale, recommandation Netflix, AlphaGo, ChatGPT. Tous les systèmes IA actuels sont des ANI.
IA Générale (AGI)
L'AGI (Artificial General Intelligence) désigne un système capable d'accomplir toute tâche cognitive humaine avec la même flexibilité. Elle n'existe pas encore, bien que certains chercheurs débattent si les LLMs récents ne constituent pas une forme proto-AGI.
IA Surhumaine (ASI)
L'ASI (Artificial Super Intelligence) surpasserait l'humanité entière dans tous les domaines cognitifs. Concept théorique, elle soulève des questions fondamentales sur la sécurité (alignment problem).
Hiérarchie des capacités IA :
ANI ──── spécialisée, surhumaine dans son domaine
AGI ──── généraliste, niveau humain toutes tâches
ASI ──── au-delà de l'intelligence humaine globale
4. Agents intelligents : définition et types
La notion d'agent est centrale en IA moderne. Un agent intelligent est une entité qui perçoit son environnement via des capteurs et agit sur cet environnement via des effecteurs.
Un agent est une fonction f : P* → A, qui mappe une séquence de perceptions P* vers une action A. Un agent rationnel maximise sa mesure de performance attendue compte tenu de ses perceptions et de sa connaissance a priori.
Agents à réflexe simple
Agissent uniquement sur la perception courante selon des règles condition-action. Exemple : thermostat, Roomba basique. Limite : ne fonctionnent que dans des environnements complètement observables.
if température > 22°C then allumer_climatisation
if saleté_détectée then aspirer
Agents à modèle interne
Maintiennent un état interne représentant les aspects non observables de l'environnement. Nécessitent un modèle de transition (comment le monde évolue) et un modèle de capteur (comment les perceptions reflètent le monde).
Agents à but
Disposent d'informations sur les états désirables. Combinent le modèle interne avec une recherche de séquences d'actions atteignant le but. Exemples : GPS, planificateurs robotiques.
Agents à utilité
Possèdent une fonction d'utilité qui mesure le degré de satisfaction de chaque état. Permettent de gérer les conflits entre buts et les situations d'incertitude. Les agents à utilité sont les plus généraux.
Agents apprenants
Incluent un composant d'apprentissage qui améliore leurs performances au fil du temps. Architecture en 4 composants : performance, critique, apprentissage, générateur de problèmes.
5. Propriétés des environnements
La nature de l'environnement détermine profondément la conception de l'agent. Russell et Norvig identifient six dimensions principales.
- Complètement / partiellement observable : les capteurs de l'agent donnent-ils accès à l'état complet du monde ? (échecs = complet, poker = partiel)
- Déterministe / stochastique : le prochain état est-il entièrement déterminé par l'état courant et l'action ? (monde des aspirateurs = déterministe si complètement observable)
- Épisodique / séquentiel : les épisodes sont-ils indépendants ? (classification d'images = épisodique, jeu d'échecs = séquentiel)
- Statique / dynamique : l'environnement change-t-il pendant que l'agent délibère ? (mots croisés = statique, taxi = dynamique)
- Discret / continu : le nombre d'états, percepts et actions est-il fini ? (échecs = discret, conduite = continu)
- Agent unique / multi-agents : y a-t-il d'autres agents dans l'environnement ? (coopératif ou compétitif)
La conduite autonome illustre l'environnement le plus complexe : partiellement observable, stochastique, séquentiel, dynamique, continu, multi-agents.
6. Le Test de Turing
Proposé par Alan Turing dans "Computing Machinery and Intelligence" (1950), le test de Turing (ou jeu d'imitation) est le premier critère opérationnel pour évaluer l'intelligence d'une machine.
Protocole du test
Un interrogateur humain communique par écrit avec deux entités : un humain et une machine. Si l'interrogateur ne peut pas distinguer de façon fiable la machine de l'humain, la machine est considérée comme intelligente.
Jeu d'imitation :
[Interrogateur] ←─ texte ─→ [Humain (A)]
←─ texte ─→ [Machine (B)]
Question : L'interrogateur peut-il distinguer A de B ?
Compétences nécessaires selon Turing
- Traitement du langage naturel (NLP)
- Représentation des connaissances
- Raisonnement automatique
- Apprentissage automatique
Test de Turing Total
L'extension du test inclut la perception visuelle et la manipulation physique. Cela nécessite en plus : la vision par ordinateur et la robotique.
Critiques du test
La chambre chinoise de Searle (1980) argue qu'une machine peut réussir le test sans comprendre le langage. Le test évalue le comportement humain, pas l'intelligence rationnelle. Des chatbots comme ELIZA ont trompé des humains sans être "intelligents".
7. Grandes approches algorithmiques
Trois grandes familles d'approches structurent l'IA.
Approche symbolique (GOFAI)
Dite "Good Old-Fashioned AI", elle représente les connaissances par des symboles et des règles logiques. Fondée sur la logique de premier ordre, elle donne naissance aux systèmes experts, à PROLOG et aux ontologies. Points forts : interprétabilité, raisonnement déductif garanti. Limites : fragile face à l'incertitude et aux données massives.
Approche connexionniste
Inspirée du cerveau biologique, elle utilise des réseaux de neurones artificiels. L'apprentissage est implicite dans les poids synaptiques. Le Deep Learning (réseaux profonds) est la forme actuelle dominante. Points forts : robustesse au bruit, performance sur données massives. Limites : boîte noire, nécessite beaucoup de données.
Approche évolutionniste
Inspirée de la biologie évolutive, elle utilise algorithmes génétiques, programmation génétique et évolution différentielle. Adaptée à l'optimisation de fonctions complexes. Points forts : explore de grands espaces de solutions. Limites : coût computationnel, convergence lente.
Comparaison des approches :
┌─────────────────┬──────────────┬──────────────┬──────────────┐
│ │ Symbolique │ Connexionniste│ Évolutionniste│
├─────────────────┼──────────────┼──────────────┼──────────────┤
│ Représentation │ Explicite │ Implicite │ Population │
│ Apprentissage │ Règles │ Données │ Sélection │
│ Interprétable │ Oui │ Non │ Partiel │
│ Données requis │ Peu │ Beaucoup │ Moyen │
└─────────────────┴──────────────┴──────────────┴──────────────┘
8. Applications actuelles de l'IA
L'IA est déployée dans pratiquement tous les secteurs économiques.
- Santé : diagnostic par imagerie médicale (cancer, rétinopathie), découverte de médicaments (AlphaFold pour les protéines), chirurgie assistée.
- Transport : véhicules autonomes (Tesla Autopilot, Waymo), optimisation de routes, maintenance prédictive.
- Finance : détection de fraude, trading algorithmique, scoring crédit, analyse de risque.
- Éducation : tutorat intelligent, adaptation personnalisée, correction automatique.
- Industrie : contrôle qualité par vision, robots collaboratifs (cobots), maintenance prédictive.
- Médias : recommandation de contenu (Netflix, Spotify), génération de texte, deep fakes, traduction.
- Cybersécurité : détection d'intrusions, analyse comportementale, réponse automatisée aux incidents.
Ces applications soulèvent des questions fondamentales : biais algorithmiques, vie privée, déplacement d'emplois, responsabilité légale. L'EU AI Act (2024) établit un cadre réglementaire pour les systèmes IA à haut risque.
FAQ — Questions fréquentes
Quelle est la différence entre IA, Machine Learning et Deep Learning ?
Ce sont trois cercles concentriques : l'IA est le domaine le plus large (tout système qui simule l'intelligence), le Machine Learning est un sous-ensemble qui apprend des données sans être explicitement programmé, et le Deep Learning est un sous-ensemble du ML utilisant des réseaux de neurones profonds. Tout Deep Learning est du ML, mais tout ML n'est pas du Deep Learning.
Un LLM comme ChatGPT réussit-il le test de Turing ?
Les LLMs modernes réussissent fréquemment des versions informelles du test de Turing, trompant des humains dans des conversations textuelles. Cependant, ils présentent aussi des faiblesses caractéristiques (hallucinations, manque de bon sens physique) qui les trahissent dans des tests sophistiqués. La question reste philosophiquement controversée : réussir le test implique-t-il la "véritable" intelligence ?
L'AGI est-elle réellement proche ?
C'est l'un des débats les plus vifs en IA. Des chercheurs comme Geoffrey Hinton et Demis Hassabis estiment qu'elle pourrait émerger dans les 10-20 ans. D'autres comme Gary Marcus et Yann LeCun pensent que des obstacles fondamentaux subsistent (raisonnement causal, sens commun, efficacité des données). En 2026, il n'existe pas de consensus scientifique.
Qu'est-ce qu'un agent rationnel ?
Un agent rationnel choisit l'action qui maximise sa mesure de performance attendue, compte tenu de sa séquence de perceptions jusqu'à présent et de toute connaissance intégrée. La rationalité ne requiert pas l'omniscience : elle est définie par rapport à ce que l'agent sait et peut percevoir. Un agent peut être rationnel sans être parfait ni omniscient.
📋 Mentions légales et droits d'utilisation
Ce cours académique est basé sur des ressources pédagogiques disponibles gratuitement sur Internet sous licence Creative Commons (CC BY). Conformément aux termes de cette licence, le contenu peut être librement partagé et adapté à des fins éducatives, à condition de citer les auteurs originaux. Ce site ne revendique aucun droit de propriété sur les documents sources. Pour toute question : contact InfoBoxTV.