Source: Wikimedia commons.
J’étais un étudiant en deuxième année à l’université quand j’ai réalisé pour la première fois que mes parents ne m’avaient jamais dit: «Mon fils, nous voulons juste que tu sois heureux.» Il semblait que tout le monde leur avait dit que ça les rendait heureux. Pourquoi, je me suis demandé, mes parents ne m’ont jamais dit ça?
J’ai tout de suite compris quand je suis tombé sur un passage de l’autobiographie de John Stuart Mill.
Mill était intéressant. Il avait l’un des QI les plus élevés de l’histoire de l’humanité (ils n’avaient pas de tests d’intelligence à l’époque, mais les historiens psychologues ont tenté de reconstituer son QI à partir d’autres preuves). Son père, l’historien vénérable James Mill, a commencé à lui enseigner le grec ancien à l’âge de trois ans. À huit heures, il avait lu toutes les histoires d’Hérodote dans l’original. J’ai donc pensé que son histoire pouvait rendre une lecture intéressante. Mais ce n’est pas. Son autobiographie est un festival de snooze. Si je me souviens bien, le travail est une compilation exhaustive des choses les moins intéressantes que Mill ait jamais lu, vu ou envisagé. Un passage représentatif: “Lorsque nous en avons eu assez de l’économie politique, nous avons repris la logique syllogistique de la même manière, Grote se joint maintenant à nous. Notre premier manuel était Aldrich, mais dégoûté de sa superficialité, nous avons réimprimé l’un des nombreux manuels de la logique scolaire que mon père, grand collectionneur de tels livres, possédait, le Manuductio ad Logicam du Jésuite Du Trieu. Après avoir terminé ceci, nous avons repris Whately’s Logic , puis republié pour la première fois de l’ Encyclopedia Metropolitana , et enfin la Computatio sive Logica de Hobbes. “Pour l’amour de Dieu, John. On s’en fout?
Bien que je ne sois pas tout à fait sûr de pourquoi, je suis passé à travers. Et je suis content de l’avoir fait.
Mais pour comprendre ce que Mill dit sur le bonheur, vous devez d’abord comprendre un concept de l’intelligence artificielle. C’est ce qu’on appelle l’apprentissage par renforcement.
L’idée de base de l’apprentissage par renforcement est simple. C’est une méthode pour concevoir un agent – que ce soit une personne, un robot, un programme informatique – pour se comporter de manière intelligente. La définition de l’intelligence est ce que les informaticiens appellent la «maximisation de la récompense». En termes simples, il y a quelque chose que vous voulez, et le comportement intelligent consiste à en tirer le maximum. Par exemple, si votre agent est un robot qui joue au basket, sa récompense prend la forme de points. Plus le robot fabrique de paniers, plus il obtient de points et plus il se comporte intelligemment. L’apprentissage par renforcement est une solution mathématique à la manière dont le robot apprendrait à acquérir de plus en plus de points.
Au cœur de l’apprentissage par renforcement se trouve ce que l’on appelle une «politique». C’est le livre de jeu du robot. Une politique dit, dans l’abstraction mathématique, “C’est là que je suis maintenant. C’est ce que je dois faire ensuite pour maximiser ma récompense. »En basket-ball, une bonne politique pourrait consister à récupérer le ballon, à le dribbler vers le panier et à lancer un lancer. Chaque fois que le robot le fait, elle regarde à quel point elle réussissait à obtenir des points et ajuste son comportement pour mieux faire la prochaine fois. Le robot pourrait mal commencer, mais en utilisant l’apprentissage par renforcement, il pourrait s’améliorer avec le temps. C’est ce que l’intelligence signifie ici-bas, vous obtenez de mieux en mieux pour atteindre votre objectif.
L’idée pourrait être simple, mais toute la nuance de l’apprentissage par renforcement provient précisément de la manière dont vous apprenez cette politique. Par exemple, la meilleure politique consiste-t-elle à conduire vers le panier? Ou devriez-vous vous asseoir et tirer des cavaliers? Comment savez-vous qui va se passer la prochaine fois? La même politique fonctionnera-t-elle contre un adversaire différent?
Il existe deux stratégies générales pour apprendre une politique. Le premier est appelé sur politique . C’est la plus simple des deux stratégies. La politique signifie que le robot utilise les mêmes informations pour prendre des décisions et évaluer si ce sont de bonnes décisions. Si sa politique dit de se diriger vers le panier et que cela engendre beaucoup de points, elle sera plus susceptible de continuer avec la même politique à l’avenir. La deuxième stratégie est appelée hors politique . Cela signifie que le robot utilise des informations différentes pour prendre des décisions plutôt que de les évaluer. L’agent pourrait prendre des décisions en fonction, par exemple, de son temps de possession du ballon. Elle pouvait alors regarder son jeu sur la base de cette politique et voir si se concentrer sur quelque chose d’autre augmentait réellement son nombre de paniers à la fin.
Au début, il peut sembler que la meilleure stratégie sera toujours la politique. Comment pourriez-vous marquer plus de points en vous concentrant sur quelque chose de totalement non pertinent? Mais ce n’est pas nécessairement vrai. Le fait empirique dans la recherche sur l’intelligence artificielle est que certains problèmes sont mieux résolus par des méthodes non conformes à la politique. Parfois, le meilleur moyen d’atteindre un objectif est indirectement.
C’est précisément ce que Mill défend sur le bonheur. La façon de maximiser votre bonheur, pour ainsi dire, est de viser autre chose. Consacrez-vous à quelque chose de plus grand que votre propre bonheur. Travaillez dur à ça. Ensuite, vous regarderez en arrière et réaliserez que vous avez accumulé du bonheur tout le temps. Mill écrit,
“Les plaisirs de la vie suffisent à en faire une chose plaisante quand ils sont pris en passant sans être un objectif principal. Une fois que vous les faites ainsi, vous les sentirez immédiatement comme insuffisants. Ils ne porteront pas un examen minutieux. Demandez-vous si vous êtes heureux et vous cessez de l’être. La seule chance est que vous ayez pour but dans la vie, non pas le bonheur, mais quelque chose d’extérieur. Laissez votre conscience de soi, votre examen minutieux, votre auto-interrogation s’épuiser là-dessus; et si, heureusement, vous êtes contourné, vous respirerez le bonheur avec l’air que vous respirez, sans vous y attarder ni y penser, en l’imaginant ou en le mettant en fuite par des interrogations fatales.
En d’autres termes, la stratégie de politique ne fonctionne pas pour le bonheur. Si vous essayez de maximiser cela directement, alors vous allez être pire que si vous aviez adopté une approche différente. Le bonheur est l’un de ces problèmes qui fonctionne mieux avec la stratégie hors politique. Il doit y avoir une séparation entre action et évaluation. Si vous utilisez votre propre bonheur comme une mesure pour évaluer votre prochaine décision, la portée de votre préoccupation ne peut dépasser vos propres sentiments. Au lieu de cela, soutient Mill, concentrez-vous sur quelque chose de plus grand que vous et vous vous réveillerez un jour pour réaliser que vous respirez le bonheur avec l’air que vous respirez .
La raison pour laquelle mes parents ne m’ont jamais dit de rechercher le bonheur directement, c’est que, comme Mill, ils croient en une approche hors-la-loi du bonheur. Lorsque quelqu’un vous dit que vous devriez «faire ce qui vous rend heureux», il préconise une approche politique des décisions de bonheur et de son évaluation selon le même critère. C’est exactement ce que mes parents ne voulaient pas que je fasse. Et alors que mes parents ne l’ont pas appris en lisant Mill, la chose surprenante à propos de cette position sur le bonheur est qu’elle est partagée dans une version ou une autre – par pratiquement tous les autres philosophes qui ont pris la parole.
Un de mes préférés de ces comptes appartient à Bertrand Russell. Il dit plus ou moins la même chose que Mill, mais avec un certain flair de nonchalance en contraste avec la lourdeur solennelle de Mill. Russell écrit dans The Conquest of Happiness : «Le bonheur fondamental dépend plus que tout de ce que l’on peut appeler un intérêt amical envers les personnes et les choses.» Il poursuit: «Laissez vos intérêts aussi larges que possible et laissez vos réactions aux choses et les personnes qui vous intéressent soient autant que possible amicales plutôt qu’hostiles. ”
En d’autres termes, le bonheur est le résultat naturel de l’observation selon laquelle il ya un grand nombre de personnes et de choses dans le monde qui méritent un intérêt amical, et une seule d’entre elles est vous-même. C’est avec cette idée en tête que je veux écrire ce blog.
Les références
Mill, JS (1873/2003). Autobiographie. Projet Guternberg.
Russell, B. (1930). La conquête du bonheur New York, NY: Liveright Publishing Corp.