Force entropique

De WikiUpLib
Aller à : navigation, rechercher

Préambule

Un paquet d'auteurs, dont des auteurs "anciens" (eg R.M. Neumann 1980), invoquent la force entropique (https://fr.wikipedia.org/wiki/Force_entropique) comme moteur bien réel de l'évolution de la matière.

Il y a des controverses, mais certains vont jusqu'à penser que toutes les forces sont entropiques.

Peut-être s'agit-il simplement d'une autre manière d'appréhender/visualiser le monde (via le prisme de l'information) ?

Grosso modo, il suffit de compter/dénombrer les états possibles d'un système, et celui-ci va naturellement, du fait de la statistique, s'organiser dans l'arrangement le plus probable.

On lit parfois que le système "cherche à accroître son entropie" ou qu'"il agit comme s'il cherchait à accroître son entropie".

ama, ce sont des formulations ambiguës (holistes) pas très heureuses.

L'appellation "Force entropique" est peut-être maladroite/malheureuse également, car, de fait, on ne connaît pas le détail de l'ensemble des forces microscopiques à l'oeuvre. On constate, du fait du secouage statistiquement aléatoire, que le système se dirige (statistiquement) vers un extrémum (point haut) de son potentiel entropique, mais cela reste un constat émergeant macroscopique. Il n'y a pas d'entropie qui "tire" ou "pousse" le système. Parler de force est aussi un peu abusif, dans la mesure ou c'est précisément le reproche que E. Verlinde fait à l'appellation "force" de gravité. (Mais cet argument se retourne : puisqu'on parle de "force" de gravité sans en appréhender la nature exacte, alors il n'est pas plus illégitime de parler de "force" entropique.)

(Souvenons nous par ailleurs que Newton lui-même a, dès le début, dire ne faire aucune hypothèse sur la nature exacte de la force de gravité (et accessoirement s'en foutre)).

Un système brassé/secoué en permanence va statistiquement se retrouver plus souvent dans les états les plus probables. Point. Il ne faut (dans une démarche explicative) pas confondre les effets et les causes.

Le point intéressant est que, de même qu'on utilise (très efficacement et désormais traditionnellement) les équations relatives au principe de moindre action (dans les domaines où il s'applique), pour calculer eg des trajectoires, peut-on employer les équations relatives à la force entropique pour calculer/déterminer l'évolution d'un système ?

Comme dans le cas du PMA, il s'agit, connaissant déjà la fin du film (qui est l'état le plus probable) de calculer/reconstituer l'intégralité de la dynamique du système (ou au moins d'une dynamique menant à l'état final) autrement que eg par une simulation (parfois lourde) du système ou une compréhension physique (analytique) du système parfois simplement hors de portée.
On pourrait se passer de bien comprendre le bilan des forces exactes à l'oeuvre à tout moment, on se fiche un peu de déterminer la dynamique (chemin) exact du système, car on pense connaître déjà son état final (et que le chemin exact emprunté n'importe pas).

C'est pas du tout idiot, car dans bien des cas, le bilan des forces exact fait intervenir une infinité de forces internes et/ou externes pas faciles à modéliser. Donc, si on peut sauter directement au résultat, c'est efficace.


Algorithmes / équations

Certains auteurs (voir § A. Wissner) prétendent avoir des équations/ algorithmes fonctionnels ... mais le sujet est controversé.

Notons que le dénombrement des états possibles d'un système, et l'établissement de la distribution des états, peut aussi s'avérer un travail/calcul très lourd. Rien qu'un système avec plusieurs petites molécules et toutes leurs orientations possibles, on a vite une distribution gigantesque.

Mais il faut probablement travailler sur des représentations efficaces/compressées des états, pour espérer calculer viablement.

Rien ne dit non plus qu'il existe bien au moins un chemin vers tel ou tel état final (eg une molécule et sa version chirale).


Causal Entropic forces

Avertissement : tout ce paragraphe est écrit au conditionnel.

Il s'agit d'un article qui a fait un peu de buzz lors de sa parution : http://journals.aps.org/prl/abstract/10.1103/PhysRevLett.110.168702 A. Wissner-Gross + C. Freer

Les auteurs prétendent avoir réalisé un simulateur qui maximise en permanence l'entropie future du système simulé. ie à chaque pas de temps, un contrôleur dispose de plusieurs choix possibles, et pour chaque choix, l'entropie résultante est calculée. Le choix d'entropie future maximale est celui retenu. Et on passe au pas suivant.
Le papier mentionne 4 exemples ... et des comportements plutôt surprenants à chaque fois.
De facto, les comportements exhibés sont des comportements classiques du vivant. Ce que A. Wissner souligne est que ces comportements sont obtenus selon la procédure décrite au-dessus. Bref, c'est une interprétation (pas nouvelle) des comportements du vivant, comme maximisation permanente d'entropie, mais là, le simulateur (entropica) en apporterait vraiment la démonstration.

NB : Il ne s'agit pas là de prétendre (et ce n'est pas prétendu) que la nature ou matière inerte procède comme le simulateur. Puisque, de facto, le simulateur réalise des calculs d'anticipation (lointains) que la matière inerte ne réalise pas.
Il s'agit juste du constat que la nature ou matière inerte, dans les exemples exhibés, agit bien selon un principe de maximisation d'entropie.

Il faudrait reproduire au moins une de ces simulations pour se faire une idée.
a priori, l'écriture d'un tel simulateur, juste pour une application, ne semble pas trop compliquée.

Mesure cible

Le point clé est l'expression exacte de la fonction cible, ici la mesure appelée causal path entropy.

c'est aussi un peu mon impression. On a affaire à une mesure de l'ensemble du volume de l'arborescence (d'où une intégrale au moins double, sur le facteur de branchement et sur une profondeur donnée)

Characteristic for the biological motivation of empowerment is that the latter considers everything with respect to the agent: potential reach is determined by what action sequences the agent may choose and the reachable states need to be distinguishable by the agent's sensors to count as separate states.

Also, while in many contexts empowerment and Causal Entropic Forcing will give similar results for the drives produced, there is one difference: empowerment considers what part of the agent action information actually reappears in the later (sensorically distinguishable) state. So, if the dynamics exhibits (uncontrolled) noise in parts of the state space, empowerment and Causal Entropic Forcing can be expected to give different results: empowerment will drive the agent (and its action "tentacles") away from the noise as this indicates a less controllable (and thus undesirable) region of the environment. Causal Entropic Forcing does not have an agent at the heart of its concept who sees its actions reflected in the state, and we expect it therefore to be indifferent to environmental noise, or possibly even be attracted to it, as it may enhance the richness of the trajectories available (but this conjecture requires precise analysis, as it may depend on the nature of the dynamics and the noise in the environment).

Pour le pendule, on se donne eg à chaque pas, 10 actions possibles (5 vers la droite, 5 vers la gauche, d'impulsions graduelles). Prenons le pas t=0. Pour chacune des 10 actions possibles, il y a à nouveau 10 choix d'actions possibles (sauf quand le pendule arrive en limites de rail). On développe complètement l'arborescence associée à chacune des 10 actions le plus loin possible. Les branches qui aboutissent à une restriction des degrés de liberté reçoivent une mauvaise note. Les branches qui aboutissent à une maximisation des degrés de liberté reçoivent une bonne note. On additionne tout ça (d'une manière qui reste à définir, car il y a des overlaps), et le choix correspondant à l'arborescence la mieux notée (la plus "prometteuse") est retenu.

Il faut évidemment s'efforcer d'être un peu astucieux algorithmiquement dans ce calcul ... tout en s'efforçant de rester dans une fonction d'entropie (et pas un machin ad hoc)

On peut penser à pas mal de choses. eg ne même pas allouer de notes ... mais juste compter les ramifications. (d'où la référence au volume). A priori, pour une profondeur donnée, l'arborescence la plus ramifiée est forcément plus riche/prometteuse. Ce serait une mesure cible finalement plutôt simplette (par comparaison eg aux fonctions d'évaluation des robots joueurs d'échec) ... mais peut-être efficace ? Peut-être que le caractère très simple est aussi porteur de robustesse (eg vis-à-vis du bruit ?) Il faudrait tester sur quelques exemples. Et faire varier la profondeur du futur exploré.

Il faut noter qu'un tel calcul implique une modélisation analytique (suffisamment correcte) de la dynamique du système, et l'intégration de cette modélisation à l'intérieur du calcul de "causal path entropy". Pour savoir où (dans le mur ou pas ?, ie où dans l'espace de phase, se situent les branches correspondant aux choix), il faut forcément avoir mis en équation la dynamique du système. Est-ce qu'un tel calcul est encore un calcul d'entropie (ou apparenté ?). Ou est-ce qu'on donne un nom entropy-bidule à une mesure qui est peut-être corrélée à l'entropie, mais qui est plutôt une mesure ad-hoc d'"empowerment" (potentialité/puissance) comme dit Daniel Polani ?

Autre question : comment choisir entre 2 arborescences de mêmes volumes ? (on tire au sort ?)

Il faut noter que l'article contient pas mal d'imprécisions et de confusions, eg confusion entre état et chemin

Questions et points à examiner

  • Inspired by recent developments [1–6] to naturally generalize such biases so that they uniformly maximize entropy production between the present and a future time horizon, rather than just greedily maximizing instantaneous entropy production, we can also contemplate generalized entropic forces over paths through configuration space rather than just over the configuration space itself.
  • donc, sauf erreur, on ne se contente pas d'un seul pas, on va nettement plus loin. On va probablement jusqu'au nombre de pas où l'une des branches se détache nettement du lot (aucune raison de pousser plus loin).
  • quelle est exactement la mesure d'entropie ? -> voir Entropie
  • de fait, les auteurs n'utilisent pas de mesure d'entropie d'état, mais définissent/proposent une entropie de chemin (causal path entropy)
  • ... path entropy maximisation, est un vieux truc, voir Dewar, Jaynes; les auteurs disent que leur causal path entropy est plus spécifique et permet plus de choses
  • le papier parle de maximiser le nombre de futurs possibles, et dit que, en position haute, il y a plus de futurs possibles qu'en position basse. ... ce n'est pas franchement évident ?
  • en fait, la position haute est détentrice de plus d'énergie potentielle et serait donc, a priori, plus économe ... sauf que le maintien en position haute demande du contrôle permanent (des petits mouvements du chariot), ie une dépense d'énergie permanente
  • D'après divers articles, la mesure d'entropie est une mesure du nombre de choix/opportunités restantes. Crudely speaking, this tends to be the path that keeps open the largest number of options for how the particles might move subsequently
  • en fait, l'illustration (b) page 1 dit que la "force entropique" pousse simplement le système dans la direction opposée à la zone des états impossibles
  • Path microstates belonging to a causal macrostate X, in which (for illustrative purposes) there is an environmentally imposed excluded path-space volume that breaks translational symmetry, resulting in a causal entropic force F directed away from the excluded volume.
  • dans le cas du pendule, l'angle du pendule est partout libre dans [0, 360°] y compris aux extrémités du rail (pas de parois). Par contre, en bout de son rail, le chariot a forcément perdu un degré de liberté en translation
  • intuitivement, il me semble que cela pousse le chariot du pendule vers le milieu de son rail, ou n'importe quel système vers le centre de son espace de phases (cas du 1° exemple : particle in a box)
  • Heuristically, again, swinging up and stabilizing the pole made it more energetically favorable for the cart to subsequently swing the pole to any other angle, hence, maximizing the diversity of causally accessible paths. ça parait pas insensé en effet. Il y a plus d'énergie emmagasinée/disponible en position haute que basse, donc moins de travail à fournir pour atteindre n'importe quelle autre position de l'espace de phase (il faudrait quand même vérifier ce point).
  • NB : C'est exactement ainsi que procède un joueur d'échec électronique, avec une fonction d'évaluation pondue par des experts, et dans laquelle la notion de quantité de choix restants est d'ailleurs probablement présente.
  • si c'est un proxy du type fonction d'évaluation réglée comme il faut et que le futur est examiné loin ... alors il n'y aurait guère de surprises dans les résultats exhibés
  • dans le cas du pendule inversé, les paramètres indiqués sont une longueur de 40m et un poids de 10^^21kg ... c'est plutôt loufoque. On croirait que c'est fait exprès pour voir si les lecteurs lisent bien ?


Liens