L`adéquation d`un modèle binaire estimé peut être évaluée en comptant le nombre d`observations réelles égale à 1, et le nombre égal à zéro, pour lequel le modèle attribue une classification correcte prévue en traitant toute probabilité estimée supérieure à 1/2 (ou, au-dessous de 1/2), en tant qu`assignation d`une prédiction de 1 (ou, de 0). Voir régression logistique § adéquation du modèle pour plus de détails. Quiconque a déjà lutté pour interpréter un ratio de cotes peut avoir du mal à croire qu`un lien logistique mène à des coefficients plus intuitifs. Parce que nous pouvons revenir transformer ces cotes de notation en ratios de cotes, nous pouvons obtenir un moyen un peu intuitif d`interpréter les effets. En d`autres moyens, la logistique a légèrement flatter les queues. c`est-à-dire que la courbe probit approche les axes plus rapidement que la courbe. Cela peut être considéré comme un effet de seuil. Un résultat invisible $E = beta X-S $ est une fonction linéaire de $X $ avec un peu de bruit $-S $ ajouté comme dans la régression linéaire, et nous obtenons un résultat 0/1 en disant: Rappelez-vous de retour à l`intro stats quand vous avez eu à regarder dans les tables Z la zone sous la courbe normale pour une valeur Z spécifique? Cette zone représente une probabilité cumulée: la probabilité que Z soit inférieure ou égale à la valeur Z spécifiée. Quelle est la différence entre le modèle logit et probit? La différence dans les résultats globaux du modèle sont généralement légères à inexistantes, donc sur un plan pratique, il n`est généralement pas question que l`on utilise. Dans la plupart des scénarios, les modèles logit et probit correspondent également bien aux données, avec les deux exceptions suivantes.

Cette approche comporte plusieurs problèmes. Tout d`abord, la ligne de régression peut conduire à des prédictions en dehors de la plage de zéro et une. Deuxièmement, la forme fonctionnelle suppose que la première bière a le même effet marginal sur la fièvre Bieber que le dixième, ce qui n`est probablement pas approprié. Troisièmement, un tracé de résidus révélerait rapidement l`hétérokedasticité. Il est possible de motiver le modèle probit comme un modèle de variable latente. Supposons qu`il existe une variable aléatoire auxiliaire, je suis plus intéressé ici à savoir quand utiliser la régression logistique, et quand utiliser probit. 2. la relation entre la probabilité et les prédicteurs n`est pas linéaire, il est sigmoïde (alias, en forme de s). (+ 1 à la fois @vinux et @Elvis.

Ici, j`ai essayé de fournir un cadre plus large dans lequel penser à ces choses, puis en utilisant ce pour répondre au choix entre logit et probit.) Premièrement, pour voir pourquoi cela est vrai première remarque que ces deux modèles peuvent être considérés comme des modèles de régression continue battues. À titre d`exemple, considérez le modèle linéaire simple d`effets mixtes pour l`observation $i $ dans le cluster $j $:. Il y a déjà beaucoup de réponses ici qui mettent en avant des choses à considérer lors du choix entre les deux mais il y a une considération importante qui n`a pas encore été déclarée: quand votre intérêt est en regardant des associations d`intra-grappe dans des données binaires utilisant des effets mixtes modèles logistiques ou probit, il existe une mise à la terre théorique pour préférer le modèle probit. Il s`agit, bien sûr, de supposer qu`il n`y a pas de raison a priori pour préférer le modèle logistique (par exemple si vous faites une simulation et que vous savez qu`il s`agit du véritable modèle). Les modèles logit et probit résolvent chacun de ces problèmes en ajustant une fonction non linéaire aux données qui ressemblent à ce qui suit: les modèles logit et probit sont appropriés lorsque vous tentez de modéliser une variable dépendante dichotomeuse, par exemple oui/non, d`accord/non, comme/ aversion, etc. Les problèmes liés à l`utilisation de la ligne de régression linéaire familière sont plus facilement compris visuellement.