» Esencialmente, todos los modelos son incorrectos, pero algunos son útiles «.

— Box, George EP; Norman R. Draper (1987). Superficies de respuesta y construcción de modelos empíricos, pág. 424, Wiley. ISBN 0471810339.

¿Cuál es exactamente el significado de la frase anterior?

Comentarios

  • En el mismo libro se mencionó anteriormente: Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful. Quizás esto sea más útil.

Respuesta

Creo que su significado se analiza mejor si se analiza en dos partes:

«Todos los modelos son incorrectos», es decir, todos los modelos están equivocados porque es una simplificación de la realidad. Algunos modelos, especialmente en las ciencias «duras», están un poco equivocados. Ignoran cosas como la fricción o el efecto gravitacional de cuerpos diminutos. Otros modelos están muy mal, ignoran cosas más importantes. En las ciencias sociales, ignoramos mucho.

«Pero algunos son útiles»: las simplificaciones de la realidad pueden ser bastante útiles. Pueden ayudarnos a explicar, predecir y comprender el universo y todos sus componentes.

¡Esto no es solo cierto en las estadísticas! Los mapas son un tipo de modelo; son incorrectos. Pero los buenos mapas son muy útiles. Abundan los ejemplos de otros modelos útiles pero incorrectos.

Comentarios

  • +1 Porque me gusta la analogía de los mapas. ¡’ lo usaré en el futuro!
  • Muchos modelos de las ciencias » dura » también están bastante lejos (ayer asistí a un seminario en el que las mediciones estaba dentro de la barra de error, pero la barra de error tenía dos órdenes de magnitud).
  • +1. Creo que su oración clave es » cada modelo es incorrecto porque es una simplificación de la realidad «. La gente suele olvidar esto, por ejemplo, en críticas ingenuas de la economía (tengo mis propias críticas, pero deben ser más sofisticadas que solo eso » la realidad es más compleja que tu modelo «). Si no lo hiciéramos t simplifícalo, tienes una realidad cruda, que es demasiado compleja para que la entendamos. Así que tenemos que simplificarlo para obtener una idea.
  • La fantasía de un mapa perfecto en una escala 1: 1 ha sido utilizada por muchos autores, incluidos Lewis Carroll, Jorge Luis Borges y Umberto Eco. En realidad, no serviría de nada porque necesariamente sería complicado como el área que mapea y no sería más fácil de entender (sin mencionar la incomodidad de desplegarlo y colocarlo para leer).
  • Tal vez puedas También agregue que un modelo tiene que ser un poco incorrecto, porque de lo contrario no se generalizaría y, por lo tanto, no sería aplicable en otros lugares. Hay algunas respuestas que dicen esto más abajo. Pero ahora hay demasiadas respuestas para leerlas todas.

Responder

Significa que se pueden proporcionar ideas útiles a partir de modelos que no son una representación perfecta de los fenómenos que modelan.

Un modelo estadístico es una descripción de un sistema que utiliza conceptos matemáticos. Como tal, en muchos casos agrega una cierta capa de abstracción para facilitar su procedimiento inferencial (por ejemplo, normalidad de errores de medición, simetría compuesta en estructuras de correlación, etc.). Es casi imposible que un solo modelo describa perfectamente un fenómeno del mundo real dado que tenemos una visión subjetiva del mundo (nuestro sistema sensorial no es perfecto); no obstante, la inferencia estadística exitosa ocurre ya que nuestro mundo tiene cierto grado de consistencia que explotamos. Así que nuestros modelos casi siempre incorrectos resultan útiles .

(Estoy seguro de que pronto obtendrás una gran respuesta en negrita, pero traté de ser conciso en este!)

Comentarios

  • ¿Podemos decir que estos modelos útiles proporcionan soluciones aproximadas?
  • @gpuguy : Claro que puedes. Para citar a John Tukey: An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem. (en realidad creo que la cita de JT ‘ es increíblemente reveladora).
  • » Es mucho mejor una respuesta aproximada a la pregunta correcta, que a menudo es vaga, que una respuesta exacta a la pregunta incorrecta, que siempre puede ser precisa. » John W. Tukey 1962 El futuro del análisis de datos. Annals of Mathematical Statistics 33: 1-67 (ver págs. 13-14) Sin duda dijo cosas similares en otras ocasiones, pero que ‘ es la fuente habitual.
  • Copié la mía de la publicación original.

Respuesta

Encontré esto Charla JSA 2009 de Thad Tarpey para proporcionar una explicación y un comentario útiles sobre el pasaje de Box.Argumenta que si consideramos los modelos como aproximaciones a la verdad, podríamos llamar correctamente a todos los modelos con la misma facilidad.

Aquí está el resumen:

A los estudiantes de estadística a menudo se les presenta la famosa cita de George Box: «todos los modelos son incorrectos, algunos son útiles». En esta charla sostengo que esta cita, aunque útil, es incorrecta. Una perspectiva diferente y más positiva es reconocer que un modelo es simplemente un medio de extraer información de interés de los datos. La verdad es infinitamente compleja y un modelo es simplemente una aproximación a la verdad. Si la aproximación es pobre o engañosa, entonces el modelo es inútil. En esta charla doy ejemplos de modelos correctos que no son modelos verdaderos. Ilustraré cómo la noción de un modelo «incorrecto» puede llevar a conclusiones incorrectas.

Respuesta

Debido a que nadie lo ha agregado, George Box utilizó la fase citada para presentar la siguiente sección en un libro. Creo que hace el mejor trabajo al explicar lo que quiso decir:

Ahora sería muy notable si cualquier sistema existente en el mundo real pudiera ser exactamente representado por cualquier modelo simple. Sin embargo, los modelos parsimoniosos elegidos astutamente a menudo proporcionan aproximaciones notablemente útiles. Por ejemplo, la ley $ PV = RT $ que relaciona la presión $ P $ , volumen $ V $ y temperatura $ T $ de un » ideal » gas a través de un $ R $ constante no es exactamente cierto para ningún gas real, pero con frecuencia proporciona una aproximación útil y, además, su estructura es informativo, ya que surge de una vista física del comportamiento de las moléculas de gas.

Para un modelo de este tipo, no es necesario hacer la pregunta » ¿Es verdadero el modelo? ? «. Si » la verdad » debe ser la » la verdad completa » la respuesta debe ser » No «. La única pregunta de interés es » ¿Es el modelo esclarecedor y útil? «.

Box, GEP (1979 ), » Robustez en la estrategia de construcción de modelos científicos «, en Launer, RL; Wilkinson, GN, Robustness in Statistics , Academic Press, págs. 201–236.

Respuesta

Para mí, la información real se encuentra en el siguiente aspecto:

Un modelo no tiene por qué ser correcto para ser útil.

Desafortunadamente, en muchas ciencias a menudo se olvida que los modelos no necesariamente tienen que ser representaciones exactas de la realidad para permitir nuevos descubrimientos ¡y predicciones!

Así que no pierda su tiempo construyendo un modelo complicado que necesita mediciones precisas de una gran cantidad de variables. El verdadero genio inventa un modelo simple que hace el trabajo.

Respuesta

Un modelo no puede proporcionar predicciones 100% precisas si hay aleatoriedad en los resultados. Si no hubo incertidumbre, aleatoriedad ni error, entonces se consideraría un hecho más que un modelo. El primero es muy importante, porque los modelos son frecuentemente se utiliza para modelar expectativas de eventos que no han ocurrido. Esto casi garantiza que existe cierta incertidumbre sobre los hechos reales.

Dada la información perfecta, en teoría podría ser posible crear un modelo que proporcione predicciones perfectas para eventos tan precisamente conocidos. Sin embargo, incluso dadas estas circunstancias poco probables, dicho modelo puede ser tan complejo que no sea factible de usar computacionalmente, y solo puede ser preciso en un momento particular en el tiempo cuando otros factores cambian cómo cambian los valores con los eventos.

Dado que la incertidumbre y la aleatoriedad están presentes en la mayoría de los datos del mundo real, los esfuerzos para obtener un modelo perfecto son un ejercicio inútil. En cambio, es más valioso buscar un modelo lo suficientemente preciso que sea lo suficientemente simple como para ser utilizable en términos tanto de los datos como de los cálculos necesarios para su uso. Si bien se sabe que estos modelos son imperfectos, algunos de estos defectos son bien conocidos y se pueden considerar para la toma de decisiones basada en los modelos.

Los modelos más simples pueden ser imperfectos, pero también es más fácil razonar sobre ellos , para comparar entre sí, y puede ser más fácil trabajar con ellos porque es probable que sean menos exigentes computacionalmente.

Respuesta

Si se me permite, un comentario más puede resultar útil. La versión del prase que prefiero es

(…) todos los modelos son aproximaciones. Esencialmente, todos los modelos son incorrectos, pero algunos son útiles (…)

tomado de Análisis de superficies, mezclas y crestas de respuesta de Box y Draper (2007, p. 414, Wiley) . Al observar la cita ampliada, queda más claro lo que quería decir Box: el modelado estadístico se trata de aproximar la realidad y la aproximación nunca es exacta, por lo que se trata de encontrar la aproximación más apropiada . Lo que es apropiado para su propósito es algo subjetivo, por eso no es uno de los modelos que es útil, pero posiblemente algunos de ellos lo son, dependiendo del propósito del modelado.

Respuesta

Puede pensar en ello de esta manera. la complejidad máxima (es decir, la entropía) de un objeto obedece a alguna forma de límite de Bekenstein :

$$ I \ le \ frac { 2 \ pi RE} {\ hbar c \ ln 2} $$

donde $ E $ es la energía total en reposo, incluida la masa, y $ R $ es el radio de una esfera que encierra el objeto.

Ese es un número grande, en la mayoría de los casos:

El límite de Bekenstein para un cerebro humano promedio sería de $ 2.58991 · 10 ^ {42} $ bit y representa un límite superior en la información necesaria para recrear perfectamente el cerebro humano promedio hasta el nivel cuántico. Esto implica que el número de estados diferentes ($ Ω = 2 ^ I $) del cerebro humano (y de la mente si el fisicalismo es verdadero) es como máximo $ 107.79640 · 10 ^ {41} $.

Entonces, ¿quieres usar «el mejor mapa», es decir, el territorio en sí, con todas las ecuaciones de onda para todas las partículas en cada celda? Absolutamente no. No solo sería un desastre computacional, sino que Estarías modelando cosas que pueden no tener nada que ver con lo que te importa. Si todo lo que quiere hacer es, digamos, identificar si estoy despierto o no, no necesita saber qué está haciendo el electrón # 32458 en la neurona # 844030 ribosoma # 2305 molécula # 2. Si no modela eso, su modelo es de hecho «incorrecto», pero si puede identificar si estoy despierto o no, su modelo es definitivamente útil.

Respuesta

Creo que Peter y user11852 dieron excelentes respuestas. También agregaría (por negación) que si un modelo fuera realmente bueno, probablemente sería inútil debido al sobreajuste (por lo tanto, no generalizable).

Comentarios

  • +1 para el punto de sobreajuste. Los algoritmos como Naive Bayes y el análisis discriminante lineal a menudo funcionan muy bien, incluso si sabe que el modelo subyacente es incorrecto (por ejemplo, filtrado de spam), simplemente porque se necesitan menos datos para estimar los parámetros.

Respuesta

Mi interpretación ácida es: Creer que un modelo matemático describe exactamente todos los factores, y sus interacciones, que gobiernan un fenómeno de interés sería demasiado simplista y arrogante. Ni siquiera sabemos si la lógica que usamos es suficiente para comprender nuestro universo. Sin embargo, algunos modelos matemáticos representan una aproximación suficientemente buena (en términos del método científico) que son útiles para sacar conclusiones sobre dicho fenómeno.

Respuesta

Como astrostatista (quizás una raza rara), considero lamentable la fama del dicho de Box. En las ciencias físicas, a menudo tenemos un fuerte consenso para comprender los procesos subyacentes de un fenómeno observado, y estos procesos a menudo pueden expresarse mediante modelos matemáticos que surgen de las leyes de la gravitación, la mecánica cuántica, la termodinámica, etc. Los objetivos estadísticos son estimar las propiedades físicas de los parámetros del modelo que mejor se ajustan, así como la selección y validación del modelo. de la publicación de marzo de 2013 de los documentos de las mediciones del satélite Planck de la Agencia Espacial Europea «s satélites de Planck » que establece de manera convincente un simple `LambdaCDM «modelo para el Big Ba ng. Dudo que el dicho de Box se aplique en algún lugar dentro de la amplia gama de métodos estadísticos avanzados utilizados en estos 29 artículos.

Respuesta

Acabo de reformular la respuesta anterior considerando los modelos de proceso como punto de enfoque. La declaración se puede interpretar de la siguiente manera:

«Todos los modelos están equivocados», es decir, todos los modelos están equivocados porque es una simplificación de realidad. Algunos modelos están un poco equivocados. Ignoran algunas cosas, por ejemplo: -> requisitos cambiantes, -> ignorando la finalización del proyecto dentro del plazo, -> no teniendo en cuenta el nivel de calidad deseado por el cliente, etc. … Otros modelos están muy equivocados, ignoran cosas más importantes. Los modelos de procesos de software clásicos ignoran mucho en comparación con los modelos de procesos ágiles que ignoran menos.

«Pero algunos son útiles»: las simplificaciones de la realidad pueden ser bastante útiles. Pueden ayudarnos a explicar, predecir y comprender el proyecto en general y todos sus componentes. Se utilizan modelos porque sus características corresponden a la mayoría de los programas de desarrollo de software.

Respuesta

Me gustaría dar otra interpretación del término «útil». Probablemente no sea el que Box pensó.

Cuando tienes que tomar decisiones, y para esto se utilizará finalmente toda la información, debes medir tu éxito de alguna forma. Cuando se habla de decisiones con información incierta, esta medida a menudo se llama utilidad.

Por lo tanto, también podemos pensar en modelos útiles como aquellos que nos permiten tomar decisiones más informadas; para lograr nuestros objetivos de manera más efectiva.

Esto agrega otra dimensión a los criterios habituales, como la capacidad de un modelo para predecir algo correctamente: nos permite sopesar los diferentes aspectos de los que se trata un modelo con cada uno otro.

Respuesta

«Todos los modelos son incorrectos, pero algunos son útiles». Quizás signifique: ¿Deberíamos estar haciendo lo mejor que podamos con lo que sabemos + buscar nuevos aprendizajes?

Comentarios

  • (-1) ¿Puede proporcionar alguna referencia que sugiera que G.E.P. Box significaba eso? Como puede encontrar en las otras respuestas, quiso decir algo totalmente diferente.
  • El OP quizás esté tomando la cita y dándole una nueva interpretación. Estoy de acuerdo con Tim en que Box decía más o menos que no ‘ t tomen el modelo como una interpretación exacta de la realidad, pero reconozcan que algún modelo puede describir bien los datos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *