Así le fue a Chat GPT en la PAES: Resultado más bajo lo obtuvo en ciencias
Pese a su nueva actualización que le permite "ver", el chatbot disminuyó levemente su rendimiento.

🌟 EvoAcademy, conocida por realizar experimentos similares anteriormente, puso a prueba a ChatGPT en la PAES 2024. En esta ocasión, ChatGPT respondió correctamente hasta el 96% de las preguntas, demostrando su capacidad para analizar y resolver cuestiones complejas.
🔍 Integrando GPT4-Vision, ChatGPT mostró habilidades mejoradas para interpretar gráficos y elementos visuales. Este avance significativo expande sus capacidades más allá de la simple interpretación textual, aunque generó ciertas dudas sobre su eficiencia en comparación con versiones anteriores.
📝 En la PAES Admisión 2024, los resultados de ChatGPT variaron: obtuvo desde un 81.3% hasta un 96% de respuestas correctas. Destacó en la prueba de Competencia Lectora con 918 puntos, mientras que en Física logró 745 puntos, siendo esta su puntuación más baja.
📈 Utilizando la herramienta WebPlotDigitizer, EvoAcademy estimó que ChatGPT habría estado entre el 4% superior en la prueba de Comprensión Lectora. Esta metodología proporciona una comparación precisa con el desempeño de otros estudiantes.
🔬 A pesar de mostrar un rendimiento más bajo en ciencias en comparación con pruebas anteriores, ChatGPT mantiene un nivel competente en diversas áreas del conocimiento. Esta diversidad en los resultados refleja la amplitud y adaptabilidad de sus capacidades analíticas.
📘 EvoAcademy ofrece recursos detallados sobre este experimento, incluyendo un post sobre el experimento de abril y un artículo sobre los detalles y costos involucrados. Estos recursos son esenciales para comprender a fondo la metodología y el impacto del experimento.
❓ Importante destacar que, aunque ChatGPT es un modelo de lenguaje avanzado, no garantiza respuestas consistentes en todas las ocasiones. Esta característica lo distingue de simples bases de datos y subraya la complejidad y sofisticación de su tecnología subyacente.