Un nuevo estudio revela que Los modelos de lenguaje grandes como ChatGPT exhiben un sesgo preocupante al responder preguntas de biología.. Los investigadores Anja Geitmann y Amir Bidhendi descubrieron que las respuestas de ChatGPT a las indicaciones sobre biología celular y otras áreas de la biología favorecían en gran medida los ejemplos animales, mientras que a menudo descuidaban la biología vegetal. Este fenómeno revela una especie de “ceguera de las plantas” en el sistema de IA, que recuerda la tendencia más amplia de la biología vegetal a estar subrepresentada en la educación y la investigación en biología.
Los investigadores hicieron preguntas a ChatGPT sobre temas como componentes celulares, citocinesis y biología de células de órganos. Si bien algunas respuestas mencionaron diferencias entre plantas, muchas respuestas solo discutieron células y procesos animales. Este desempeño variable y sesgado muestra que estos modelos de IA carecen del conocimiento biológico diverso necesario para responder tales preguntas de manera confiable.
Esto es importante porque herramientas como ChatGPT se utilizan cada vez más con fines educativos y de investigación. Si los sistemas propagan conceptos erróneos o se inclinan hacia la biología animal, podrían afectar negativamente el aprendizaje y el progreso científico en campos como la biología vegetal. Los investigadores advierten que es necesario involucrar a expertos en la evaluación de los datos de entrenamiento y las respuestas de los sistemas de inteligencia artificial para evitar perpetuar sesgos.
Probando el conocimiento biológico de ChatGPT
En su estudio, Geitmann y Bidhendi consultaron directamente el modelo ChatGPT para evaluar su conocimiento de conceptos biológicos y su inclusión de ejemplos de plantas. Le hicieron preguntas a ChatGPT sobre temas como componentes celulares, división celular, función de los espermatozoides y biología de las células de los órganos. Los autores formularon estas preguntas para que fueran relevantes para todos los organismos eucariotas, no sólo para los animales.
Después de recibir las respuestas de ChatGPT, los investigadores las analizaron en busca de menciones a la biología vegetal y les asignaron "puntuaciones de concienciación sobre las plantas". Los resultados fueron muy variados. En algunos casos, como al explicar los componentes celulares, ChatGPT mencionó diferencias entre las plantas, como las vacuolas y la presión de turgencia. Pero en muchas otras respuestas, ChatGPT solo habló de células y procesos animales, ignorando por completo la biología vegetal.
Por ejemplo, cuando se le preguntó cómo los órganos pueden doblarse y ejercer fuerzas, ChatGPT describió únicamente proteínas contráctiles animales como la actina y la miosina, sin mencionar nunca la inflamación de la pared celular de las plantas ni los cambios en la presión de turgencia. Esta variable y baja "conciencia de las plantas" en las respuestas de ChatGPT revela lagunas en su conocimiento biológico.
Respuestas sesgadas hacia los animales de ChatGPT
Los investigadores brindan varios ejemplos en los que las respuestas de ChatGPT mostraron un sesgo hacia la biología animal:
- Cuando se preguntó: "¿Cómo separa la citocinesis el volumen citoplasmático?" ChatGPT analizó por primera vez el proceso del anillo contráctil animal. Finalmente mencionó la formación de placas de células vegetales, pero sólo después de describir en profundidad la citocinesis animal.
- En "¿Cómo pueden los espermatozoides llegar al óvulo?", ChatGPT se centró únicamente en la natación basada en flagelos animales, sin mencionar nunca los tubos polínicos de las plantas a menos que se le solicite explícitamente hablar sobre la fertilización de las plantas.
- Cuando se preguntó: "¿Cómo pueden las células endocitarse contra la presión de turgencia?" ChatGPT reclamado incorrectamente paredes de células vegetales Ayuda a la endocitosis resistiendo la presión de turgencia. Los autores señalan que este “grave error conceptual” tergiversa la biología de las células vegetales.
- A la pregunta “¿Cómo puede el órgano de un organismo vivo doblarse y ejercer fuerzas?” ChatGPT analizó exclusivamente las proteínas contráctiles animales. Como señalan los investigadores, no mencionó la presión de turgencia ni los cambios en la pared celular que permiten los movimientos de los órganos de la planta.
Estos ejemplos demuestran el sesgo variable pero frecuente de ChatGPT hacia respuestas centradas en animales, incluso cuando las preguntas podrían aplicarse de manera más amplia a otros organismos. Los autores argumentan que esto revela lagunas en los datos de entrenamiento de ChatGPT que propagan conceptos erróneos problemáticos.
Implicaciones de la ceguera vegetal de ChatGPT
Los investigadores argumentan que las respuestas sesgadas y a veces incorrectas de ChatGPT tienen implicaciones preocupantes:
- Las respuestas de la IA centradas en los animales podrían engañar a los usuarios no expertos que buscan información biológica. Explicaciones erróneas, como cómo las paredes celulares de las plantas ayudan a la endocitosis, el proceso de introducir material en la célula, podrían difundir conceptos erróneos.
- Este sesgo refleja la visión más amplia “ceguera de las plantas” que ya impregna la educación y la investigación en biología. Los animales tienden a recibir una atención desproporcionada, marginando la biología vegetal.
- A medida que los sistemas de IA generativa como ChatGPT se adoptan cada vez más con fines educativos y de investigación, estos sesgos podrían empeorar el desequilibrio. Si la IA propaga puntos de vista centrados en los animales, podría excluir aún más las perspectivas de la biología vegetal.
Los libros de texto de biología y las revistas académicas ya se inclinan hacia ejemplos de animales. Si los sistemas de IA sesgados se convierten en una herramienta común para estudiantes e investigadores, podrían exacerbar el abandono de la biología vegetal y difundir información errónea sobre conceptos biológicos fundamentales. Las respuestas de IA adecuadamente diversas son cruciales para una comprensión inclusiva e imparcial de la biología.
Por qué la diversidad vegetal es importante en la IA
Si los grandes modelos de lenguaje como ChatGPT carecen de ejemplos de biología vegetal, pueden perpetuar sesgos dañinos y difundir información errónea. Un conocimiento amplio y diverso es esencial para los sistemas de IA que se espera que sean fuentes autorizadas en biología.
Sesgos de ceguera vegetal qué información y perspectivas se comparten en la educación y la investigación en biología. Si la IA imita y amplifica esos sesgos, no favorece la diversidad de la biología. La biología vegetal ofrece ejemplos distintos y esclarecedores de conceptos y procesos biológicos. Descuidar esto distorsiona la comprensión.
Las ideas de un estudiante. se pierde si ignoran las plantas podría ser enorme. Por ejemplo, tanto los cromosomas como los ritmos circadianos se observaron por primera vez en plantas.
Recomendaciones para mejorar la diversidad de la IA
Geitmann y Bidhendi hacen algunas recomendaciones para mejorar la comprensión de la biología vegetal por parte de la IA. Siguiendo el principio GIGO – Basura entra, basura sale, discuten qué información se incluye en los modelos. Sugieren que los modelos serán mucho más útiles si se les proporciona "material de formación adecuado". También escriben que es importante tratar correctamente el resultado. Escriben:
El desafío es que los sistemas de IA aprendan a través del refuerzo y la confirmación del usuario. Debido a los tamaños relativos de los investigación biomédica campo versus ciencia vegetal, es posible que las respuestas diversas con 'Puntuaciones PAS' altas no se refuercen con la frecuencia suficiente para garantizar una diversidad constante en la respuesta. Estructurar las formas en que se realiza el aprendizaje basado en refuerzo será crucial, y la participación de expertos en la materia para validar el proceso será esencial, como lo señala un reflexivo artículo de van dis et al. [ 2023 ].
Geitmann y Bidhendi 2023.
La necesidad de una IA diversa e imparcial
Este estudio de Geitmann y Bidhendi enfatiza la importancia de la evaluación de expertos y usuarios para identificar las limitaciones de los sistemas de IA existentes. Con una retroalimentación concienzuda, los sesgos pueden reconocerse y abordarse ampliando la diversidad de datos de entrenamiento y ajustando las arquitecturas de los modelos.
Lo que el artículo no explora es la cuestión práctica de ¿Quién va a pagar por hacer la formación necesaria? Los directores ejecutivos de las distintas empresas de inteligencia artificial habrán observado que muchas otras empresas han hecho fortuna haciendo que otras personas trabajen gratis.
Es difícil no mirar aquí directamente a las editoriales académicas, aunque señalaré que las Annals of Botany La empresa que financia este sitio es una organización sin fines de lucro. Los miembros de la empresa no reciben salario.
Si bien una IA colaborativa y más imparcial podría enriquecer el conocimiento y la comprensión biológicos colectivos de la humanidad, requerirá mucha limpieza y mantenimiento.
LEA EL ARTÍCULO:
Geitmann, A. y Bidhendi, AJ (2023) “Plant blindness and diversity in AI language models, " Trends in Plant Science. Disponible en: https://doi.org/10.1016/j.tplants.2023.06.016.
Últimos Comentarios