Visual-textual integration in LLMs for medical diagnosis: A preliminary quantitative analysis

Background and aim: Visual data from images is essential for many medical diagnoses. This study evaluates the performance of multimodal Large Language Models (LLMs) in integrating textual and visual information for diagnostic purposes. Methods: We tested GPT-4o and Claude Sonnet 3.5 on 120 clinical...

Full description

Saved in:

Bibliographic Details
Main Authors:	Reem Agbareia, Mahmud Omar, Shelly Soffer, Benjamin S. Glicksberg, Girish N. Nadkarni, Eyal Klang
Format:	Article
Language:	English
Published:	Elsevier 2025-01-01
Series:	Computational and Structural Biotechnology Journal
Subjects:	Artificial intelligence Medical diagnosis Multimodal learning Large language models Visual data integration
Online Access:	http://www.sciencedirect.com/science/article/pii/S2001037024004379
Tags:	Add Tag No Tags, Be the first to tag this record!

Internet

http://www.sciencedirect.com/science/article/pii/S2001037024004379

Visual-textual integration in LLMs for medical diagnosis: A preliminary quantitative analysis

Internet

Similar Items