Исследователи из Университета Буффало совершили прорыв в области медицинского искусственного интеллекта: их метод Semantic Clinical Artificial Intelligence (SCAI) позволил языковым моделям значительно улучшить результаты на экзамене USMLE — тесте для получения медицинской лицензии в США. Ключевой компонент технологии, механизм RAG, обогащает модель структурированными клиническими данными, что особенно помогло компактным версиям ИИ. Например, модель с 13 миллиардами параметров смогла преодолеть проходной порог на Step 3 USMLE только после интеграции SCAI, тогда как более мощные версии (70 и 405 миллиардов параметров) достигли точности выше 90% на отдельных этапах. Это открытие задаёт вектор для разработки инструментов, способных работать в партнёрстве с врачами.
Принцип работы SCAI напоминает создание цифрового медицинского справочника. Алгоритм анализирует учебные материалы, клинические руководства и базы данных (например, MedlinePlus и DrugBank), выделяя связи между симптомами, анализами и диагнозами в виде троек «объект-отношение-субъект». Эти структурированные данные преобразуются в числовые шаблоны, которые модель использует для дополнения контекста при ответе на вопрос. Например, при запросе о пациенте с кашлем и температурой система автоматически подключает информацию о типичных возбудителях пневмонии или рекомендует исключить COVID-19. Такой подход снижает риск «галлюцинаций» — генерации непроверенных фактов.