avatar
(sci)Berloga Всех Наук и Технологий
@sberlogabig
24.06.2025 18:49
🌌 ИИ, который читает статьи за вас

В npj Computational Materials вышла статья: Agent-based multimodal information extraction for nanomaterials

На повестке — автоматизация научного чтения. Не в смысле «реферат за 3 секунды», а в смысле: вытащить формулы, каталитические параметры, и кристаллические системы из PDF так, как это делает химик с блокнотом и часом свободного времени. Только здесь — без блокнота и без химика.

🧠 Что внутри nanoMINER

Система мультиагентная:
Main-агент (GPT-4o) управляет процессом,
NER-агенты (Mistral-7B, Llama-3-8B) достают параметры из текста,
Vision-агент (YOLOv8 + GPT-4o) разбирает графики и неформатные таблицы.

Агенты работают на основе ReAct подхода: синхронизируются, уточняют друг у друга информацию, и выдают единый JSON на выходе.

📊 Зачем всё это?

Чтобы снимать экспериментальные параметры (в том числе по нанозимам) из текста, даже если они:
• только в подписях к графикам,
• разбросаны по разным разделам,
• не указаны явно (например, crystal system — система угадывает её по формуле с точностью 86%).

💥 Результаты впечатляют:
• precision до 0.98 на параметрах активности нанозимов,
• recall до 0.86 на наноматериалах,
• F1 score выше, чем у GPT-4.1, o3-mini и o4-mini.
(просто скармливали PDF без координации — и всё сломалось)

📎 А зачем человеку?

Это шаг к полноценным машиночитаемым статьям, где вместо ручной разметки — автоматическое заполнение баз знаний. Подход масштабируется на медицину, биохимию, фарму и любые области, где не хочется руками копировать цифры из графиков.

📂 Код: github.com/ai-chem/nanoMINER

🔮 Моделька предсказала crystal system по формуле — просто так
Это не feature, это баг… или всё-таки emergent reasoning? 😉 В статье пишут, что система предсказывает тип кристаллической решётки, даже если она не указана, с 86% точностью. Возможно, это эффект обучения на корпусах, где такие ассоциации частотны. Но в любом случае — повод переосмыслить, насколько хорошо LLM умеют химическую интуицию.

ПС
А также подписывайтесь на канал автора статьи Карины Романовой -
https://t.me/nadlskom
Nature
Agent-based multimodal information extraction for nanomaterials
npj Computational Materials - Agent-based multimodal information extraction for nanomaterials
🔥 21
4
😁 1
82 6.1K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram