Группа исследователей из Edison Scientific (дочка Future House) представила Kosmos — агента для автономного научного анализа.
Что умеет Kosmos?
— Пишет и выполняет код для анализа данных (~42,000 строк)
— Читает научные статьи по теме (~1,500 штук)
— Генерирует и проверяет гипотезы
— Формирует отчёт с выводами
— Можно проверить каждый шаг рассуждений.
Авторы провели Kosmos через 7 исследовательских задач в разных областях: от метаболомики мозга до генетики диабета.
Независимые эксперты оценили точность результатов:
1. Воспроизводил чужие результаты
2. Нашёл новые находки:
• В 4 случаях — доп поддержка известных гипотез новыми методами
• В 1 случае — потенциально новое открытие, нашел механизм уязвимости нейронов при старении.
Эксперты оценили, что один запуск Kosmos эквивалентен 6 месяцам работы специалиста. Это впечатляет, но важно понимать, о какой работе речь:
1. Рутинный анализ данных
2. Чтение сотен статей
3. Перебор стандартных статистических методов
4. Проверка очевидных гипотез
Что остаётся за человеком:
— Формулирование нетривиальных вопросов
— Планирование экспериментов
— Критическая оценка выводов
— Понимание биологического/физического смысла
Где система спотыкается?
1. Интерпретации слабее анализа.
2. Нужен эксперт для оценки.
3. Ограничения по данным.


