MiroThinker 1.5 — це відкрита модель SoTA Deep Research. Замість того, щоб генерувати правдоподібні відповіді, він запускає цикли «reason-verify-review». Шукає джерела, звіряє дані, цитує все. 30B параметри, що відповідають моделям у 30 разів більше і в 20 разів нижчою вартістю. Я тестував це з двома випадками використання. Ось як він себе показав. 1/7
2/7 Я тестував це з прогнозами на FIFA 2026 WC: Запит, який я використав: «Яка країна найімовірніше виграє чемпіонат світу з футболу 2026 року? Проаналізуйте поточні рейтинги FIFA, глибину складу, історичні виступи на турнірах, результати кваліфікації. Надайте ймовірнісні оцінки з джерелами.»
3/7 Я тестував це за прогнозами ціни оперативної пам'яті: «Ціни на оперативну пам'ять зараз надзвичайно високі — які перспективи на 2025-2026 роки?» Запит, який я використав: "Ціни на оперативну пам'ять наразі на пікових рівнях. Які прогнози щодо цін на 2026 рік? Аналізуйте фактори ланцюга постачання, виробничі потужності, тенденції попиту.»
4/7 Чим це відрізняється від звичайних LLM: Показує свою роботу — кожен пошук, кожне джерело, яке перевіряє. Ви бачите весь процес дослідження, а не лише результати. Цитує все — кожне твердження посилається на конкретне джерело. Кількісно визначає невизначеність — надає ймовірнісні діапазони та рівні довіри. Не вдає, що впевнений, коли це не так. Пояснює суперечності — коли джерела не погоджуються, це показує обидві сторони і пояснює конфлікт. Оновлення динамічно — нові дані доступні? Він переглядає аналіз і повідомляє, що змінилося. Звичайні LLM впевнено галюцинують. Цей займається справжніми дослідженнями.
5/7 Чому це важливо для розробників і дослідників: Параметри 30B, що відповідають моделям 1T — менші, швидші, дешевші. У 20 разів дешевше, ніж моделі класу GPT-4. Відкритий код — повна модель на Hugging Face. Фреймворк на GitHub. Ви можете приймати гостей самостійно. Справжнє агентне мислення — чи є цикли «дослідження → перевірка → перегляд» як справжній аналітик, а не просто автозаповнення? Багатоінструментальна оркестрація — Пошук у вебі, читання документів, перехресні посилання на джерела, все в одному запиті. Ось як мають виглядати інструменти дослідження ШІ виробничого рівня.
6/7 Повний аналіз можна прочитати тут. Прогноз на чемпіонат світу з футболу 2026 року - Прогноз цін на оперативну пам'ять на 2025-2026 роки - Перевірте, як MiroThinker досліджував, цитував джерела та створював ймовірнісні оцінки для кожного з них.
221