熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
MiroThinker 1.5 是一個開源的、最先進的深度研究模型。
它不是生成合理的答案,而是運行「推理-驗證-修訂」循環。搜索來源,交叉引用數據,引用所有內容。30B 參數與 30 倍更大的模型相匹配,成本卻低 20 倍。
我用 2 個用例測試了這個模型。以下是它的表現。
1/7

2/7
我用 2026 年世界杯的預測進行了測試:
我使用的提示:"哪個國家最有可能贏得 2026 年 FIFA 世界盃?分析當前的 FIFA 排名、球隊深度、歷史賽事表現、資格賽結果。提供概率估算及來源。"
3/7
我用 RAM 價格預測進行了測試:"目前 RAM 價格極高 - 2025-2026 年的前景如何?"
我使用的提示:
"目前 RAM 價格處於高峰水平。2026 年的價格預測是什麼?分析供應鏈因素、製造能力、需求趨勢。"
4/7
這與普通的 LLM 有何不同:
展示其工作過程 - 每次搜索、每個檢查的來源。你可以看到完整的研究過程,而不僅僅是結果。
引用所有內容 - 每個主張都鏈接到特定的來源。
量化不確定性 - 提供概率範圍和信心水平。當不確定時不會假裝確定。
解釋矛盾 - 當來源意見不一致時,會顯示雙方並解釋衝突。
動態更新 - 有新數據可用?它會修正分析並告訴你變更了什麼。
普通的 LLM 自信地產生幻覺。這個則進行實際的研究。
5/7
這對開發者和研究人員的重要性:
30B 參數匹配 1T 模型 - 更小、更快、更便宜。成本比 GPT-4 類模型低 20 倍。
開源 - 完整模型在 Hugging Face 上。框架在 GitHub 上。您可以自我託管。
真正的代理推理 - 像實際分析師一樣進行「研究 → 驗證 → 修訂」循環,而不僅僅是自動完成。
多工具協調 - 搜索網頁、閱讀文檔、交叉引用來源,所有操作在一個查詢中完成。
這就是生產級 AI 研究工具應該具備的樣子。
6/7
您可以在這裡閱讀完整的分析。
2026 年國際足總世界杯預測 -
2025-2026 年 RAM 價格展望 -
查看 MiroThinker 如何研究、引用來源並為每個項目建立概率估計。
346
熱門
排行
收藏
