-
Apple 怎麼讓企業搜尋同時找到文字、圖片和影片——AMES 的 late interaction 架構
Apple 用 late interaction 做多模態企業搜尋
-
LLM 說「Wait」的時候到底在幹嘛——用資訊理論拆解 Aha moment
Aha moment 不是頓悟,是不確定性外顯化
-
用 LLM 組一支交易團隊——TradingAgents 把華爾街的分工搬進你的 terminal
多 Agent 金融交易框架,模擬真實交易室分工
-
LeCun 最新論文:為什麼你的 AI 部署之後就不再學習了
AI 部署後就停止學習,認知科學告訴我們怎麼修
-
手術室裡的 AI 終於有數據可以練了——NVIDIA 聯合 35 機構開源 778 小時醫療機器人數據集
778 小時醫療機器人數據集 + 手術 VLA 模型
-
你的 RAG Agent 一直在重複查同樣的東西——Adobe 這篇論文用 test-time trick 就修好了
不用重訓,推論時加兩個模組就提升 RAG
-
ByteDance 開源了一個「檔案系統式」的 Agent 記憶體——OpenViking 到底在做什麼
把 Agent 的記憶從向量堆變成檔案系統
-
Agent 不會自己探索怎麼辦?SynPlanResearch-R1 用合成計劃幫它開路
用合成計劃教 Agent 深度探索
-
760 個金融工具的 Agent 大考:FinToolBench 告訴我們真實世界有多難
760 個金融工具的 Agent 實戰評測
-
一個模型搞定所有 K:OMEGA 讓向量搜尋不再糾結
一個模型搞定所有 K 的向量搜尋
-
LongNAP:從你的螢幕操作歷史,預測你下一步要做什麼
從人機互動歷史預測你的下一步
-
推理模型控制不了自己的思考鏈,這對 AI 安全是好消息
推理模型無法控制自己的思考鏈
-
Self-Flow:不靠外部模型,讓生成模型自己學會語義理解
不靠外部模型的多模態生成新範式
-
MLLM 時代,OCR 真的還有必要嗎?
MLLM 時代 OCR 可能不再必要
-
用多 Agent 框架做晶片驗證,準確度提升 70%
多 Agent 框架做晶片驗證準度提升 70%
-
ClinConsensus:用 2500 個臨床案例測出 LLM 的醫療真實力
中文醫療 LLM 的臨床級評估框架
-
ColParse:文件檢索儲存量砍 95%,效果還更好
文件檢索儲存量砍 95% 還更準
-
FT-Dojo: Towards Autonomous LLM Fine-Tuning with Language Agents
這是首個針對 LLM 微調的端到端代理系統,解決了業界長期存在的痛點,具有極高的技術價值和話題性。
-
CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework
CARE 框架結合 Agentic 架構與醫療領域的實證推理,既具備前沿性又具備實際應用價值,是理想的部落格主題。
-
AWS 開源 Agentic 文件處理框架:IDP Accelerator 拆解
AWS 開源 Agentic 文件智能框架
沒有符合條件的文章。