Daily AI Blog

★ 人工策展 · 完整長文

20 篇精選文章

2026/03/17

Apple 怎麼讓企業搜尋同時找到文字、圖片和影片——AMES 的 late interaction 架構

Apple 用 late interaction 做多模態企業搜尋

SearchMultimodalLate-InteractionAppleEnterprise
2026/03/17

LLM 說「Wait」的時候到底在幹嘛——用資訊理論拆解 Aha moment

Aha moment 不是頓悟，是不確定性外顯化

ReasoningInformation-TheoryChain-of-ThoughtAha-Moment
2026/03/17

用 LLM 組一支交易團隊——TradingAgents 把華爾街的分工搬進你的 terminal

多 Agent 金融交易框架，模擬真實交易室分工

AgentTradingLLMMulti-AgentFinance
2026/03/17

LeCun 最新論文：為什麼你的 AI 部署之後就不再學習了

AI 部署後就停止學習，認知科學告訴我們怎麼修

Autonomous-LearningCognitive-ScienceLeCunMETA-FAIR
2026/03/17

手術室裡的 AI 終於有數據可以練了——NVIDIA 聯合 35 機構開源 778 小時醫療機器人數據集

778 小時醫療機器人數據集 + 手術 VLA 模型

RoboticsHealthcarePhysical-AINVIDIADataset
2026/03/16

你的 RAG Agent 一直在重複查同樣的東西——Adobe 這篇論文用 test-time trick 就修好了

不用重訓，推論時加兩個模組就提升 RAG

RAGAgentTest-TimeSearch-R1
2026/03/16

ByteDance 開源了一個「檔案系統式」的 Agent 記憶體——OpenViking 到底在做什麼

把 Agent 的記憶從向量堆變成檔案系統

AgentMemoryRAGByteDanceOpen Source
2026/03/10

Agent 不會自己探索怎麼辦？SynPlanResearch-R1 用合成計劃幫它開路

用合成計劃教 Agent 深度探索

Deep ResearchAgentReinforcement Learning
2026/03/10

760 個金融工具的 Agent 大考：FinToolBench 告訴我們真實世界有多難

760 個金融工具的 Agent 實戰評測

FinTechAgentBenchmark
2026/03/09

一個模型搞定所有 K：OMEGA 讓向量搜尋不再糾結

一個模型搞定所有 K 的向量搜尋

Vector SearchEfficiencyRAG Infrastructure
2026/03/09

LongNAP：從你的螢幕操作歷史，預測你下一步要做什麼

從人機互動歷史預測你的下一步

AgentHuman-AIProactive AI
2026/03/09

推理模型控制不了自己的思考鏈，這對 AI 安全是好消息

推理模型無法控制自己的思考鏈

AI SafetyReasoningChain-of-Thought
2026/03/09

Self-Flow：不靠外部模型，讓生成模型自己學會語義理解

不靠外部模型的多模態生成新範式

DiffusionMulti-ModalSelf-Supervised
2026/03/04

MLLM 時代，OCR 真的還有必要嗎？

MLLM 時代 OCR 可能不再必要

Document AIOCRMLLM
2026/03/04

用多 Agent 框架做晶片驗證，準確度提升 70%

多 Agent 框架做晶片驗證準度提升 70%

AgentFormal VerificationRAG
2026/03/03

ClinConsensus：用 2500 個臨床案例測出 LLM 的醫療真實力

中文醫療 LLM 的臨床級評估框架

Medical AIBenchmarkLLM Evaluation
2026/03/03

ColParse：文件檢索儲存量砍 95%，效果還更好

文件檢索儲存量砍 95% 還更準

RAGDocument RetrievalVision
2026/03/03

FT-Dojo: Towards Autonomous LLM Fine-Tuning with Language Agents

這是首個針對 LLM 微調的端到端代理系統，解決了業界長期存在的痛點，具有極高的技術價值和話題性。

cs.AIcs.LG
2026/03/03

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

CARE 框架結合 Agentic 架構與醫療領域的實證推理，既具備前沿性又具備實際應用價值，是理想的部落格主題。

cs.AIcs.LG
2026/03/02

AWS 開源 Agentic 文件處理框架：IDP Accelerator 拆解

AWS 開源 Agentic 文件智能框架

AgentDocument AIMCP

Apple 怎麼讓企業搜尋同時找到文字、圖片和影片——AMES 的 late interaction 架構

LLM 說「Wait」的時候到底在幹嘛——用資訊理論拆解 Aha moment

用 LLM 組一支交易團隊——TradingAgents 把華爾街的分工搬進你的 terminal

LeCun 最新論文：為什麼你的 AI 部署之後就不再學習了

手術室裡的 AI 終於有數據可以練了——NVIDIA 聯合 35 機構開源 778 小時醫療機器人數據集

你的 RAG Agent 一直在重複查同樣的東西——Adobe 這篇論文用 test-time trick 就修好了

ByteDance 開源了一個「檔案系統式」的 Agent 記憶體——OpenViking 到底在做什麼

Agent 不會自己探索怎麼辦？SynPlanResearch-R1 用合成計劃幫它開路

760 個金融工具的 Agent 大考：FinToolBench 告訴我們真實世界有多難

一個模型搞定所有 K：OMEGA 讓向量搜尋不再糾結

LongNAP：從你的螢幕操作歷史，預測你下一步要做什麼

推理模型控制不了自己的思考鏈，這對 AI 安全是好消息

Self-Flow：不靠外部模型，讓生成模型自己學會語義理解

MLLM 時代，OCR 真的還有必要嗎？

用多 Agent 框架做晶片驗證，準確度提升 70%

ClinConsensus：用 2500 個臨床案例測出 LLM 的醫療真實力

ColParse：文件檢索儲存量砍 95%，效果還更好

FT-Dojo: Towards Autonomous LLM Fine-Tuning with Language Agents

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

AWS 開源 Agentic 文件處理框架：IDP Accelerator 拆解