Google’s new anything-to-anything AI model is wild
https://www.theverge.com/tech/936507/gemini-omni-hands-on-deepfake-ai-video📌 Google 全新任意轉任意 AI 模型
你見過把毛絨小鹿變成在艾菲爾鐵塔前玩漂流的影片嗎?只需上傳一段影片,再加一句提示,Google 的全新 Omni 模型就能生成。但這真的意味著我們離「任何東西變任何東西」更近了嗎?
🤔 生成影片變得前所未有的簡單
The Verge 的親身測試顯示,Omni Flash(Gemini Omni 系列的首個發布版)已經整合進 Google 的 AI 影片生成與編輯平台 Flow。使用者只需提供一段原始影片與文字提示,模型即可在該基礎上創作新片段。評論特別提到,該模型在保持畫面角色一致性方面較之前的 Veo 有所提升,並聲稱能融入更多真實世界的知識來生成內容。
🧪 實際操作:從毛絨鹿到艾菲爾鐵塔
評論者 Allison Johnson 以自己兒子的毛絨鹿為素材,上傳一段簡易影片,加上「在艾菲爾鐵塔前玩漂流」的文字提示。結果是一段看起來相當逼真的影片——鹿兒真的漂流在塞納河畔,背景有鐵塔剪影。她同時也用同樣方式深偽了自己在同一景點出現的畫面。整個過程被描述為「出乎意外地簡單」,幾乎不需要專業知識。
💡 易用性背後的創作與風險雙刃劍
文章指出,這種低門檻的影片生成能力讓有趣的創作變得觸手可及,同時也讓逼真的深偽內容製造變得更容易。評論者因此反思:無害的玩樂與低品質、濫用的「斑點」(slop)之間的界限可能正在變得模糊。雖然工具驚人地好用,但作者強調這仍遠未達到所謂的「奇點」,模型仍有明顯的使用邊界。
⚠️ 目前僅限影片生成,尚未實現真正的「任意轉任意」
根據報導,Omni 目前的能力主要聚焦於影片輸入與輸出;雖然未來願景是支援圖片、文字等多種模態的相互轉換,但此次發布僅提供影片生成功能。此外,模型僅在 Google Flow 平台上可用,尚未開放為獨立 API 或開源版本,長期效果與更廣泛的應用場景仍需後續觀察。
🎯 對創作者與使用者的啟示
- 快速生成高品質影片的門檻大幅降低,適合快速原型或趣味實驗。
- 同時也提醒創作者與平台必須加強對深偽內容的辨識與標記機制,以防濫用。
- 若想利用此類工具進行學習或專業製作,建議先明確使用目的,並在生成過程中保持對內容真實性的批判性審視。
🔗 參考資訊
📝 Google’s new anything-to-anything AI model is wild
👤 Allison Johnson, The Verge AI
🔗 https://www.theverge.com/tech/936507/gemini-omni-hands-on-deepfake-ai-video
你有試過用類似工具製作有趣影片嗎?歡迎在留言區分享你的創作或對深偽技術的看法 👇
#Google #Gemini #Omni #AI影片生成 #深偽 #創作工具 #TheVerge #技術趨勢
由 tencent/hy3-preview:free 自動生成